1.- requisitos estadísticos antes de exponer el mecanismo precise para la construcción de los...

11
Regresión con dos variables: estimación por intervalos y pruebas de hipótesis. Cuidado con comprobar demasiadas hipótesis: cuanto más se torturen los datos, más probable será que confiesen, pero la confesión obtenida bajo presión puede no ser admisible en el tribunal de la opinión científica. la estimación y las pruebas de hipótesis constituyen las dos ramas principales de la estadística clásica. La teoría de la estimación consta de dos partes estimación puntual y estimación por intervalos. En los dos capítulos anteriores estudiamos a fondo la estimación puntual, en donde se introdujeron los métodos MCO y MV de la estimación puntual.

Upload: jaime-moros

Post on 28-Jan-2016

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Regresión con dos variables: estimación por intervalos y pruebas de hipótesis.

Cuidado con comprobar demasiadas hipótesis: cuanto más se torturen los datos, más probable será que confiesen, pero la confesión obtenida bajo presión puede no ser admisible en el tribunal de la opinión científica.la estimación y las pruebas de hipótesis constituyen las dos ramas principales de la estadística clásica. La teoría de la estimación consta de dos partes estimación puntual y estimación por intervalos. En los dos capítulos anteriores estudiamos a fondo la estimación puntual, en donde se introdujeron los métodos MCO y MV de la estimación puntual.

Page 2: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

1.- Requisitos estadísticosAntes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas, se supone está familiarizado con los conceptos fundamentales de probabilidad y estadística.

2.- Estimación por intervalos: algunas ideas básicasPara poner en orden las ideas, consideraremos el ejemplo de los salarios y el nivel de escolaridad del muestra que el incremento promedio estimado del salario medio por hora relacionado con un año de aumento en la escolaridad (β2) es de 0.7240, que constituye una cifra estimada (puntual) del valor poblacional desconocido β2. ¿Qué tan confiable es esta estimación?

Page 3: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

debido a las fluctuaciones muéstrales, es probable que una sola estimación difiera del valor verdadero, aunque en un muestreo repetido se espera que el promedio de los valores sea igual al valor verdadero. [Nota: E(β2) = β2.] Ahora, en estadística, la confiabilidad de un estimador puntual se mide por su error estándar. Por tanto, en lugar de depender de un solo estimador puntual, se puede construir un intervalo alrededor del estimador puntual, por ejemplo, dentro de dos o tres errores estándar a cada lado del estimador puntual, tal que este intervalo tenga, por ejemplo, 95% de probabilidad de incluir al verdadero valor del parámetro. Esta es, a grandes rasgos, la idea básica de la estimación por intervalos.

Para ser más específico, supongamos que se desea encontrar que tan “cerca” esta, por ejemplo, β2 de β2. Con este fin, se trata de encontrar dos números positivos, δ y α, este último situado entre 0 y 1, de modo que la probabilidad de que el intervalo aleatorio (β2 – δ, β2 + α) contenga al verdadero β2 sea 1 – α. Simbólicamente.Pr(β2 – δ ≤ β2 ≤ β2 + δ) = 1 – α (1)

Page 4: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Tal intervalo, si existe, se conoce como intervalo de confianza; a 1 – α se le denomina coeficiente de confianza; y α(0 < α < 1) se conoce como nivel de significancia. Los extremos de intervalo de confianza se conocen como límites de confianza (también denominados valores críticos), con β2 – δ como límite de confianza inferior y β2 + δ como límite de confianza superior. Observe que, en la práctica, α y 1 suelen expresarse en forma porcentual como 100 y 100(1 – α) %.

La ecuación (1) muestra que un estimador de intervalo, en constante con una estimación puntual, es un intervalo construido de manera que tenga una probabilidad especifica 1 – α debe contener en sus límites al valor verdadero del parámetro. Por ejemplo, si α = 0.05, o 5%, (1) debe leerse: la probabilidad de que el intervalo (aleatorio) que allí aparece incluya al verdadero β2 es de 0.95, o 95%. El estimador por intervalo proporciona así una gama de valores dentro de los cuales puede encontrarse el verdadero β2.

Es muy importante conocer los siguientes aspectos de la estimación por intervalos:1.- La ecuación (1) no afirma que la probabilidad de que β2 se encuentre entre los límites dados sea 1 – α. Como se supone que β2, aunque se desconoce, es un número fijo, se dice que está o no está dentro del intervalo. La ecuación (1) establece que, al utilizar el método descrito en este capítulo, la probabilidad de construir un intervalo que contenga β2 es 1 – α.

Page 5: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

2.- El intervalo (1) es un intervalo aleatorio; es decir, variará de una muestra a la siguiente debido a que se basa en β2, el cual es aleatorio. (¿Por qué?).3.- Como el intervalo de confianza es aleatorio, los enunciados probabilísticos que le corresponden deben entenderse en un sentido de largo plazo, es decir, para muestreo repetido. más específicamente, (1) significa: si se construyen muchos intervalos de confianza como el anterior con base probabilística de 1 – α, a la larga, en promedio, tales intervalos contendrán, en 1 – α de los casos, el valor verdadero del parámetro.

Como mencionamos en 2, el intervalo (1) es aleatorio siempre y cuando β2 sea desconocido. Sin embargo, una vez que se tenga una muestra específica y se obtenga un valor numérico especifico de β2, el intervalo (1) deja de ser aleatorio, y queda entonces fijo. En este caso, no se puede hacer la afirmación probabilística (1); es decir, no se puede afirmar que la probabilidad de que un intervalo fijo dado incluya al verdadero β2 sea 1 – α. En esta situación, β2 está en el intervalo fijo o fuera de él. Por consiguiente, la probabilidad será 1 o 0.

Page 6: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Por tanto, en el ejemplo de salarios y nivel de escolaridad, si el intervalo de confianza a 95% se obtuviera como (0.5700 ≤ β2 ≤ 8.8780), como demostraremos en breve en la ecuación (9), no se puede afirmar que la probabilidad de que este intervalo incluya al verdadero β2 sea de 95%. Esta probabilidad es 1 o 0. ¿Cómo se construyen los intervalos de confianza? De la exposición anterior se espera que si se conocen las distribuciones muéstrales o de probabilidad de los estimadores, se puedan hacer afirmaciones sobre intervalos de confianza como (1). En el capítulo anterior vimos que, con el supuesto de normalidad de las perturbaciones ui, los estimadores de MCO β1 y β2 están también normalmente distribuidos, y que el estimador de MCO, σ2, se relaciona con la distribución x2 (ji cuadrada). Entonces, parece que la labor de construir intervalos de confianza es muy sencilla.

Page 7: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

3.- Intervalos de confianza para los coeficientes de regresión β1 y β2

Intervalo de confianza para β2

En el capítulo anterior, demostramos que con el supuesto de normalidad de ui, los estimadores de MCO β1 y β2 son en sí mismos normalmente distribuidas con medias y varianzas allí establecidas. Por consiguiente, por ejemplo, la variable

(3.1)

Page 8: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Como se anotó antes es una variable normal estandarizada. Por tanto, parece que se puede utilizar la distribución normal para hacer afirmaciones probabilísticas sobre β2, siempre que se conozca la verdadera varianza poblacional σ2. Si se conoce σ2, una propiedad importante de una variable normalmente distribuida con media u y varianza σ2 es que el área bajo la curva normal entre u σ es cercana a 68%, que entre u 2σ es alrededor de 95%, y que entre los límites u 3σ el área es cercana a 99.7%.Pero pocas veces se conoce σ2 y, en la práctica, está determinada por el estimador insesgado σ2. Si se reemplaza σ por σ, (3.1) puede escribir así.

(3.2)

Page 9: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Donde ee(β2) se refiere ahora al error estándar estimado. Se demuestra que la variable t, así definida, sigue la distribución t con n – 2 gl. [Note la diferencia entre (3.1) y (3.2).] Por consiguiente, en lugar de utilizar la distribución normal, se puede utilizar la distribución t para construir un intervalo de confianza para β2 de la siguiente forma:Pr(-tα / 2 ≤ t ≤ -tα / 2) = 1 – α (3.3)

Donde el valor t en el centro de esta doble desigualdad es el valor t dado por (3.2), y donde tα / 2 es el valor de la variable t obtenida de la distribución t para un nivel de significancia de α/2 y n – 2 gl; a menudo se denomina el valor crítico t a un nivel de significancia α/2. Al sustituir (3.2) en (3.3) se obtiene: (3.4)

Page 10: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

Reorganizamos (3.4) y obtenemos Pr[] = (3.5)La ecuación (5.3.5) proporciona un intervalo de confianza para β2 de 100 () %, que se escribe en forma más compacta comoIntervalo de confianza para β2 a 100() %: β2 tα / 2 (3.6)Mediante argumentación análoga y con (3.1) y (3.2), se escribe: Pr[] = (3.7)

Page 11: 1.- Requisitos estadísticos Antes de exponer el mecanismo precise para la construcción de los intervalos de confianza y de la pruebas de hipótesis estadísticas,

O, en forma más compacta,Intervalo de confianza para β1 a 100() %: Β1 tα / 2 (3.8)Observe un rasgo importante de los intervalos de confianza dados en (3.6) y (3.8): en ambos casos la amplitud del intervalo de confianza es proporcional al error estándar del estimador. Es decir, entre más grande sea el error estándar, más amplio será el intervalo de confianza.

Expresado de otra forma, mientras más grande sea el error estándar del estimador, mayor será la incertidumbre de estimar el verdadero valor del parámetro desconocido. Así, el error estándar de un estimador suele describirse como una medida de la precisión del estimador (es decir, con qué precisión mide el estimador al verdadero valor poblacional).Devuelta al ejemplo de regresión del capítulo anterior salario promedio por hora (Y) y el nivel de escolaridad (X), recuerde que en la tabla 3.2 descubrimos que β2 = 0.7240; = 0.0700. Como hay 13 observaciones, los grados de libertad (gl) son 11. Si suponemos que α = 5%, es decir, un coeficiente de confianza a 95%, entonces la tabla t muestra que para 11 gl el valor crítico tα / 2 = 2.201. Al sustituir estos valores en (3.5), el estudiante debe verificar que el intervalo de confianza para β2 a 95% sea el siguiente: