introducción a la econometría - universidad autónoma … · breve resumen del curso la ciencia...
TRANSCRIPT
![Page 1: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/1.jpg)
Introducción a la Econometría
Análisis estadístico de datos económicos
![Page 2: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/2.jpg)
Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con implicaciones de política económica, pero casi nunca sugiere la magnitud cuantitativa del efecto causal.
• ¿Cuál es la elasticidad precio del tabaco? • ¿Qué efecto tiene una reducción del número de
alumnos en clase sobre sus notas?
• ¿Y un año de educación sobre el salario futuro?
• ¿Y un incremento del 1% en el tipo de interés sobre el crecimiento?
![Page 3: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/3.jpg)
Este curso estará enfocado a la utilización de métodos estadísticos y econométricos para cuantificar efectos causales. Idealmente, nos gustaría poder experimentar con:
El precio del tabaco; el tamaño de la clase; el rendimiento de la educación; el Banco Central Europeo Pero casi siempre tendremos que trabajar con datos no experimentales, lo que plantea importantes problemas:
• efectos confusos (variables omitidas)
• causalidad simultánea
• “correlación no implica causalidad”
![Page 4: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/4.jpg)
En este curso:
• Aprenderá distintos métodos de estimación de efectos causales utilizando datos observados;
• Aprenderá otro tipo de herramientas para utilizar, por ejemplo, en la predicción de series temporales;
• Nos centraremos en aplicaciones – la teoría se utilizará cuando sea necesaria para el entendimiento del “por qué” de los métodos;
• Aprenderá a producir (llevar a cabo el análisis) y consumir (evaluar el trabajo de otros) aplicaciones econométricas; y
• Practicará “produciendo” en sus series de problemas.
![Page 5: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/5.jpg)
Revisión de Probabilidad y Estadística (SW Capítulos 2,3)
Problema empírico: Número de alumnos y notas
• Cuestión clave: ¿Cuál es el efecto de reducir el número de alumnos en uno por clase? ¿y en 8?
• ¿Cómo se mide la variable dependiente (“notas”)? § Satisfacción de los padres § Desarrollo personal del estudiante § Bienestar futuro y/o salario § contrastes estándar
¿Qué nos dicen los datos sobre la relación entre el
número de alumnos y el resultado de los exámenes?
![Page 6: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/6.jpg)
Los datos del California Test Score Todos los distritos escolares K-6 (Infantil a 6º curso) y K-8 de California (n = 420) Variables: § Examen de 5º grado (matemáticas y lectura):
media de los distritos § STR = Ratio estudiantes/profesores
![Page 7: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/7.jpg)
Visión inicial de los datos:
![Page 8: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/8.jpg)
¿Mejores notas con menos estudiantes?
![Page 9: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/9.jpg)
¿Cómo obtener evidencia empírica sobre si los distritos con menor STR tienen resultados mejores?
1. Comparar la nota media de los distritos de bajo
STR con la de los de alto STR (“estimación”) 2. Verificar la hipótesis de que la nota media es la
misma en ambos tipos de distrito, contra la alternativa de que es distinta (“ test de hipótesis”)
3. Estimar un intervalo para la diferencia de notas medias (“intervalo de confianza”)
![Page 10: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/10.jpg)
Análisis inicial de los datos: Comparar distritos “pequeños” (STR < 20) y “grandes” (STR � 20):
Tamaño Nota media
(Y )
Desviación
estándar (sY)
n
Pequeño 657.4 19.4 238
Grande 650.0 17.9 182
1. Estimación de ∆ = diferencia entre medias de grupos
2. Contraste de la hipótesis ∆ = 0
3. Construir un intervalo de confianza para ∆
![Page 11: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/11.jpg)
1. Estimación
pequeño grandeY Y− = 657.4 – 650.0 = 7.4
donde pequeño
pequeño1pequeño
1 n
ii
Y Yn =
= ∑ y grande
grande1grande
1 n
ii
Y Yn =
= ∑
¿Es esta diferencia significativa?
• Desviación estándar de las notas = 19.1
• Diferencia entre los percentiles 60 y 75 de las notas es 667.6 – 659.4 = 8.2
• Esta diferencia es lo suficientemente importante como para tenerla en cuenta en las posibles discusiones del comité escolar
![Page 12: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/12.jpg)
2. Verificación de hipótesis Contraste de la diferencia de medias: estadístico t,
2 2
g
( )p g
p
p g p g
s sp g
n n
Y Y Y Yt
SE Y Y
− −= =
−+ (¿lo recuerda?)
donde SE( sY – lY ) es el “error estándar” de pY – gY ; los
subíndices p y g hacen referencia a distritos con STR
“pequeño” y “grande” ; y 2 2
1
1( )
1
sn
p i pip
s Y Yn =
= −− ∑ (etc.)
![Page 13: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/13.jpg)
Cálculo del t de la diferencia de medias:
Tamaño Y sY n
Pequeño 657.4 19.4 238
grande 650.0 17.9 182
2 2 2 219.4 17.9238 182
657.4 650.0 7.41.83p g
p g
p g
s s
n n
Y Yt
− −= = =++
= 4.05
|t| > 1.96, entonces rechazamos al nivel del 5% la hipótesis nula de que las dos medias son iguales.
![Page 14: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/14.jpg)
3. Intervalo de confianza Un intervalo de confianza del 95% para la diferencia de medias es
( pY – gY ) ± 1.96×SE( pY – gY )
= 7.4 ± 1.96×1.83 = (3.8, 11.0)
Dos afirmaciones equivalentes:
1. El intervalo de confianza del 95% para ∆ no incluye al cero;
2. La hipótesis de que ∆ = 0 es rechazada al nivel de significación del 5%
![Page 15: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/15.jpg)
Todo esto debería resultar familiar. Pero: 1. ¿Qué es lo que justifica todos estos resultados?
2. Estimación: ¿Por qué estimar ∆ mediante pY – gY ?
3. Verificación: ¿Cuál es realmente el error estándar de
sY – lY ? ¿Por qué rechazar ∆ = 0 si |t| > 1.96?
4. Intervalos de confianza (estimación de intervalos): ¿Qué es, en realidad, un intervalo de confianza?
![Page 16: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/16.jpg)
1. Estructura probabilística de la inferencia 2. Estimación
3. Verificación
4. Intervalos de confianza
Población • El grupo o colección de entidades de interés
• Aquí, “todos los posibles” distritos escolares
• “Todos los posibles” significa “todas las posibles” circunstancias que nos llevan a unos valores específicos de STR
• Si la población es muy grande, tendremos que hacer inferencia a partir de una muestra de dicha población
![Page 17: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/17.jpg)
Variable Aleatoria Y
• Resumen numérico de un suceso aleatorio • Aquí, el valor numérico de la nota media o del STR
en un determinado año y distrito de la muestra.
Distribución Poblacional de Y • Las probabilidades de que diferentes valores de Y
ocurran en la población, por ejemplo Pr[Y = 650] (cuando Y es discreta)
• ó: Las probabilidades sobre conjuntos de dichos
valores, por ejemplo Pr[Y ≤ 650] (cuando Y es
continua).
![Page 18: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/18.jpg)
“Momentos” de la distribución poblacional media = valor esperado
= E(Y)
= µY = valor medio de múltiples repeticiones de Y
varianza = E(Y – µY)2
= 2Yσ
= media del cuadrado de la dispersión
desviación estándar = varianza = σY
![Page 19: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/19.jpg)
Distribuciones condicionadas
• La distribución de Y, dados los valores de otra variable aleatoria, X
• Ejemplo: distribución de las notas, dado un STR < 20
Momentos de las distribuciones condicionadas • Media condicional = media de la distribución
condicional = E(Y|X = x)
• Varianza condicional = varianza de la distribución condicional
• Ejemplo: E(notas|STR < 20), la nota media en aquellos distritos con menor número de alumnos
![Page 20: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/20.jpg)
Diferencia de las medias de dos distribuciones
condicionadas:
∆ = E(nota|STR < 20) – E(nota|STR � 20) Otros ejemplos de medias condicionadas:
• Salario de la mujer (Y = salario, X = sexo)
• Tasa de mortalidad anual de personas bajo tratamiento (Y = vivo/muerto; X = tratado/no tratado)
La media condicionada es un nuevo término para la idea familiar de la media del grupo
![Page 21: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/21.jpg)
Inferencia sobre medias, medias condicionadas, y
diferencia en medias condicionadas
Queremos conocer ∆ (diferencia de notas ; de sexo, de tratamiento). Por tanto, debemos reunir y usar datos que nos permitan
llevar a cabo inferencias estadísticas sobre ∆.
• Datos experimentales
• Datos observables
![Page 22: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/22.jpg)
Muestreo aleatorio simple
• Elija un individuo (distrito, entidad) aleatoriamente de la población
Aleatoriedad y datos
• Antes de la selección, el valor de Y es aleatorio ya que el individuo seleccionado también lo es
• Tras la selección, el valor de Y es observado, tan sólo un número – no aleatorio
• Los datos serían (Y1, Y2,…, Yn), donde Yi = valor de Y para el i-ésimo individuo muestreado
![Page 23: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/23.jpg)
Implicaciones del muestreo aleatorio simple Puesto que los individuos #1 y #2 se eligen al azar, el valor de Y1 no posee información sobre Y2. Por tanto:
• Y1, Y2 se distribuyen independientemente
• Y1 e Y2, provienen de la misma distribución, es decir, se distribuyen idénticamente
• Luego, una consecuencia del muestreo aleatorio simple es que Y1 e Y2 se distribuyen idéntica e independientemente (i.i.d.).
• De forma más general, con muestreo aleatorio simple, {Yi}, i = 1,…, n, son i.i.d
![Page 24: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/24.jpg)
1. Estructura probabilística de la inferencia
2. Estimación 3. Verificación 4. Intervalos de confianza
Y es el estimador natural de la media. Pero:
• ¿Qué propiedades tiene este estimador?
• ¿Por qué utilizamos Y y no otro estimador? § Y1 (la primera observación) § quizás con ponderaciones distintas – no medias
simples § mediana(Y1,…, Yn)
![Page 25: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/25.jpg)
Para contestar estas cuestiones necesitamos caracterizar la distribución muestral de Y
• Los individuos se eligen de forma aleatoria.
• Tal que los valores de (Y1,…, Yn) son aleatorios
• Funciones de (Y1,…, Yn), como Y , son aleatorias: si hubiéramos elegido otra muestra, ésta daría valores distintos
• La distribución de Y sobre posibles muestras distintas de tamaño n es la distribución muestral de Y .
• La media y la varianza de Y son la media y la varianza de su distribución muestral, E(Y ) y var(Y ).
• Para calcular var(Y ), necesitamos la covarianza
![Page 26: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/26.jpg)
La covarianza entre X y Z es,
cov(X,Z) = E[(X – µX)(Z – µZ)] = σXZ
• La covarianza es una medida de asociación lineal entre
X y Z; sus unidades son unidades de X × unidades de Z • cov(X,Z) > (<) 0: relación positiva (negativa) entre X y
Z
• Si X y Z son independientes, entonces cov(X,Z) = 0 (¡pero no viceversa!)
• La covarianza consigo misma es su varianza:
cov(X,X) = E[(X – µX)(X – µX)] = E[(X – µX)2] = 2Xσ
![Page 27: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/27.jpg)
La covarianza entre Notas y STR es negativa:
![Page 28: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/28.jpg)
El coeficiente de correlación viene definido en términos de la covarianza:
corr(X,Z) = cov( , )var( ) var( )
XZ
X Z
X ZX Z
σσ σ
= = rXZ
• –1 � corr(X,Z) � 1
• corr(X,Z) = 1, asociación lineal positiva perfecta
• corr(X,Z) = –1, asociación lineal negativa perfecta
• corr(X,Z) = 0, ningún tipo de asociación lineal • Si E(X|Z) = constante, entonces corr(X,Z) = 0 (no
necesariamente viceversa, sin embargo)
![Page 29: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/29.jpg)
El coeficiente de correlación mide la asociación lineal
![Page 30: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/30.jpg)
El coeficiente de correlación mide la asociación lineal
![Page 31: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/31.jpg)
La media y la varianza de la
distribución muestral de Y
media: E(Y ) = E(1
1 n
ii
Yn =∑ ) =
1
1( )
n
ii
E Yn =∑ =
1
1 n
Yin
µ=∑ = µY
Varianza: var(Y ) = E[Y – E(Y )]2
= E[Y – µY]2
= E2
1
1( )
n
i Yi
Yn
µ=
− ∑
= E2
1 1
1( )( )
n n
i Y j Yi j
Y Yn
µ µ= =
− −
∑∑
![Page 32: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/32.jpg)
var(Y ) = 2
1 1
1( )( )
n n
i Y j Yi j
E Y Yn
µ µ= =
− −∑∑
= 2
1 1
1cov( , )
n n
i ji j
Y Yn = =
∑∑
= 2 2
1 1 1,
1 1var( ) cov( , )
n n n
i i ji i j j i
Y Y Yn n= = = ≠
+∑ ∑ ∑
= 22
1
10
n
Yin
σ=
+∑
= 2Y
nσ
![Page 33: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/33.jpg)
Resumen: E(Y ) = µY y var(Y ) = 2Y
nσ .
Consecuencias:
• Y es un estimador insesgado de µY (esto es, E(Y ) =
µY)
• var(Y ) es inversamente proporcional a n
• la dispersión de la distribución muestral es
proporcional a 1/ n
• en este sentido, la incertidumbre muestral que aparece
al utilizar Y para realizar inferencias sobre µY es
proporcional a 1/ n
![Page 34: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/34.jpg)
¿Qué sucede con la distribución muestral completa de Y , y no sólo con la media y la varianza?
En general, la distribución muestral exacta de Y es muy complicada y depende de la distribución poblacional de Y.
Ejemplo: Supongamos que Y toma los valores 0 ó 1 (una variable aleatoria de Bernoulli) con la distribución de probabilidad,
Pr[Y = 0] = .22, Pr(Y =1) = .78
Entonces, E(Y) = .78 y 2Yσ = (1–.78) ×.78 = 0.1716
![Page 35: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/35.jpg)
![Page 36: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/36.jpg)
Para pequeños tamaños de la muestra, la distribución de Y es complicada. PERO: ¡cuando n es elevado, no lo es! A medida que n aumenta, la distribución de Y se centra
progresivamente alrededor de µY: la incertidumbre muestral decrece conforme n aumenta (recuérdese que
var(Y ) = 2Yσ /n)
Un estimador es consistente si la probabilidad de que caiga dentro de un intervalo alrededor del valor poblacional verdadero tiende a 1 conforme aumenta el tamaño muestral
![Page 37: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/37.jpg)
La Ley de los Grandes Números:
Si (Y1,…,Yn) son i.i.d. y 2Yσ < ∞, entonces Y es un
estimador consistente de µY, esto es,
Pr[|Y – µY| < ε] → 1 según n → ∞
lo que puede escribirse como Y p
→ µY (“Y converge en
probabilidad a µY”)
(Demostración: según n → ∞, var(Y ) = 2Y
nσ → 0, lo que
implica que Pr[|Y – µY| < ε] → 1.)
![Page 38: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/38.jpg)
Teorema Central del Límite (TCL): Si (Y1,…,Yn) son i.i.d. y 0
< 2Yσ < ∞, entonces cuando n es elevado la distribución de Y
está bien aproximada por una distribución normal:
• Y se distribuye aproximadamente N(µY, 2Y
nσ )
(“distribución normal con media µY y varianza 2Yσ /n”)
• n (Y – µY)/σY se distribuye aproximadamente N(0,1) (normal estándar)
• Es decir, “Y estandarizada” = ( )
var( )
Y E Y
Y
− = /
Y
Y
Yn
µσ
− se
distribuye aproximadamente como una N(0,1)
• La aproximación mejora conforme n aumenta
![Page 39: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/39.jpg)
Ejemplo: Y sigue una distribución de Bernoulli, p = 0.78:
![Page 40: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/40.jpg)
Mismo ejemplo: distribución de ( )
var( )
Y E Y
Y
− :
![Page 41: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/41.jpg)
Resumen: para (Y1,…,Yn) i.i.d. con 0 < 2Yσ < ∞,
• La distribución muestral exacta (muestra finita) de Y
tiene media µY (“Y es un estimador insesgado de µY”)
y varianza 2Yσ /n
• Aparte de su media y de su varianza, la distribución exacta de Y es complicada y depende de la distribución de Y
• Y p
→ µY (Ley de los grandes números)
• ( )
var( )
Y E Y
Y
− se distribuye aproximadamente N(0,1)
(TCL)
![Page 42: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/42.jpg)
Entonces, ¿Por qué utilizar Y para estimar µY?
• insesgadez: E(Y ) = µY
• consistencia: Y p
→ µY
• Y es el estimador de “mínimos cuadrados” de µY;
Y resuelve: 2
1
min ( )n
m ii
Y m=
−∑ (véase Ap. 3.2)
• Y tiene la menor varianza de todos los estimadores
lineales: considérese el estimador, 1
1ˆn
Y i ii
a Yn
µ=
= ∑ ,
donde {ai} es tal que ˆYµ es insesgado; entonces
var(Y ) ≤ var( ˆYµ ).
![Page 43: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/43.jpg)
Estructura probabilística de la inferencia 1. Estimación 2. Contrastación de hipótesis 3. Intervalos de confianza
El problema de la contrastación de hipótesis (para la media): adoptar una decisión provisional, basada en la evidencia disponible, sobre si una hipótesis nula es verdadera, o, en su lugar, sobre si alguna hipótesis alternativa es verdadera. Es decir, contrastar
H0: E(Y) = µY,0 vs. H1: E(Y) > µY,0 (unilateral, >)
H0: E(Y) = µY,0 vs. H1: E(Y) < µY,0 (unilateral, <)
H0: E(Y) = µY,0 vs. H1: E(Y) ≠µY,0 (bilateral)
![Page 44: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/44.jpg)
p-valor = probabilidad de obtener un valor (de Y ) al menos tan adverso para la nula como el realmente calculado a partir de nuestros datos, suponiendo que la hipótesis nula es verdadera. El nivel de significación de un contraste es una probabilidad preestablecida de rechazar incorrectamente la hipótesis nula, cuando ésta es verdadera. Cálculo del p-valor basado en Y :
p-valor = 0 ,0 ,0Pr [| | | |]obs
H Y YY Yµ µ− > − ,
donde obsY es el valor de Y realmente observado (no aleatorio)
![Page 45: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/45.jpg)
p-valor = 0 ,0 ,0Pr [| | | |]obs
H Y YY Yµ µ− > − ,
Para calcula el p-valor, es necesario conocer la distribución de Y . Si n es elevado, podemos utilizar la aproximación normal para n elevado:
p-valor = 0 ,0 ,0Pr [| | | |]obs
H Y YY Yµ µ− > − ,
= 0
,0 ,0Pr [| | | |]/ /
obsY Y
HY Y
Y Y
n n
µ µ
σ σ
− −>
≅ suma de las probabilidades bajo las colas
derecha e izquierda de la N(0,1)
![Page 46: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/46.jpg)
![Page 47: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/47.jpg)
En la práctica, σY es desconocida, por lo que debe estimarse
Estimador de la varianza de Y: 2Ys = 2
1
1( )
1
n
ii
Y Yn =
−− ∑
Resultado:
Si (Y1,…,Yn) son i.i.d. y E(Y4) < ∞, entonces 2Ys
p
→ 2Yσ
§ ¿Por qué se aplica la ley de los grandes números?
Porque 2Ys es una media muestral; véase el Apéndice 3.3
§ Nota: suponemos que E(Y4) < ∞ porque aquí la media
no es la de Yi, sino la de su cuadrado; véase Ap. 3.3
![Page 48: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/48.jpg)
§ Cálculo del p-valor con 2Yσ estimado:
p-valor = 0 ,0 ,0Pr [| | | |]obs
H Y YY Yµ µ− > − ,
= 0
,0 ,0Pr [| | | |]/ /
obsY Y
HY Y
Y Y
n n
µ µ
σ σ
− −>
≅ 0
,0 ,0Pr [| | | |]/ /
obsY Y
HY Y
Y Y
s n s n
µ µ− −> (n elevado)
= 0
Pr [| | | |]obsH t t>
≅ probabilidad bajo las colas de la normal
donde t = ,0
/Y
Y
Y
s n
µ− (el estadístico t habitual)
![Page 49: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/49.jpg)
El p-valor y el nivel de significación Con un nivel de significación preestablecido (e.g. 5%):
• Rechazamos si |t| ≥ 1.96
• De forma equivalente: rechazamos si p ≤ 0.05.
• Al p-valor se le denomina en ocasiones nivel marginal de significación.
![Page 50: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/50.jpg)
La distribución t de Student
Si Y se distribuye N(µY,2Yσ ), el estadístico t sigue una
distribución t de Student (tabulada al final de todos los libros de estadística)
Algunos comentarios:
• Para n > 30, la distribución t y la N(0,1) están muy próximas
• El supuesto de que Y se distribuye N(µY,2Yσ ) es poco
admisible en la práctica (¿la renta? ¿el número de hijos?)
• La distribución t se comenzó a utilizar históricamente cuando los tamaños muestrales resultaban muy reducidos
• En este curso, no utilizaremos la distribución t, sino la aproximación para n elevado dada por el TCL
![Page 51: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/51.jpg)
Estructura probabilística de la inferencia 1. Estimación
2. Contrastación 3. Intervalos de confianza
Un intervalo de confianza del 95% para µY es un
intervalo que contiene el valor verdadero de µY en un 95% de muestras repetidas. (¿Qué es lo aleatorio aquí? El intervalo de confianza que diferirá de una muestra a otra; el parámetro poblacional,
µY, no es aleatorio, puesto que es desconocido)
![Page 52: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/52.jpg)
Un intervalo de confianza del 95% puede construirse siempre
como el conjunto de valores de µY no rechazados por un contraste de hipótesis con un nivel de significación del 5%.
{µY: /
Y
Y
Ys n
µ− ≤ 1.96} = {µY: –1.96 ≤ /
Y
Y
Ys n
µ− ≤ 1.96}
= {µY: –1.96 Ysn
≤ Y – µY ≤ 1.96 Ysn
}
= {µY ∈ (Y – 1.96 Ysn
, Y + 1.96 Ysn
)}
Este intervalo de confianza se basa en los dos siguientes resultados para n elevado: Y se distribuye aproximadamente
normal, y 2Ys
p
→ 2Yσ
![Page 53: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/53.jpg)
Resumen: A partir de los supuestos de:
(1) Muestreo aleatorio simple de una población, esto es, {Yi, i =1,…,n} son i.i.d.
(2) 0 < E(Y4) < ∞
desarrollamos, para grandes muestras (n elevado):
• Una teoría de la estimación (distribución muestral de Y )
• Una teoría de la contrastación de hipótesis (distribución para n elevado del estadístico t y cálculo del p-valor)
• Una teoría de los intervalos de confianza (construida invirtiendo el contraste estadístico)
¿Los supuestos (1) y (2) son admisibles en la práctica? Sí.
![Page 54: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con](https://reader031.vdocumento.com/reader031/viewer/2022021712/5b79ff9c7f8b9ad77e8ea57a/html5/thumbnails/54.jpg)
Pregunta inicial de política educativa:
¿Qué efecto tiene sobre las notas la reducción en la ratio estudiantes por profesor de un estudiante por clase?
¿Hemos respondido a esta pregunta?
• Examinamos ∆ = la diferencia de medias, clases pequeñas vs. grandes
• Pero ∆ no responde realmente a la pregunta mencionada.
• En su lugar, el objetivo de interés es NotaSTR
∆∆
• Pero esta es la pendiente de la recta que relaciona la nota y la ratio estudiantes por profesor
• Por lo cual, necesitamos estimar esta pendiente…