vxvx

8
Clase 3 12.08.2015 Preguntas que me debí haber hecho al leer el texto de Salter “Capítulo VIII: An inter-industri survey” 1) ¿Qué es cada una de las 12 variables medidas en el cuadro 14? 2) ¿En qué unidades se mide cada variable? 3) ¿Cómo se construyó (i. e. qué operaciones aritméticas se hicieron= cada una de las 12 variables? 4) ¿Qué es la mediana? ¿De qué magnitud es la mediana de cada una de las 12 variables? 5) ¿Qué son “upperquartile” y “lowe quartile”? ¿De que magnitud son? 6) ¿Qué relaciones contables existen entre subconjuntos de variables que aparecen en el cuadro 14? 7) ¿Qué grupos forman las variables que aparecen en el cuadro 14? Ayudantía 1 14.08.2015 ¿Qué son los outliders? - Son datos atípicos de la muestra. - Entregan información relevante - Permiten testear y poner a prueba la teoría - Excepción confirma la regla. CASO CÓLERA: Dr. Snow Ver que es lo que pasa con los outliders de Snow. ¿Cuáles son las dos tesis que propone Snow? 1. Contagio provenía de los pozos de agua. 2. Contagio provenía del aire.

Upload: joseantoniovidalr

Post on 12-Jan-2016

5 views

Category:

Documents


0 download

DESCRIPTION

cccxv

TRANSCRIPT

Page 1: vxvx

Clase 3 12.08.2015

Preguntas que me debí haber hecho al leer el texto de Salter “Capítulo VIII: An inter-industri survey”

1) ¿Qué es cada una de las 12 variables medidas en el cuadro 14?2) ¿En qué unidades se mide cada variable?3) ¿Cómo se construyó (i. e. qué operaciones aritméticas se hicieron= cada una de las

12 variables?4) ¿Qué es la mediana? ¿De qué magnitud es la mediana de cada una de las 12

variables?5) ¿Qué son “upperquartile” y “lowe quartile”? ¿De que magnitud son?6) ¿Qué relaciones contables existen entre subconjuntos de variables que aparecen

en el cuadro 14?7) ¿Qué grupos forman las variables que aparecen en el cuadro 14?

Ayudantía 1 14.08.2015

¿Qué son los outliders?

- Son datos atípicos de la muestra.- Entregan información relevante- Permiten testear y poner a prueba la teoría- Excepción confirma la regla.

CASO CÓLERA: Dr. Snow

Ver que es lo que pasa con los outliders de Snow.

¿Cuáles son las dos tesis que propone Snow?

1. Contagio provenía de los pozos de agua.2. Contagio provenía del aire.

¿Qué hizo luego de estudiar el agua y no ver sospechas de impurezas?

- Mapeó las 83 muertes en la ciudad para ver causalidad entre agua del pozo y cólera.

¿Cuáles son los outliders del caso?

1. Cervecería.

Page 2: vxvx

2. Tía y prima3. Workhouse.

¿Cuánto se debe excluir un outliders de una regresión?

Se debe excluir solo si se analizan y se puede tener certeza de que no aporta al estudio. Sólo se podría excluir si hay una razón de peso.

ECONOMETRÍA BÁSICA

Una regresión es una relación entre una variable dependiente y una o más variables independientes con el objetivo de estimar el valor promedio de la variable dependiente ante cambios en la variable dependiente.

y i=B0+Bi xi+ui

Es importante saber que es cada uno de los coeficientes de regresión.

Coeficiente de regresión (B1) Indica cuanto varía en promedio la variable dependiente cuando cambia la independiente en una unidad. ¿Cómo se interpreta? Es el cambio (+/-) promedio de la variable “y” al aumentar “x” en una unidad.

Bi=σ yσ x×r xy

CASO CHALENGER

¿Qué indicaba que no era seguro lanzar?

Erosiones del orden del doble de lo predicho por la curva eran posibles y habían sido observadas.

Una regresión es un PROMEDIO. Indica cuanto varía la variable dependiente, en promedio, frente a variaciones de la variable independiente.

La regresión “oculta” los casos excepcionales.

La NASA tomó la decisión sólo en base a la regresión.

COEFICIENTE DE CORRELACIÓN (rxy/p)

¿Qué mide?

- Que tan cercana a lineal es la relación entre dos variables. - Solamente mide si es positiva o negativa la relación.

Page 3: vxvx

- No mide la fuerza de asociación.- Independiente de la unidad de medida.

¿Qué valores puede tomar? -1 < p < 1.

COEFICIENTE DE DETERMINACIÓN

¿Qué mide?

- El porcentaje de la varianza y que esta explicada por el modelo.- 0<R2<1- r xy

2=R2 . Son lo mismo

CONCLUSIONES SOBRE EL COEF DE DETERMINACIÓN Y CORRELACIÓN

- Ni el Coef. de determinación ni el de correlación miden si la relación es fuerte. Sólo indican qué tan cercana a lineal es la relación.

- El coeficiente de correlación no mide causalidad: no entrega una relación causa-efecto.

- La fortaleza la mide el coeficiente de la regresión.- El R2 no mide la correlación entre dos variables, sin embargo, un bajo R2 implica la

existencia de un bajo p.

CORRELACIÓN ESPURIA

- Es una relación matemática en la cual dos acontecimientos no tienen una conexión causal, aunque la correlación no es cero.

- Sugiere que dos variables tienen relación causal cuando en realidad no hay (ejemplo helados y ladrones). Puede ser una tercera variable que afecta a ambas o simple causalidad.

- Si hay una correlación espuria, ¿hay significancia? No hay.

COEFICIENTE DE VARIACIÓN (σ /x)

- Mide la dispersión de los datos en cuanto al promedio, es decir, con respecto a la media.

- Compara entre diferentes unidades de medida.

SAMPLING FLUCTUATIÓN

- Se refiere al hecho de que una misma población se puedan sacar diversas muestras y que al tener distintas muestras se pueden tener distintos resultados. Es el origen del error muestral.

Page 4: vxvx

ERROR MUESTRAL

- Error que se obtiene por está observando a la muestra en vez de la población.- Probabilidad de que los resultados obtenidos se alejen de los que son de la

población.- A mayor tamaño de la muestra, menor error.

SIGNIFICANCIA ESTADÍSTICA

- Es cuando un resultado probablemente no proviene del azar. A mayor exigencia, menor probabilidad que provenga del azar.

- Un coeficiente estimado es “significativa” cuando bajo la hipótesis nula, el estimador está en la región de rechazo.

SIGNIFICANCIA ECONÓMICA

- La relación entre las variables es útil y relevante para la investigación que se está llevando a cabo

- Se relaciona con la magnitud de las variables- Fijarse en las unidades de medida.- Ejemplo: 28 industrias de Salter- ¿Se puede tener significancia estadística pero no significancia económica?

NIVEL DE SIGNIFICANCIA

- Cuando preguntan que significa tener un nivel de significancia de 90% que solo existe un 10% de probabilidad que el resultado de otra muestra sea absolutamente distinto (hay que definir en base al 10% restante).

- Con probabilidad de 90%, se obtendrá el mismo parámetro estimado si se toma otra muestra.

o Falso. Al obtener otra muestra, la media de esta será distinta, por lo que el parámetro estimado también será distinto.

- Se rechaza una hipótesis nula con un 90% de confianza.o Falso. El rechazar no se ve en base al nivel de significancia, en cuanto de si

el parámetro estimado, que es lo que busco testear, cae en el área con una probabilidad bajo la nula menor al 10%.

- Cuándo no se conoce la población, ¿Qué significancia preferimos?o Depende de que vamos a estudiar. o La significancia estadística es para respaldar un estudio en términos

estadísticos, sin embargo, cuando hay costos o riesgos para lograr esta significancia, basta con la significancia económica.

Page 5: vxvx

¿Es posible que una muestra no aleatoria sea representativa?

- Representativo: los estimadores obtenidos y las conclusiones que se obtienen se pueden extrapolar a la población.

- Si es posible: cuando los datos estén bien medidos y sean confiables. Ej: Salter con las 28 industrias.

EJEMPLO: SALTER Y LAS 28 INDUSTRIAS

- Datos de calidad- Industrias que tenían peso: respecto al PIB en cada país.- Los conocía bien.- Estudios habían dado el mismo resultado- No fue una muestra aleatoria- No tenían significancia estadística, pero sí económica.

- Cuando se toma una muestra pequeña de la población, la probabilidad de que ésta no sea representativa y de que exista un alto error muestral es muy alta.

o No necesariamente: la persona que hace el análisis conoce la población y sabe que los datos están bien medidos.

- Un coeficiente de correlación alto implica que hay una fuerte asociación causal entre x e y.

o Falso. El coeficiente de correlación mide que tan cercana a lineal es la relación entre las variables. El signo del coeficiente indica si la relación es positiva o negativa. Sin embargo, este coeficiente no entrega información sobre la causalidad entre las variables.

Clase 4 17.08.2015

Una de las cosas fundamentales que intenta resolver Salter es el movimiento de precios relativos a largo plazo; ¿Qué hace que los movimientos de precios en distintas industrias sea distinta al largo plazo? ¿Qué hace que el precio de las bebidas sea mas o menos el mismo que hace 20 años y el precio de un celular mucho mas barato que hace 20 años?

Un segundo punto, referido también al anterior, que intenta probar Salter es que en el largo plazo, los movimientos de precios son causados por la oferta (cambios en los costos) y no causados por cambios en la demanda. La razón que estaría detrás de que los precios de los celulares, en contraste con los de las bebidas, hayan disminuido tanto en

Page 6: vxvx

el largo plazo es que los costos han aumentado mucho. Esto mismo se podría ver en el precio de la educación debido a un aumento en los costos.

En el largo plazo todo está causado por los costos. Si algo se hace más caro, el precio aumentará; si algo se hace más barato, el precio disminuirá.

Clase 5 19.08.2015

Una razón por la cual las cosas se hacen más caras es debido a que la productividad de esa industria, en relación a las demás, está creciendo más lento. Las industrias compiten por factores productivos.

Otro punto que intenta explicar Salter es una relación inversa entre la productividad y el labour cost. Esto se debe a que a una mayor productividad se esta haciendo más con la misma cantidad de trabajo, por lo que a mayor productividad menor labour cost.

La regresión dice es un promedio. Si la variable “x” cambia en una unidad, en promedio, la variable “y” cambia en la cantidad del coeficiente de regresión.