Download - Introducción a inferencia básica
![Page 1: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/1.jpg)
Introducción a inferencia básica
Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina
Daniel A. Rodríguez, Ph.D.University of North Carolina, Chapel Hill
[email protected] www.planning.unc.edu/rodriguez
![Page 2: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/2.jpg)
Objetivos de aprendizaje
• Aplicar estadística descriptiva a muestras
• Entender el teorema del limite central y su importancia para describir poblaciones a partir de muestras
• Calcular normal estándar, área bajo curva normal e intervalos de confianza
![Page 3: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/3.jpg)
Resumen de temas
• Estadística descriptiva– Medidas de tendencia central– Medidas de dispersión
• Estadística inferencial
![Page 4: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/4.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 5: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/5.jpg)
Medidas de tendencia central
• Son indicadores que describen la situación de tendencia o hacia la que tienden a aglomerarse las observaciones de una variable aleatoria– Media– Mediana
![Page 6: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/6.jpg)
Medidas de tendencia central: la media
• Ejemplo numérico: tenemos los siguientes precios del suelo (por m2) para una ciudad por barrios
• La media es el promedio aritmético = la suma de todas las observaciones, dividida por el número de observaciones
Barrio A B C D E FPrecios 6 13 5 15 3 2
3,76
23155136
![Page 7: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/7.jpg)
Medidas de tendencia central: la media
• En términos matemáticos, la media aritmética es:
n
Xn
i i 1
n
XXXX n ...321
![Page 8: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/8.jpg)
Medidas de tendencia central: la media
• Atributo interesante de la media– La suma de la diferencia entre cada
observación y la media es 0
0)(...)()()( 321 xXxXxXxX n
0)(1
xXn
ii
![Page 9: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/9.jpg)
Medidas de tendencia central: la mediana
• Es el valor medio de un arreglo ordenado de datos– Ordenar los datos (ascendente o
descendente)– Encontrar el dato justo en medio de los
demás datos
Esta definición aplica para un número par o impar de observacionesmedianaladeposición
n
2
1
![Page 10: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/10.jpg)
Medidas de tendencia central: la mediana
• Ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barrios Barrio F E C A B DPrecios 2 3 5 6 13 15
Hay 6 observaciones. Luego la posición de la mediana es n+1 / 2 = 3.5. Quiere decir que la mediana esta entre el valor del dato en la posición 3 y el valor del dato en la posición 4.
Posición 3: barrio C Posición 4: barrio A Mediana, entre 5 y 6. Es decir: 5.5
![Page 11: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/11.jpg)
Sesgo debido a observaciones extremas
• La mediana no es sensible a observaciones extremas– Es un indicador que no es sesgado por los
extremos por lo que se recomienda cuando las variables aleatorias tienen distribuciones amplias
• La media es sensible a observaciones extremas
Esta definición aplica para un número par o impar de observaciones
![Page 12: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/12.jpg)
Distribución normal
115
=10
![Page 13: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/13.jpg)
Distribución asimétrica
![Page 14: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/14.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 15: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/15.jpg)
Medidas de dispersión
• Indican el grado de “separación” entre los datos numéricos de una variable aleatoria.– Rango– Varianza
![Page 16: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/16.jpg)
Medidas de dispersión
• El rango describe los valores extremos entre los cuales se encuentra distribuida una variable– Se calcula restando el valor menor del valor
mayor; para el ejemplo del barrio 1, el rango es 8-6 = 2 Barrio 1 (n=9)
![Page 17: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/17.jpg)
Medidas de dispersión
• La varianza
• Evalúa en qué medida las observaciones fluctúan con respecto a la media
1
1
2
n
XXn
i i
![Page 18: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/18.jpg)
• La desviación estándar – Extrae la raíz cuadrada de la varianza para
de esta manera compensar la elevada al cuadrado
Medidas de dispersión
1
1
2
n
XXn
i i
![Page 19: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/19.jpg)
Medidas de dispersión• La varianza y desviación estándar;
ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barriosBarrio F E C A B DPrecios 2 3 5 6 13 15
EstándarDesviación 4,507,29
07.29
16
33.715.....33.7333.72 222
![Page 20: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/20.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 21: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/21.jpg)
Introducción a la estadística inferencial
• La información muestral de tendencia central y dispersión permite hacer estimativos de dichos indicadores para la población– Incluso permite determinar el tamaño de
muestras óptimo para alcanzar buenas predicciones poblacionales
![Page 22: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/22.jpg)
Estadística inferencial --conceptos básicos
• Población o marco muestral: grupo sobre el cual se quieren hacer generalizaciones
• Muestra: grupo menor al de la población que fue seleccionado para ser estudiado
• Diseño de muestra: Criterio que se utilizo para seleccionar las observaciones de la muestra
![Page 23: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/23.jpg)
Distribución muestral de medias de muestras
Populacao; x =5 5 5 5 5 54 4 4 4 4 4 43 3 3 3 3 32 2 2 2 2 2 21 1 1 1 1 1
Poblacion
Muestras (c/u de tamaño igual a 3)
![Page 24: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/24.jpg)
Medias muestralesx = x = x = x = x = x = x = x = x =
5 5 5 5 5 4 4 4 34 4 4 3 2 3 3 2 23 2 1 2 1 2 1 1 1
Media 4.0 3.7 3.3 3.3 2.7 3.0 2.7 2.3 2.0
0
0.5
1
1.5
2
2.5
0.0 1.0 2.0 3.0 4.0 5.0
Média
Fre
qu
ênci
a
Média: Frequência:4.0 1.03.7 1.03.3 2.03.0 2.02.7 2.02.3 1.02.0 1.0
Media Frecuencia
![Page 25: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/25.jpg)
Ejemplo de distribución de medias de muestras
• Valor por m2 de locales comerciales en cierta zona a ser estimado por un grupo de estudiantes
• Cada estudiante tomará una muestra aleatoria de locales
![Page 26: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/26.jpg)
ResultadosResultados
• Persona 1: P1, P2….Pn P1 media1, s1
• Persona 2: P1, P2….Pn P2 media2, s2
– Media Pi de cada estudiante es parte de la distribución muestral de la media
– Distribución de medias es normal
– Con menor dispersión que si
• La dispersión de la media de medias es menor que la dispersión de las variables crudas
• Cuánto menor? Raiz cuadrada de n (n= número de estudiantes)
![Page 27: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/27.jpg)
ResultadosResultados
• Lo anterior es cierto SIN importar distribución del precio/m2 de todos los locales comerciales
Precio/m2
# de locales
Precio/m2
# de locales
![Page 28: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/28.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 29: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/29.jpg)
Teorema del Límite Central
• Distribución de suma (o media) de variables aleatorias con varianza finita ~ Normal o Gaussiana, cuando n>30– Aleatoria– Distribución normal
![Page 30: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/30.jpg)
Teorema del Límite Central
• Si tomamos muestras repetidas de un tamaño predefinido de una población – Distribución de medias será normal– Media de distribución muestral del promedio
promedio de población• Xbarra = μ
– Error estándar = desviación estándar/ √n• Si n es grande, error disminuye
![Page 31: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/31.jpg)
Ejemplo Ejemplo
• Utilizar el programa climit para explorar las implicaciones del teorema central del limite– Hacer doble click en el ícono en esta lámina
(no contiene virus!)
Cenlimit.exe
![Page 32: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/32.jpg)
Notación
• Muestra– (xbarra) es la media – s es la desviación estándar de la muestra– n es el tamaño de la muestra
• Población– es la media de la población– es la desviación estándar de la población– N es el tamaño de la población
x
![Page 33: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/33.jpg)
Distribución muestral del promedio
• Variable cuantitativa– Xbarra = μ (promedio de población)– Error = σ/√n
• Variable proporcional– p= π (promedio de proporción de población)– Error = √ (p(1-p)/n)
![Page 34: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/34.jpg)
Distribución normal
• Hay infinitas distribuciones normales (depende de la media, y la dispersión)– Dos ejemplos
![Page 35: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/35.jpg)
Continuando con el teorema del límite central
• No solo la media de medias se aproxima a la media de la población– Sino que sabemos que 68.27% de las
muestras están entre y ; y 95.45% de las muestras están entre
y
x x
x 2x 2
![Page 36: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/36.jpg)
Dicho de otro modo:34.134% de observaciones están entre la media y +1 desviación estándar47.725% de observaciones están entre la media y +2 desviaciones estándar
Continuando con el teorema del límite central
![Page 37: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/37.jpg)
Área bajo la distribución normal
Xbarra
2-2 -
50%
50%
50%-34.13%
=15.87%
![Page 38: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/38.jpg)
Área bajo la distribución normal
Xbarra Xbarra
2-2 - 2-2 -
50%
50%
15.87%
15.87% x 2 = 31.74%
50%-47.725%
=2.275%
=2.275% x 2
=4.55
![Page 39: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/39.jpg)
Área bajo la distribución normal
Xbarra
El área rayada muestra los casos en que la muestra tuvo una media mayor a 115
115
SXbarra =10
![Page 40: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/40.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 41: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/41.jpg)
Normal estándar
• La letra “z” se designa al valor de cada observación en términos de la desviaciones estándar de la muestra– Transformación:
– Nuevos valores tienen promedio 0, y desviación estándar 1 muy útil
ux
![Page 42: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/42.jpg)
Normal estándar
• En el caso anterior del valor 115, su normal estándar sería 1.5, porque está a 1.5 desviaciones estándares de la media
![Page 43: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/43.jpg)
Ejemplo de normal estándar
pop_acre std hu_acre std 1 10.02 0.63 8.38 2.21 2 42.39 5.72 20.62 6.84 3 18.46 1.96 9.48 2.63 4 14.48 1.33 9.95 2.81 5 23.53 2.76 12.30 3.70
Variable Obs Mean Std. Dev.
Min Max Mean Std. Dev.
Min Max
pop_acre 318 6.01 6.36 0 42.39 -1.23E-09 1 -0.95 5.72 hu_acre 318 2.51 2.65 0.02 20.62 -2.20E-10 1 -0.94 6.84 parkacre 318 0.00 0.01 0 0.04 -2.84E-09 1 -0.73 6.30 roadacre 318 0.02 0.01 0.00 0.07 3.21E-09 1 -1.67 3.89
![Page 44: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/44.jpg)
Área bajo la distribución normal
Xbarra 115
SXbarra =10
• La pregunta original sobre el área a la derecha de 115– El valor normal estándar
de 115 es 1.5– Cuál es el área a la
derecha de 1.5?– Utilizar una tabla Z
![Page 45: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/45.jpg)
Tabla Z
z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0 0.004 0.008 0.012 0.016 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.219 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.258 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.291 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3304 0.3365 0.3389
1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.377 0.379 0.381 0.383
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.398 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.437 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.475 0.4756 0.4761 0.4767
2 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.483 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.489
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.492 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.497 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.498 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.499 0.499
3.1 0.499 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.499
La tabla es en Excel. Para acceder a los datos, hacer doble click en la tabla.
Muestra area entre 0 y la normal estandar
![Page 46: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/46.jpg)
Ejemplo normal estándar
• Una muestra tiene un valor de 80– Cual es su valor normal estándar?
• (80-100)/10 = - 2.0
– Que % de las muestras son mayores que 80?• Utilizando -2.0, ir a la a tabla. Utilizar 2, ya que la
curva es simétrica. El valor es 0.4772. Es decir, que 0.5 + 0.477 = 97.7% de las muestras serían mayores que 80, y sólo
2.3% serian menores.
![Page 47: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/47.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 48: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/48.jpg)
Hipótesis
• Bisagra ente problema y estudio empírico
• Fundamentada por teoría y praxis
• Ajustes y mejoras de acuerdo a evidencia
![Page 49: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/49.jpg)
Ejemplos de Hipótesis
• Existe una relación entre regulación de usos de suelo y precios, tal que las ciudades mas reguladas presentan mayores precios de tierra
• Existe una relación entre la localización y el precio de la tierra, tal que los inmuebles mas próximos a centros de actividad y negocios tienen precios mas elevados que inmuebles mas distantes
• Existe una relación entre la informalidad y la pobreza, tal que las ciudades con mayores índices de pobreza presentan mayores domicilios informales que ciudades con menor índices de pobreza en su población
![Page 50: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/50.jpg)
Prueba de hipótesis
• Recolectar información para determinar si la hipótesis es cierta o no– En muchos casos, no estaremos 100% seguros de
que la hipótesis sea cierta (o no), pero tendremos alta confiabilidad de que lo sea
![Page 51: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/51.jpg)
Formulación de hipótesis para inferencia estadística
• Hipótesis nula (H0)
– Afirmación que indica que para la población, dos variables son iguales
• Hipótesis alternativa (H1)
– Afirmación que indica que para la población, dos variables difieren (>, <, < o >)
– Hipótesis de la investigación
![Page 52: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/52.jpg)
• Queremos saber si alcaldes con tintes de izquierda adquieren tierra para proyectos de vivienda con métodos que están por fuera del mercado de tierra, en comparación a alcaldes con tintes de derecha
• Sabemos cantidad de tierra adquirida por via administrativa (expropiada) para todas las ciudades de Colombia
• Formulamos el test de hipótesis:– H0: izquierda = derecha
– H1: izquierda ≠ derecha
Ejemplo: adquisición de la tierra e ideología política
![Page 53: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/53.jpg)
• Digamos que izquierda = 83.18%
derecha = 22.25%
• Como estas medidas son para la población de ciudades, no hay necesidad de hacer pruebas de significancia– izquierda > derecha , luego H0 es rechazada
Ejemplo: adquisición de la tierra e ideología política
![Page 54: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/54.jpg)
• Caso más usual: dos muestras aleatorias• izquierda = ??• derecha = ?•
izquierda = 23.33%• derecha = 83.18%
x
Ejemplo: adquisición de la tierra e ideología política
x
![Page 55: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/55.jpg)
• En el ejemplo anterior– Si no sabemos media en la población, tenemos error
de muestra, y el hecho que las muestras tienen medias distintas podría ser una coincidencia
– La hipótesis es la misma, queremos saber si la media en las dos poblaciones son diferentes
– Hay que incluir información no solo sobre la media, sino sobre la dispersión que existe en la media muestral –porque nos ayuda a saber que tan diferentes las medias son en realidad
Ejemplo: adquisición de la tierra e ideología política
![Page 56: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/56.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 57: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/57.jpg)
Estimación de intervalos de confianza
• Un rango o intervalo de valores entre los cuales podemos afirmar que está la media poblacional
• Por ejemplo, si sabemos la media muestral, podemos decir con 95% de certeza que la media de la población esta entre el rango de y=
xx 96.1 xx 96.1
xx 96.1
![Page 58: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/58.jpg)
Intervalos de confianza
• Retomando el ejemplo del precio/m2 de locales comerciales– Xbarra de precios= promedio de promedios– Error estándar = s/√n
• Puedo adivinar promedio, usando Xbarra
• No contiene información sobre el error
![Page 59: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/59.jpg)
Intervalos de confianza
• Presentar la inferencia como intervalo– Contiene rango en el que el valor del parámetro
(la media) se encuentra– Probabilidad de que esté en ese intervalo a
cierto “nivel de confianza” • 95% nivel de confianza estándar en ciencias sociales
• Normalidad del TCL nos ayuda a construir intervalos a deseados niveles de confianza
![Page 60: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/60.jpg)
Intervalos de confianza
• Valores críticos para población
• Declarar hechos– Tenemos 95% de confianza que promedio esta
dentro rango dado– 5% de los casos, media de la población esta por
fuera del intervalo de confianza del promedio
58.2,96.1
58.2,96.1
xx
ErrorEstxErrorEstx
![Page 61: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/61.jpg)
Intervalos de confianza en MUESTRAS
n
sZx
ErrorEstZx
.
n
ppZp
ErrorEstZp
)1(
.
![Page 62: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/62.jpg)
Ejemplo
• Considere una distribucion asimetrica, tirada hacia la derecha (right skewed)
– La media muestral es 14.46, n=40, y la desviacion estandar 1.34. Estimar un intervalo de confianza del 95%
![Page 63: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/63.jpg)
Ejemplo
![Page 64: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/64.jpg)
Presentación
• Repaso teorema del limite central
• Normal estándar
• Formulación de hipótesis
• Intervalos de confianza
• T-de estudiante
• Pruebas de hipótesis
![Page 65: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/65.jpg)
T de estudiante
• William Gosset se dio cuenta que la distribución normal no describe muestras pequeñas– Más probable que valores lejos del promedio
ocurran– Hay que ajustar la distribución por el tamaño
de la muestra– No pudo usar su nombre “estudiante”
![Page 66: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/66.jpg)
T de estudiante
• Como distribución normal pero con colas mas gruesas (probables)
• Si n ∞, t normal
• Ajuste al tamaño de la muestra se llama “grados de libertad”
![Page 67: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/67.jpg)
T de estudiante
• Como distribución normal pero con colas mas gruesas (probables)
• Si n ∞, t normal
• Ajuste al tamaño de la muestra se llama “grados de libertad”– Mucho grados = bueno; pocos no tan bueno
• 1 grado de libertad, hay que irse 12 veces la desviación estándar para tener 95% de observaciones
• df=5, t.05=2.58; df=10, t.05=2.23; df=50, t.05=2.01
![Page 68: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/68.jpg)
Pruebas de hipótesis
• Comparar valor por m2 de locales comerciales en zona con otro valor– Antes construimos intervalo de confianza
para promedio muestral (269k,291k)– Qué tan factible es que el promedio
verdadero en la población de locales sea 255k?
– No muy probable…
T1
![Page 69: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/69.jpg)
Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis
![Page 70: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/70.jpg)
Pruebas de hipótesis
• Usemos números!– 255,000 esta a 5.9 desviaciones del
promedio– Cual es la probablidad de que esto ocurra?
• Mirar curva de distribución normal (Tabla Z)– Casi 0
![Page 71: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/71.jpg)
Pasos para examinar una hipótesis
1. Formular hipótesis nula (Ho) e hipótesis alternativa (Ha)
2. Identificar estadística a comparar
3. Probabilidad de observar promedio de muestra si Ho es verdad
4. Concluir
![Page 72: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/72.jpg)
1. Formular hipótesis
• Nula – nada ocurre (en términos de parámetros poblacionales)– Π = valor– µ = valor– µ1- µ2 = valor
• Alternativa –lo que nos interesa!– Π > valor –una cola– µ ≠ valor –dos colas– µ1- µ2 < valor –una cola
![Page 73: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/73.jpg)
2. Identificar estadística a comparar
• La estadística a comparar: qué tan lejos está el valor de la muestra del de la población –azar o no?– Prueba de una muestra o de dos?
Empecemos con una:
n
sx
ErrorEst
xZ
.
npp
pErrorEst
p
)1(
.
![Page 74: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/74.jpg)
3. Valor p
• Probabilidad de que la estadística (t o Z) sea resultado de azar o no, si la hipótesis nula es verdad– Una probabilidad bien baja sugiere baja
posibilidad de azar– Usando distribución (t o Z) con valores
críticos (y para T, dependiendo de grados de libertad)
![Page 75: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/75.jpg)
4. Conclusión
• Si p es cerca a 0, probabilidad de que sea resultado de azar es baja – rechazar Ho
• Si p es cerca a 1, probabilidad que sea resultado de azar es alta – no rechazar Ho
• Sugiero p<0.05
![Page 76: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/76.jpg)
Ejemplo• Valor/m2 locales comerciales en cierta zona
– 280k, s=85000, n = 400– Un censo mostró que el valor de predios comerciales
es de 268k/m2. Es la diferencia significativa?– Ho: Xbarra estudio = µ censo– T= (280k-268k)/(85k/ √(400) = 2.82; df=?– http://www.socr.ucla.edu/Applets.dir/T-table.html– P~ 0– Rechazar Ho, que son iguales
![Page 77: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/77.jpg)
Comparar dos muestras
• Frecuente en investigación – evaluar intervenciones– Aumento de precios– Ingresos – Tiempos de viaje– Calidad del aire
• Todo permanece igual en prueba de hipótesis, menos estadística a comparar
T2
![Page 78: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/78.jpg)
Ejemplo
• Comparación de precios de predios residenciales, antes y después, TransMilenio
![Page 79: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/79.jpg)
Estrategia de análisis
• Si no hay diferencia entre dos grupos (antes y después) en población (Ho) qué tan probable es que yo encuentre diferencia en mis (dos) muestras?– Estadística del test
• t= (diferencia en muestra – diferencia en población)/ se (diferencia en muestra)
![Page 80: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/80.jpg)
Estrategia de análisis• Var(X1+X2)=Var(X1)+Var(X2)+2Cov(X1,X
2)
• Si X1, X2 son independientes, Cov = 0
BA xx
BABA
es
xxt
)(
B
x
A
xxxxx n
s
n
seseses BA
BABA
2222
![Page 81: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/81.jpg)
Ejemplo
• = 7.32/2.31 = 3.05
• Si no hay diferencia, probabilidad de que encontremos una de 3.05 por azar es < 0.01
• Rechazar hipótesis nula
Antes (n=1055) Despues (n=874) Promedio Std. Dev. Promedio Std. Dev.
Precio 73.93 44.47 80.99 55.11
![Page 82: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/82.jpg)
Objetivos de aprendizaje –el principio pero al final• Aplicar estadística descriptiva a
muestras• Entender el teorema del limite central
y su importancia para describir poblaciones a partir de muestras
• Calcular normal estándar, área bajo curva normal e intervalos de confianza
![Page 83: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/83.jpg)
Ejercicio
• Consideren los datos de propiedades cercanas TransMilenio, recogidos entre el 2001 y el 2006.– Examinar los precios del suelo (price_000)
de propiedades ofrecidas en el 2002 y en el 2006 en la zona de intervencion
• Zona_int=1 &• Yr_2002 o yr_2006
![Page 84: Introducción a inferencia básica](https://reader036.vdocumento.com/reader036/viewer/2022062305/55cf8df1550346703b8ce5b4/html5/thumbnails/84.jpg)
Ejercicio
• Para cada agno– Media– Mediana– Desv Estandar – Intervalo de confianza de 95% para la media
poblacional– Prueba de hipotesis de que los precios son
diferentes para los dos agnos