estadistica

10

Click here to load reader

Upload: carlo-alonso-munoz-alvarez

Post on 13-Apr-2017

732 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadistica

Estadística

Estadística Descriptiva. Se encarga de la recopilación , organización, presentación e interpretación de datos muestrales para predecir el comportamiento de una población. Inferencia Estadística. Se encarga de conocer (estimar valores de la población (parámetros) a partir de valores observados (estadísticos) Los subtemas son: Medias Distribuciones muestrales Sumas y diferencias de medias Y Varianzas Puntual Estimación Por intervalo de confianza Pruebas de hipótesis Inferencia Estadística Distribución muestral de medias Parámetros :���������� N m mnm

m2 m3 Muestra de tam tamaño n

x1 xnm

x2 x3

Sx1 Sx2 Sx3 Sxnm

Estadísticos: �����������������������������

� �� � � ��� �� � � ���� �� � � � ������������� � � � ���

�� � � !"� # � $ �%���&'

� '� (!"�'# ) !"�*# ) �!"��#+

�� � � ,����,���,�����,���� � ��� ��� � �����

-./"� # � 0./ 1��� 2 ) -./ 1��� 2��) ��0./ 1��� 2

����� * � ������ ) ��� ��� ) ������ �������� ���� � 3�����4 � ����

NOTA.- Las muestras x1, x2,.. xn son variables aleatorias; no se sabe que valores tomarán los elementos seleccionados. La teoría anterior se fundamenta en la ley de los grandes números. Y el teorema del limite central. �'555���� 67�.�76�8.� 96:;/.��� �*555���� 67�.�76�8.� 96:;/.�< � �= ��� 67�.�76�8.� 96:;/.��

Si el muestreo es con reemplazo: � � �>� Si el muestreo es sin reemplazo:

?>�@

Page 2: Estadistica

Actividad de aprendizaje: Tiempo para realizarla: 15 minutos 1. Si se tiene una población de tamaño N:

1.a) ¿Cuántas muestras de tamaño 2 se tienen en un muestreo con reemplazo? 1.b) ¿Cuántas muestras de tamaño 2 se tienen en un muestreo sin reemplazo?

2. Defina: 2.1 Espacio muestral 2.2 Media de la población 2.3 Media de la muestral 2.5 Estadístico

3. Enunciar las propiedades del operador esperanza E{h(x)}

4. Obtener ABC�D* � �E"��(F� ) G H�IBC�D+*# 5. Graficar las siguientes distribuciones:

5.1 Uniforme 5.2 Exponencial Negativa 5.3 Distribución Normal

6. Dado el espacio muestral S: S={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}

6.1 Obtener la población 6.2 A partir de S, calcular: IC���J���AC 6.3 Graficar la función de distribución de la población

7. ¿Cómo se estandariza una variable aleatoria x con distribución normal?

8. Demostrar que : IK&��L

Page 3: Estadistica

Demostrar: �M��N* � �.*��* E"O(�+# � �IP(C+ ����O(�+ � ���QRSTRUQV��E"�# � ������� �����O(�+ � � (� H�IC+*���QRSTRUQV���E"(� H�IC+*# � �AC* W��X(�+ � .� ) Y��6�;Z�[6:��!"�.� ) Y# � .���� �) G� � �� IBC�D� W��X(�+ � � (F� ) G H�IBC�D+*�QRSTRUQV��E"��(F� ) G H�IBC�D+*# � ABC�D* � ABC�D* � �E 1��\F� ) G H (�FIC ) �G+]*2 � E"�(F� H�FIC+*# � E"�(F(� H�IC++*# � E"F*\(� H�IC+]*# ^ � ABC�D* � �.*��* Ley de los grandes números. Sean x1, x2…xn, n variables aleatorias independientes con la

misma función densidad de probabilidad y por lo tanto con la misma con la misma ����� ���� , entonces la sucesión de valores aleatorios definida como:

� � $ �%���&'

Satisface la expresión:

P(_� H ���_ ` a+ b L����� ��� _a_ c _ [9.�7Z�� b d

Teorema del límite central .Sean x1, x2…xn, n variables aleatorias independientes con la misma

función densidad de probabilidad y por lo tanto con la misma con la misma ����� ����, entonces la sucesión de valores aleatorios definida como:

e � � H���� �� � ��� � �7Z�76���� � f �����&'

Tiene una distribución normal cuando �� b d y empíricamente, cuando � g� hL Gráficamente:

Población Distribución muestral de medias Distribución Uniforme x ��

Exponencial negativa

�� � x Normal x :

Page 4: Estadistica

Población finita o sin reemplazo:

�� �� ����������� � � ���� � i jkl�kl' � �mFUSTn�oQ�UTnnQUU�pRq�i jkl�kl'� . Población infinita o con reemplazo:

���� �� ����������� �� �����i� Factor de corrección = 1

Ejemplo 1. Se extrae una muestra aleatoria, sin reemplazo, de tamaño 2 de una población de 5

números. Los números están escritos en fichas idénticas y son: 2,4,6,8 y 10. Calcular ���� �� ������� ��������� X Frecuencia

(f) Frecuencia

relativa (rs) x* f(x) �* �* t r(�+ 2 1 1/5 2/5 4 4/5

4 1 1/5 4/5 16 16/5

6 1 1/5 6/5 36 36/5

8 1 1/5 8/5 64 64/5

10 1 1/5 10/5 100 100/5

f� t r(�+ � u f�< t r(�+� <<Lv � ww

��� � u AC* � E"�*# H ����* �� ww H hu � x

Número total de muestras:

\k&y�&*] � �L ; �� �� u��� ��AC5* � E"� *# H ��� �* � 39 – 36 = 3 ;

Muestra � � � � r� rs� � � t �rs� � �* � �* t �rs� (2,4) 3 3 1 1/10 3/10 9 9/10

(2,6) 4 4 1 1/10 4/10 16 16/10

(2,8) 5 5 2 2/10 10/10 25 50/10

(2,10) 6 6 2 2/10 12/10 36 72/10

(4,6) 5 7 2 2/10 14/10 49 98/10

(4,8) 6 8 1 1/10 8/10 64 64/10

(4,10) 7 9 1 1/10 9/10 81 81/10

(6,8) 7 60/10 39

(6,10) 8

(8,10) 9

Page 5: Estadistica

Ejemplo 2. Una población muy grande tiene una media de 20 y una desviación estándar de 1.4. Si

se toma una muestra de 49 observaciones, conteste la siguientes preguntas: a)¿Cuál es la media de la distribución muestral de medias? b)¿ Cuál es la desviación estándar de la distribución muestral de medias? c)¿ Qué porcentaje de posibles valores medios de la muestra diferencian de ��&����por más de 0.2? Resolución: a) �� � ���&�� � 20 b)��� � � ���� �� � 'iz�z{ � Li< c) : |(�}ix ~ � ~ <Li<+ ��: |(H� ~ e ~ �+ � Liux Ejemplo 3. 500 cojinetes de bolas tienen un peso medio de 5.02 y una desviación típica de .3

onzas. Hallar la probabilidad de que una muestra al azar de 100 cojinetes, elegidos al azar, tenga un peso total a) Comprendido entre 496 y 500 onzas b) De más de 510 onzas Resolución: N= 500 cojinetes n= 100 cojinetes ��&����viL<����� �����&���i h Se trata de obtener: |(wi}u ~ � ~ v+ � Es decir; de una distribución muestral de Medias

e' � � l�,������� =� l�,����������ij������

= zi{��–�yi�*�

�� i������ij�������������� � �–i���

�� i����ij������ = -2.23

e* � � l�,������� � � l�,����������ij������

�� � y�–�yi�*��� i������ij�������������

� � �–i�*�� i����ij������

� �Hi�wv��= = . |(wi}u ~ � ~ v+ � |(�H<i<h ~ e ~ Hi�wv+ � � i<�u�� |(� �` vi�+ � � H �|(� �~ vi�+ Ejemplo 4. Un fabricante de acumuladores asegura que su producto tienen una vida esperada

(promedio) de 50 meses. Mediante estudios realizados por la compañía se sabe que ����� � w� meses. ¿Qué porcentaje de muestras de 36 observaciones tendrá una vida promedio que valla de 49 a 51 meses?, suponiendo que 50 es el promedio de vida esperada de los acumuladores. ¿Cuál es la respuesta si se toma una muestra de 64 observaciones? Resolución: a) n= 36 �����������&����vL����� �����&���w |(w} ~ � ~ v�+ � |(H�iv ~ ��e� ~ �iv+

e* � y'ly������ �'�� �

�* |(e� ~ e* � �iv+ � i}hh<L

e' � z{ly������ �l'�� H

�*

^ |(w} ~ � ~ v�+ � <(i }hh< H iv+ � <(i whh<+ � ixuuw b) n = 64

Page 6: Estadistica

e* � z{ly���� ��* � <

^ �(w} ~ � ~ v�+ � |(H< ~ ��e� ~ <+ � <(i }��< H iv+ � (i w��<+ � i}vww Ejemplo 5. Supóngase que las estaturas de 3,000 estudiantes de una universidad se distribuyen

normalmente ����&����ux���������&���h pulgadas. Si se toman 80 muestras de 25 estudiantes cada una, ¿cuál será la media y la desviación estándar esperada de la distribución muestral de medias resultante si el muestreo se realizó: a) con reemplazo y b)sin reemplazo. Resolución: a) n= 25 �������&���ux����� �����&���h ���� �� ��� � ������������ � � ���� � i � � ��*y � �Liu���98�.7.:

b) �� �� ��� � ������������ � � ���� � i jkl�kl' � � � ��*y � i j*{�y*{{{ =0.597 Ejemplo 6. Considerando el enunciado del problema anterior, ¿en cuántas muestras cabría esperar

una media: a)entre 66.8 y 68.3 y b) menor de 66.4 Resolución: a) n= 25 �������&���ux���� �����&���h��� |(uuix ~ � ~ uxih+ � |(H< ~ ��e� ~ iv+

e' � ��i�l��������� l'i*�� � H< |(e� ~ e* � �iv+ � i}hh<L

e* � ��i�l������� � i��� � iv

^ �|(uuih ~ � ~ uxih+ � |(H< ~ ��e� ~ iv+ � iuux� Finalmente: (.6687)(80)= 53 muestras.

b) |(� ~ uuiw+ � |(��e� ~ H<i��+ � iLLhw

Finalmente: (.0038)(80)= 0 muestras Estimación. Es el proceso de utilizar datos muestrales para estimar los valores de parámetros

desconocidos de una población. Tipos de estimación: Puntual y por intervalos de confianza

Estimación Puntual.

Definición. Se dice que el estadístico ����es un estimador insesgado del parámetro � si y sólo sí: !�������� � �� Ejemplos: 1) ���� ��� ��� ��!"��� ��� �# � ����

2) Investigar si �����* � � W�*�� es o no un estimador insesgado.

Page 7: Estadistica

!"$ (�%l� +�� # � �� "$ (�� H � ) �� H ��+*#��&'��&'

� �� "$ \(�� H ��+ H (� H ��+]*#��&'

� !"$ "(�� H ��+* H <(�� H ��+(� H ��+ ) (� H ��+*##�%���

!"$ (�%l,�+����&' H <(� H ��+$ 3�%l,�� 4��&' ) $ (� l,�+�*#��&'

! �$ \��H���]<���&' H <\��H ��]\�� H ��] ) \�� H ��]*�

! 1$ (�%l�,�+����&' H�(� H ��+<2���� ��� Donde:

E{ $ (�%l�,�+����&' # � �!"(��l�,�+�� # ) �!"(��l�,�+�� # ) !"�(��l�,�+�� # )�� �!"(��l�,�+�� �#�� E{ $ (�%l�,�+����&' # � � ����<� � ���< Por otro lado: !"H�(� H ��+*# � �H!""�(� H �� +*# � �H��� * Finalmente:

! �f(�� H���+*��

�&'H�(� H ��+*  �� � �� ��* H��� * � ��* H���*� � ���*

(� H �+�

^ !������* � �W�*� � ��� ��* (�l'+� ����Z�6:�9��6:;� .7Z/���:6:�.7Z

Para ser insesgado: ! 1�����* � � �(�l'+ W�*2

Definición Estimador de Varianza mínima. Sean ���'��¡�����* dos estimadores insesgados (!"���'# ��!"���*# � �� ) del parámetro �. Se dice que ���' es un estimador de varianza mínima si: -¢£�����'��� c �-¢£�����*���

Definición Estimador Consistente, Se dice que un estimador ���' es un estimador consistente del

parámetro � si: a) ���'��es un estimador insesgado

b) W��-¢£�����'��� b L����[9.�7Z��� b d

Ejemplo.-�� �� es un estimador consistente:

a) E"�� �# � ���� b) -¢£"�� ��# � �� * � �� ���� ��

Page 8: Estadistica

Estimación por intervalos de confianza

=e ; error de estimación ��������He¤���� �� �e¤���� ���5 ��������������������(�H¤+Nivel de confianza ¤ <¥ ¤ <¥ ���� LI �� LS ;

Límites del intervalo de confianza:

LI es el lílmite inferior y LS el límite superior

|LI| = |LS| ; Para efectos de estimación:

|(¦§ ~ ����� ~ �¦W+ � �H¤ �������� ��������������������(�H¤+��Nivel de confianza ¤ <¥ ¤ <¥ He¤���� &LI �¨ � L e¤���� =LS

| ?H�e¤�* ~ e ~ �� e¤*@ � �H¤ ��� (.+

Recordando : �e � � l��,������ � (Y+ W9:;i (Y+6��(.+

| ?He¤< ~ e � �5 H����5��5� � ~ e¤<@ � �H¤ ��� (.+

Multiplicando por ��

| 3He¤< ���5 �~���5 H����5 ��~ e ¤< ���5���4 � �H¤�

| 3�5 H e ¤< ���5 �~����5 ��� ����� �~ �5 ) e¤< ���5 ���4 � �H¤�

Page 9: Estadistica

Límites de confianza: ������5 �����© ��e ¤< ���5

Nota.- Los limites de confianza (LI y LS) se modifican de acuerdo al valor � � muestreado que se toma como estimador. Ejemplo 6. A continuación se mostrará, mediante un ejemplo sencillo, el concepto de estimación

de la media de la población por intervalos de confianza. Cabe aclarar que en situaciones reales ����� no se conoce. Supongamos que tenemos una población de tamaño N=7 con los siguientes elementos: A={ 1,2,3,4,5,6,7 }. Si seleccionamos una muestra de tamaño n=2, sin reemplazo, obtener el intervalo

de confianza correspondiente para un nivel de confianza �H¤�� � i}L ( e = e ¤* ���5�+ Resolución:

Conocemos el valor de ����� � w, valor que se estima con ��� ��� y donde � � es el valor promedio de una muestra, por lo tanto:

| 3�5� H 3e¤< � �iuw4 ��5 �~ ����5 ��� ����� � ~ � �5� ) (e ¤< � �iuw+���5���4 � i}� Lo anterior significa que de100 muestras, 90 muestras contendrán el valor desconocido ����� en los intervalos de confianza calculados para cada muestra.

Número de muestras : \�*] � <�; �� � <

������ � � ���� � i jkl�kl' � �� *�* � i j�l�*�l' � � *�* � i jy� =1.29

Para un intervalo de confianza de .9 : z= 1.64 y el error de estimación es: e = e ¤* ���5= 2.1 Mi Muestra � �5� H 3e ¤* � �iuw4 ��5 �~�� �~ ��5� ) (e ¤* � �iuw+���5��� 1 1,2 1.5 HLiu� ~ � � �~ ��hiu 2 1,3 2 ��HLi�� ~ � � �~ ��wi�� 3 1,4 2.5 Liw� ~ � � �~ ��wiu 4 1,5 3.0 ��Li}� ~ � � �~ ��vi� 5 1,6 3.5 1.4�~ � � �~ ��viu 6 1,7 4.0 1.9�~ � � �~ ��ui� 7 2,3 2.5 ��������Liw� ~ � � �~ ��wiu 8 2,4 3.0 ��Li}� ~ � � �~ ��vi� 9 2,5 3.5 1.4�~ � � � ~ ��viu 10 2,6 4.0 11 2,7 4.5 12 3,4 3.5 13 3,5 4.0 14 3,6 4.5 15 3,7 5.0 16 4,5 4.5 17 4,6 5.0 18 4,7 5.5 19 5,6 5.5 20 5,7 6.0 21 6,7 6.5

Page 10: Estadistica

Ejemplo 7. Una muestra aleatoria de 50 calificaciones de matemáticas de un total de 200, arrojó

una media de 75 y una desviación típica de10. a)¿Cuáles son los límites de confianza del 95% para la estimación de la media de las 200 calificaciones?, b)¿Con qué grado de confianza podrá

decirse que la media de las 200 calificaciones es �v © �? Resolución: a) N=200, n=50, � � �v�����W� = 10 |(¦§ ~ ����� ~ �¦W+ � �H¤

|\¦§ ~ ����� ~ �¦W] � i}v �� � � ���� � i jkl�kl' � ��� ��������� � i jkl�kl' � �� �ª�����l' � i jkl�kl' ��� �� �'����z{ � i j'y�'{{� � ��<w = O bien :

����* � � �(� H �+ W�* � � vL(w}+�(�L+*���� ������� � �Li��

�� ��� � �'�i'��y� � i j*��ly�'{{ = 1.24

¦§ � �� ����) ��e¤< ��� ���� �¦§ � � � ����H ��e¤< ��� Z=1.96 ; e=1.96*1.24= 2.4 ¦§ � ��v���� ) ���i}u t �i<w � ���iwh����� ���¦§ � �v��� H ���i}u t �i<w � ��<iv�� Finalmente: � |\�<iv� ~ ����� ~ ���iwh] � i}v b) � |\�w � �v H � ~ ����� ~ ��u � �v ) �] � i�H¤

e = e ¤* ���5 = 1 ; z= '��� = 0.8 |(HLix ~ e ~ �Lix+ � iLvx<