cuarta
TRANSCRIPT
-
Pgina 1 de 39
UNIDAD ACADMICA No. 04.
Nombre de la Unidad: Distribuciones Mustrales y Estimacin por Intervalos
Introduccin:
Como se mencion en el captulo uno las nociones de poblacin y muestra son parte fundamental en cualquier investigacin , en este capitulo se estudiaran de manera mas amplia, en particular en el contexto del concepto de variables aleatorias, destacando la importancia de conocer la distribucin muestral de un estadgrafo ya que con esta se puede realizar el proceso de inferencia del parmetro, dado que casi nunca es posible tomar todas las muestras de una poblacin , conociendo la distribucin del estimador se puede hacer la inferencia del mismo a partir de una sola muestra , de igual forma se puede estimar el error para un tamao de muestra dado. Objetivo General de la Unidad: En los anteriores captulos se estudiaron las poblaciones y los parmetros que las describen. Estas poblaciones eran discretas o continuas , y se uso la probabilidad como una herramienta para determinar que tan probables podran ser ciertos resultados muestrales . En este captulo, el enfoque cambia ya que estudiaremos muestras y estadsticos que los describen.
Objetivos Especficos del Unidad:
Manejar el concepto del teorema del lmite central.
Comprender y aplicar las distribuciones muestrales de medias , varianzas y proporciones.
Realizar estimaciones por intervalos para la media , proporcin y para la varianza.
RESUMEN En el presente capitulo se describirn las distribuciones mustrales de medias y varianzas en variables cuantitativas, la distribucin muestral de proporciones para variables cualitativas , con las anteriores bases realizar estimaciones por intervalos y su aplicacin en ciencias e Ingeniera.
GLOSARIO
MUESTRA ALEATORIA DE TAMAO n : Es un conjunto de n individuos
tomado de tal manera que cada subconjunto de tamao n de la poblacin
tenga la misma probabilidad de ser elegido como muestra; es decir, si la
-
Pgina 2 de 39
poblacin tiene tamao N, cada una de las combinaciones posibles de n
elementos debe ser equiprobable.
PARAMETROS: Se llama parmetros poblacionales a cantidades que se
obtienen a partir de las observaciones de la variable y sus probabilidades y
que determinan perfectamente la distribucin de esta, as como las
caractersticas de la poblacin, por ejemplo: La media, , la varianza 2, la
proporcin de determinados sucesos, P.
ESTADISTICO: Es una medida cuantitativa, derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir caractersticas de
una poblacin o modelo estadstico.
Desarrollo temtico.
4.1 Teorema del lmite central. 4.2 Distribucin muestral de medias 4.3 Distribucin muestral de la varianza 4.4 Distribucin muestral de las proporciones 4.5 Estimacin por intervalos
4.1 Teorema del limite central.
4.1.1. Error Muestral
Cuando se calcula un estadstico a partir de una muestra llmese media, desviacin estndar o proporcin para estimar parmetros poblacionales siempre conlleva algn error , por ejemplo supongamos que en un grupo de estadstica tenemos 40 estudiantes (poblacin) y promediamos su estatura obtenindose =1,68 m ( Parmetro poblacional) si elegimos una muestra aleatoria de 15 estudiantes y calculamos la media muestral de estaturas obtenindose
mx 72,1 (Estadstico) ,observamos que existe una diferencia entre el parmetro y
el estadstico que denominamos error muestral
04,072,168,1 xe
Ejemplo: Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de cuatro profesores universitarios de matemticas:
-
Pgina 3 de 39
Profesor de matemticas Antigedad
A 16
B 10
C 8
D 26
Si se toman muestras de tamao 2 sin reemplazo. Calcular la media para cada muestra, la media de la distribucin muestral y el error estndar.
1) Se pueden tener 4C2 =6 muestras posibles. La tabla lista todas las muestras posibles de tamao 2, con sus respectivas medias muestrales.
Muestras Antigedad Media Muestral
A,B (16,10) 13
A,C (16,8) 12
A,D (16,26) 21
B,C (10,8) 9
B,D (10,26) 18
D,C (8,26) 17
2) La media poblacional est dada por:
154
2681016
3) La media de la distribucin muestral es:
156
17189211213
x
Con lo cual podemos deducir que :
x
La media poblacional es igual a la media de todas las medias muestrales.
-
Pgina 4 de 39
4) La desviacin estndar de la poblacin est dada por:
N
xn
i
i
1
2
En este caso:
7
4
1526158151015162222
5) El error estndar o la desviacin estndar de la distribucin muestral es:
4,0414519
6
15171518159152115121513222222
x
x
Si utilizamos la frmula del error estndar sin el factor de correccin por poblacin finita tendramos que:
muestraladetamaoelesnDonde
nx
""
Evaluando:
4,94974752
7
x
Como se observa difiere de la desviacin estndar de las medias mustrales calculada. Por lo anterior hay que aplicar el factor de correccin para poblacin finita as:
1
N
nN
nx
-
Pgina 5 de 39
Calculando
4,041451914
24
2
7
x
De lo cual concluimos que la desviacion estandart de las medias muestrales es igual a la desviacion estandart poblacional sobre la raiz del tamao de las muestras por el factor de correccion, en caso de ser poblaciones finitas.
4.1.2. Teorema del limite central1
Si se seleccionan muestras aleatorias de tamao n de una poblacin con media y desviacin estndar , entonces, si n es grande, la distribucin muestral de medias tendr aproximadamente una distribucin normal con una media igual a
y una desviacin estndar de n
x
. La aproximacin ser cada vez
ms exacta a medida de que n sea cada vez mayor.1 1Tomado de : http://www.itch.edu.mx/academic/industrial/estadistica1/u0102.pdf 4.2. Distribucin Muestral de medias Recordemos que en la distribucin normal la variable estandarizada nos permita calcular la probabilidad de un evento dada una variable aleatoria mediante:
lPoblacionadartEsDesviacion
lPoblacionaMedia
AleatoriaVariablex
ladexestaquedartesesdesviaciondeNZ
Donde
xZ
tan
""""tan
Cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la frmula
de la distribucin normal con x
y n
x
, entonces la frmula para
-
Pgina 6 de 39
calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:
muestradeTamaon
lPoblacionadartEsDesviacion
muestralesmediaslasdedartEsDesviacionn
lPoblacionaMedia
MuestralMediax
ladexestaquedartesesdesviaciondeNZ
Donde
xZ
x
x
tan
tan
""""tan
En general se utiliza:
n
xZ
y para poblaciones finitas y muestro con reemplazo:
1
N
nN
n
xZ
Ejemplo: Una empresa elctrica fabrica 1000 focos diarios, que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 900 horas y desviacin estndar de 50 horas. Encuentre la probabilidad de que una muestra aleatoria de 20 focos tenga una vida promedio de:
a) Menos de 890 horas b) Ms de 920 horas c) Entre 850 y 950 horas
-
Pgina 7 de 39
Solucin:
a) Identificamos los elementos
N= 1000
=900
n= 20
= 50
?890 xP
Grficamente:
Al estandarizar
89,011000
201000
20
50
900890
Z
Por lo tanto
89,0890 ZPxP Que en la tabla de la distribucin normal:
%191894,089,0 ZP Con lo que podemos concluir que hay una probabilidad del 19% de que en muestras de
tamao 20 el promedio de la muestra sea menor de 890 horas. En otras palabras si
tomamos 100 muestras de tamao 20 en 19 de estas muestras el promedio ser menor
de 890 horas.
-
Pgina 8 de 39
b)
N= 1000
=900
n= 20
= 50
?920 xP
Estandarizando
1,7711000
201000
20
50
900920
Z
Por lo tanto
77,1920 ZPxP Que en la tabla de la distribucin normal:
%40,03840,9616177,1 ZP
c)
N= 1000
=900
n= 20
= 50
?950850 xP
Estandarizando
-4,4311000
201000
20
50
900850
Z
4,4311000
201000
20
50
900950
Z
-
Pgina 9 de 39
Por lo tanto
43,443,4950850 ZPxP Que en la tabla de la distribucin normal:
%10070,9999905706-4,71165E80,9999952877,1 ZP
4.2.1. Distribucin Muestral para la diferencia de promedios
En la anterior distribucin el cientfico o ingeniero estaba interesado en apoyar una
conjetura de la media con una poblacin , sin embargo en muchas ocasiones el
inters puede ser en dos o mas poblaciones y las diferencias entre ellas , situacin
que podemos resumir asi : si se extraen al azar muestras independientes de
tamaos n1 y n2 de dos poblaciones discretas o continuas , con medias
poblacionales 1 y 2 y desviaciones estndar 1 y 2 respectivamente , entonces
la distribucin muestral para la diferencia de medias estar dada por:
2
2
2
1
2
1
2121
nn
xxZ
Ejemplo:
Dos tipos de pintura ofrecen un tiempo de secado promedio de 80 y 60 minutos
respectivamente con una desviacin estndar de 15 y 13 minutos , si tomamos
muestras aleatorias de tamaos 25 y 36 respectivamente .Encontrar la
probabilidad de que la media muestral calculada de las 25 mediciones exceda la
media muestral de Las 36 mediciones en por lo menos 10 minutos .
Pintura 1
1=80
n1= 25
1= 15
Pintura 2
2=60
n2= 36
2= 13
?1021 xxP
-
Pgina 10 de 39
7,2
36
13
25
15
608010
22
Z
7,21021 ZPxxP Grficamente
Que en la tabla de la distribucin normal:
99,7%0,99650,003517,2 ZP En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la desviacin estndar es de 8 puntos. Cul es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin media en: a. 3 ms puntos. b. 6 o ms puntos. c. Entre 2 y 5 puntos. Grupo 1
1=72
n1= 28
1= 8
Pintura 2
2=72
n2= 36
2= 8
-
Pgina 11 de 39
?321 xxP
36
8
28
8
03
22Z
4.3. Distribucin Muestral de la Varianza Si se extrae una muestra aleatoria de tamao n de una poblacin normal con media , y varianza 2 ,y se calcula la varianza muestral , se obtiene el valor del estadstico s2 que se utilizara para conocer la 2, mediante una variable aleatoria chi cuadrada con n-1 grados de libertad . Formalizando con el siguiente teorema: si s2 es la varianza de una muestra aleatoria de tamao n que se toma de una poblacin normal que tiene varianza 2 entonces el estadstico :
2
22 1
sn
Tiene una distribucin chi cuadrado con 1 nv , grados de libertad. Ejemplo:
Un fabricante de bateras garantiza que su producto dura en promedio 2,5 aos con una desviacin estandart de 0,8 aos . Si se toma una muestra aleatoria de 8
bateras y resulto que 8,2x y 2,1s Tiene razn el fabricante respecto a la desviacin estndar poblacional?
1) Calculamos el estadstico
15,75
8,0
2,1*182
22
2) Si asumimos un 95% de probabilidad central es decir a la izquierda 0,025 y
a la derecha 0,975 , para la afirmacin del fabricante , debemos remitirnos a la distribucin chi cuadrado con v=8-1 = 7 grados de libertad, los valores crticos sern:
-
Pgina 12 de 39
Este ser el valor critico (1,690) a la izquierda , y a la derecha ( 16,013)
-
Pgina 13 de 39
Como el estadgrafo esta dentro de estos valores podemos afirmar con un 95% de confianza que el fabricante tiene la razn en su afirmacin respecto a la varianza
-
Pgina 14 de 39
4.4. Distribucin Muestral de las Proporciones2
Cuando se requiere investigar la proporcin de algn atributo en una muestra (variables cualitativas). La distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y "n" el tamao de la muestra) en lugar del estadstico promedio. La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.
2 Con base a: http://www.itch.edu.mx/academic/industrial/estadistica1/cap01b.html#distribucionmuestral
proporciones
MuestradeTamaon
PQ
lPoblacionaoporcionP
Muestraloporcionp
Donde
n
QP
PpZ
:
1
Pr:
Pr:
:
*
Si es una poblacin finita:
1*
N
nN
n
QP
PpZ
-
Pgina 15 de 39
Ejemplo: La proporcin de hogares en cierta cuidad que usa gas natural es del 45% , si se toma una muestra aleatoria de 250 hogares determinar la probabilidad de que La proporcin de la muestra de hogares con gas natural sea :
a) menor del 40% b) Mayor del 49%
a)
Solucin:
Datos:
n=250 Hogares
45,0
P
?40,0 pP Como se esta aproximando la binomial mediante la normal se debe restar el factor de correccin
npp
5,0
Por lo tanto la formula seria
n
QP
PpZ
*
Evaluando:
65,1
250
)45,01(*45,0
45,0250
5,04,0
Z
65,140,0 ZPpP 5%0,049565,1 ZP
-
Pgina 16 de 39
b)
Solucin:
Datos:
n=250 Hogares
45,0
P
?49,0 pP Como se esta aproximando la binomial mediante la normal se debe sumar el factor de correccin
npp
5,0
Por lo tanto la formula seria
n
QP
PpZ
*
Evaluando:
1,33
250
)45,01(*45,0
45,0250
5,049,0
Z
33,149,0 ZPpP 9%0,09180,9082133,1 ZP
-
Pgina 17 de 39
4.4.1. Distribucin Muestral de Diferencia de Proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes.
El calculo de probabilidad del estadstico de diferencia de proporciones es:
2
22
1
11
2121
**
n
QP
n
QP
PPpp
Z
Ejemplo
Una encuesta de 380 trabajadores de cierta compaa que fueron despedidos entre 1990 y 1999, encontr que 25% haban estado sin trabajo durante por lo menos tres aos. Otra muestra aleatoria de 450 trabajadores de entre todos los empleados despedidos entre 1990 y 1999 arrojo que el 20% haban estado sin trabajo durante por lo menos tres aos . Cul sera la probabilidad de que el porcentaje muestral de trabajadores sin empleo durante por lo menos tres aos, difiera del porcentaje obtenido en la encuesta en 6% o ms?
En este ejemplo solamente contamos con una poblacin de la que se seleccionan dos muestras por lo tanto:
1
P = 0.25
2
P = 0.20
n1 = 380 trabajadores
n2 = 450 trabajadores
?06,021 ppP
-
Pgina 18 de 39
45.0
450
8,0*2,0
380
75,0*25,0
20.025.0
2
450380
5,006,0
Z
45.006,021 ZPppP
3%33264.06736.0145.0 ZP
4.5. Estimacin por intervalos El principal propsito de la presentacin de variables y sus distribuciones mustrales consiste en realizar conclusiones acerca de los parmetros poblacionales, por ejemplo en el teorema del lmite central est incluida la media poblacional que si lo despejamos quedara en trminos de los estadsticos de la muestra , en este aparte se trabajara de manera formal el propsito de la estadstica inferencial para una y dos poblaciones. 4.5.1. Intervalo de confianza
Se define como la medida del grado de fiabilidad de la estimacin en el intervalo. Un intervalo de confianza del 95% indica que el 95% de todas las posibles muestras, la estimacin por ejemplo de una (media poblacional) estara en este intervalo y su complemento 5% de las muestras producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parmetro que se estima est dentro del intervalo.
4.5.2. Estimacin de la media para muestras grandes Consideremos la estimacin por intervalos para la media a partir de una muestra aleatoria grande donde se conoce la desviacin estndar poblacional. El clculo de la probabilidad esta dado por:
n
xZ
Como el parmetro es el que necesitamos para un intervalo de confianza:
-
Pgina 19 de 39
Se puede expresar as:
1
22
ZZZP
Reemplazando el estadstico Z
122
Z
n
xZP
Despejando
EstimaciondeErrorn
Z
PuntualEstimadorx
Donde
nZx
nZx
:
:
2
22
Ejemplo: Una empresa fabricante de focos que tienen duracin aproximadamente distribuida de forma normal, con una desviacin estndar de 50 horas. Si se toma una muestra aleatoria de 45 focos y se obtiene una duracin promedio de 830 horas, Encontrar en un intervalo de confianza del 95% y el 99% , para la media de todas las bombillas que produce la empresa. De qu tamao debe ser la muestra para que el error de estimacin sea de 10 horas en un intervalo de confianza del 95%? Solucin Para el primer intervalo de confianza (95%) tendremos en la distribucin normal:
-
Pgina 20 de 39
Datos =50 horas n=45
830x =?
EstimaciondeError
PuntualEstimadorx
Donde
:61,1445
5096,1
""830:
45
5096,1830
45
5096,1830
InferiorLimite
SuperiorLimite
81539,81561,14830
84561,84461,14830
Interpretacin: Con la evidencia tomada podemos afirmar que el 95% de todas las muestras de tamao 45 la duracin de los focos estar entre 845 y 815 horas. Para el segundo intervalo de confianza (99%)
-
Pgina 21 de 39
EstimaciondeError
PuntualEstimadorx
Donde
:16,1945
5057,2
""830:
45
5057,2830
45
5057,2830
InferiorLimite
SuperiorLimite
81184,81016,19830
84916,84916,19830
El tamao de muestra para un error dado:
EstimaciondeErroree
Donde
nZee
:
2
Despejando n
9604,9610
50*96,1
*
2
2
2
n
Evaluando
ee
Zn
4.5.3. Estimacin de la media para muestras pequeas En la mayora de las situaciones no es fcil acceder a la desviacin estndar poblacional, motivo por el cual si tomamos evidencia y calculamos el promedio y la desviacin estndar muestral (s) de una poblacin que se comporte de forma aproximadamente normal entonces la variable aleatoria:
n
s
xT
Tiene una distribucin t de Student con n-1 grados de libertad. 3La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada
se alcanza en la media 0 Sin embargo, la distribucin t tiene colas ms
amplias que la normal; esto es, la probabilidad de las colas es mayor que en la
-
Pgina 22 de 39
distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar. 3Tomado de: www.itch.edu.mx/academic/industrial/estadistica1/cap03.html De manera similar que con la normal podemos construir un intervalo de confianza as:
1
22
tTtP
Reemplazando el estadstico
122
t
n
s
xtP
Despejando
EstimaciondeErrorn
st
PuntualEstimadorx
Donde
n
stx
n
stx
:
:
2
22
Ejemplo En cierta obra para recibir a satisfaccin una placa de entrepiso la interventora toma muestras del concreto y al fallarlas se obtuvieron los siguientes datos de resistencia a la comprensin:
-
Pgina 23 de 39
xi
3200 3800 2800 3500 2900 3000 3700 2600 3500 3300 2600 2500 3200 2900 3150 2700 3600
Encontrar un intervalo de confianza del 95% para la resistencia media de toda la placa. Adems la interventora establece que si el lmite inferior de la estimacin esta por debajo de 3000 P.S.I. se tendr que demoler la placa. Solucin Calculamos la media aritmtica y la desviacin estndar muestral
3409,177798
23114,70588
s
x
n=17 Los valores crticos para un intervalo de confianza del 95% con v=17-1 =16 grados de libertad sern :
-
Pgina 24 de 39
En la tabla de la distribucin t el valor critico se establece asi:
-
Pgina 25 de 39
La estimacin por intervalos ser:
-
Pgina 26 de 39
39,210
3114,71
17
409,18120,23114,71
17
409,18120,23114,71
EstimaciondeError
PuntualEstimador
Donde
InferiorLimite
SuperiorLimite
290432,290439,21071,3114
332510,332539,21071,3114
Por lo tanto segn los resultados obtenidos hay que demoler la placa. 4.5.4. Estimacin de la proporcin una poblacin
Muchos experimentos o encuestas tienen como propsito estimar las proporciones poblacionales a partir de datos mustrales, recordemos el estadstico para calcular la probabilidad del comportamiento de la proporcin en la muestra.
n
qp
PpZ
*
De la misma manera que en la estimacin de medias para muestras grandes conociendo la desviacin estandart poblacional , para un intervalo de confianza con la distribucin normal la estimacin por intervalos esta dada por:
lPoblacionaoporcionP
EstimaciondeErrorn
qpZ
pq
PuntualEstimadormuestraloporcionp
Donde
n
qpZpP
n
qpZp
Pr:
:*
*
1
Pr:
**
**
2
22
-
Pgina 27 de 39
Ejemplo: En cierta cuidad se selecciona una muestra aleatoria de 500 votantes y se encuentra que 180 aprueban la gestin del alcalde .Encuentre el intervalo de confianza del 96% para la fraccin de la poblacin votante que favorece la gestin del alcalde. De otra parte cual debe ser el tamao de la muestra para que el error de estimacin sea del 2% Solucin:
04,0
64,01
36,0Pr:
500
500
320*
500
180
*05,2500
180
500
500
320*
500
180
*05,2500
180
EstimaciondeError
pq
PuntualEstimadormuestraloporcionp
Donde
P
InferiorLimite
SuperiorLimite
P
%3232,004,036,0
%4040,004,036,0
La aprobacin del alcalde entre la poblacin votante estar entre el 40 y el 32% El tamao de muestra dado el error de estimacin ser:
qpee
Zn **
2
2
Evaluando Es decir se necesita consultar a 2421 personas para que el error de estimacin sea del 2%.
4.5.5. Estimacin de la diferencia entre medias de dos distribuciones normales, varianzas poblacionales desconocidas pero iguales.
En muchos experimentos es necesario comparar dos grupos poblacionales para
tal efecto si 21 ; xx ; s12 y s2
2 son las medias y las varianzas de dos muestras
aleatorias de tamao n1 y n2, respectivamente, tomadas de dos poblaciones
24212420,64
64,0*36,0*02,0
05.22
n
n
-
Pgina 28 de 39
normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 1 por ciento para la diferencia entre medias es:
""2
2
11
:11
*
:
11*
11*
21
21
2
22
2
112
212
21
212
2121
212
21
LibertaddeGradosnnv
nn
snsnS
Con
EstimaciondeErrornn
St
PuntualEstimadorxx
Donde
nnStxx
nnStxx
P
p
pp
Ejemplo:
4Un experimento publicado en una revista cientfica compara las economas en combustible para dos tipos de camiones compactos a disel con similares caractersticas. Se utilizaron 12 camiones Nissan y 10 Toyota en pruebas a velocidad constante , si los camiones Nissan promediaron 16 km/litro, con una desviacin estndar de 1 km/litro y los Toyota promediaron 11 km/litro, con una desviacin estndar de 0,8 km/litro , construya un intervalo de confianza del 95% para la diferencia entre los kilmetros promedio de estos dos camiones compactos .Suponga que las distancias por litro para cada modelo de camin estn distribuidas de forma aproximadamente normal con varianzas iguales.
4Problema Propuesto Pagina 298 ( 9.42) en el libro de : Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
-
Pgina 29 de 39
Solucin:
1
12
16
1
1
s
n
x
Nissan
8,0
10
11
2
2
s
n
x
Toyota
Para establecer el valor critico en el intervalo de confianza dado calculamos los grados de libertad.
2021012
""221
v
LibertaddeGradosnnv
En la tabla el valor crtico es:
086,22
t
La varianza muestral asociada:
90,91542339
0,838
20
8,01101112
2
11
2
22
2
21
2
22
2
112
PS
S
S
nn
snsnS
P
P
P
El intervalo de confianza
""82,011
*
""5
10
1
12
19154,0*086,21116
10
1
12
19154,0*086,21116
11*
11*
212
21
21
212
2121
212
21
EstimaciondeErrornn
St
PuntualEstimadorxx
Donde
nnStxx
nnStxx
p
pp
-
Pgina 30 de 39
InferiorLimite
SuperiorLimite
418,482,05
682,582,05
21
La diferencia de consumo entre los camiones Nissan y Toyota estar entre 4 y 6 kilmetros por litro a favor de Nissan ( ms econmico).
4.5.6. Estimacin de la diferencia entre medias de dos distribuciones normales, varianzas poblacionales desconocidas y diferentes.
Para este caso se compararan dos grupos poblacionales en los cuales su variabilidad con respecto a la medias difiere. El estadstico que se usara es:
2
2
2
1
2
1
2121
n
S
n
S
xxT
Con grados de Libertad:
11 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n
n
s
n
n
s
n
s
n
s
v
Si despejamos del estadstico la diferencia de medias poblacionales la estimacin por intervalos estar dada por:
-
Pgina 31 de 39
LibertaddeGrados
n
n
s
n
n
s
n
s
n
s
v
Con
EstimaciondeErrorn
S
n
St
PuntualEstimadorxx
Donde
n
S
n
Stxx
n
S
n
Stxx
:
11
:
:
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
2
2
2
1
2
1
2
21
2
2
2
1
2
1
22121
2
2
2
1
2
1
221
Ejemplo: 5Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de la B para su flotilla. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 neumticos de cada marca .Los neumticos se utilizan hasta que se desgastan los resultados fueron:
kms
n
kmx
ANeumati
000.5
12
300.36
cos
1
1
1
kms
n
kmx
BNeumati
500.8
12
100.38
cos
2
2
2
Calcule un intervalo de confianza de 95% para la diferencia de medias poblacionales asumiendo que sus varianzas poblacionales son desconocidad y diferentes.
5Problema Propuesto Pagina 298 ( 9.43) en el libro de : Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
-
Pgina 32 de 39
Solucin: Los grados de libertad:
18717,7984730
112
12
8500
112
12
5000
12
8500
12
5000
22
22
222
v
El valor critico en la tabla t para estos grados de libertad.
101,22
t
El intervalo de confianza
""5981,08858
""800.1
2
2
2
1
2
1
2
12
2
2
2
1
2
1
21212
2
2
2
1
2
1
212
EstimaciondeErrorn
S
n
St
PuntualEstimadorxx
Donde
n
S
n
Stxx
n
S
n
Stxx
InferiorLimite
SuperiorLimite
181.4981.5800.1
781.7981.5800.1
21
Con el resultado obtenido podemos concluir que como en el intervalo esta el cero , en la poblacion no hay diferencias entre la duracion de los neumaticos. Esto ocurre cuendo el error de estimacion es mayor que el estimador puntual. 4.5.7. Estimacin por intervalos para observaciones pareadas En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la precisin haciendo comparaciones de observaciones pareadas del material experimental es decir cuando las muestras no son independientes. 6Por ejemplo, considere una compaa de taxis que trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturn mejora la economa de combustible. Se equipan 16 automviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los
-
Pgina 33 de 39
mismos autos con llantas regulares con cinturn y se manejan una vez ms por el recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por litro, de la siguiente manera:
Automvil Llantas radiales Llantas con cinturn
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
Para determinar cual ser la diferencia en el consumo de gasolina en la poblacin de llantas radiales y con cinturn tendremos:
6Similar al propuesto en la pagina 360 (10.43) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
-
Pgina 34 de 39
n
Std
n
Std DD
D
22
Donde ecombustibldeeconomialaenpoblacionlaparasdiferencialasdeMediaD
La notacin de D es para recordar que la muestra pareada produce datos de diferencia . La media y la desviacin estandart de la muestra esta dada por:
n
d
d
n
i
i 1 Media de las diferencias
1
1
2
n
dd
S
n
i
i
D Desviacin Estandart para la diferencia de medias
Si suponemos que la poblacin tiene distribucin normal , se puede aplicar la distribucin t con n-1 grados de libertad Evaluando en este caso tenemos:
Automvil
Llantas
radiales
Llantas con
cinturn
1 4,2 4,1 0,1 0,000976562 4,7 4,9 -0,2 0,10972656
3 6,6 6,2 0,4 0,072226564 7 6,9 0,1 0,000976565 6,7 6,8 -0,1 0,053476566 4,5 4,4 0,1 0,000976567 5,7 5,7 0 0,017226568 6 5,8 0,2 0,004726569 7,4 6,9 0,5 0,1359765610 4,9 4,9 0 0,0172265611 6,1 6 0,1 0,0009765612 5,2 4,9 0,3 0,0284765613 5,7 5,3 0,4 0,0722265614 6,9 6,5 0,4 0,07222656
15 6,8 7,1 -0,3 0,1859765616 4,9 4,8 0,1 0,00097656
Sumas 2,1 0,774375
id 2dd i
13125.016
1.21
n
d
d
n
i
i
2272.0
116
477375.0
1
1
2
n
dd
S
n
i
i
D
-
Pgina 35 de 39
El valor critico para v=16-1=15 grados de libertad
131,22
t
La estimacin
16
23,0131,213,0
16
23,0131,213,0 D
InferiorLimite
SuperiorLimite
D
12,025,013,0
38,025,013,0
De acuerdo al resultado, podemos afirmar que no existe diferencia en el consumo de gasolina por el hecho de usar llantas radiales con cinturn. 4.5.8. Estimacin por intervalos para la varianza Para este caso se usara la distribucin chi cuadrado que no es simtrica por lo tanto los valores crticos son diferentes por ejemplo para 24 grados de libertad con un intervalo de confianza de 95% sus valores son :
El intervalo de confianza esta dado por :
2
2
22
2
21
2 11
snsn
Ejemplo ( Tomado de Walpole Myers Pagina 307) , Probabilidad y Estadstica para Ingeniera y Ciencias , Octava edicin , Editorial Pearson)
Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compaa, suponga una poblacin normal.
Solucin:
Primero se calcula la desviacin estndar de la muestra:
-
Pgina 36 de 39
al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.
Para obtener un intervalo de confianza de 95% se elige un = 0.05. Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:
-
Pgina 37 de 39
Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
4.6 Autoevaluacin
1) Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye
normalmente con media de 2000 libras y una varianza de 25,000 lbs2. Si se
selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidad
de que en esa muestra: La resistencia media encontrada sea de por lo
menos 1958 libras.
Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
2) En una prueba de aptitud la puntuacin media de los estudiantes es de 72
puntos y la desviacin estndar es de 8 puntos. Cul es la probabilidad de
que dos grupos de estudiantes, formados de 28 y 36 estudiantes,
respectivamente, difieran en su puntuacin media en 3 ms puntos.
Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
3) Un especialista en gentica ha detectado que el 26% de los hombres y el
24% de las mujeres de cierta regin del pas tiene un leve desorden
sanguneo; si se toman muestras de 150 hombres y 150 mujeres, determine
la probabilidad de que la diferencia muestral de proporciones que tienen ese
leve desorden sanguneo sea de Menos de 0.035 a favor de los hombres.
Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
4) La vida media de una mquina para hacer pasta es de siete aos, con una
desviacin estndar de un ao. Suponga que las vidas de estas mquinas
siguen aproximadamente una distribucin normal, encuentre La probabilidad
de que la vida media de una muestra aleatoria de 9 de estas mquinas sea
mayor de 6.4 aos.
Problema propuesto ( Pagina 252 8.25 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
5) La vida media de una mquina para hacer pasta es de siete aos, con una desviacin estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente una distribucin normal, encuentre el valor de la a la derecha del cual caera el 15% de las medias calculadas de muestras aleatorias de tamao nueve.
-
Pgina 38 de 39
6) Se llevan a cabo dos experimentos independientes en lo que se comparan
dos tipos diferentes de pintura. Se pintan 18 especmenes con el tipo A y en
cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el
tipo B. Se sabe que las desviaciones estndar de la poblacin son ambas
1.0. Suponga que el tiempo medio de secado es igual para los dos tipo de
pintura. Encuentre la probabilidad de que la diferencia de medias en el
tiempo de secado sea mayor a uno a favor de la pintura A.
Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
7) Una muestra de 6 latas de sopa producidas por dos compaas produjo los siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8 Compaa "A"
12.9 11.8 12.0 12.3 12.8 12.0 Compaa "B"
Si se supone normalidad en los pesos, construya un intervalo de confianza del 95% para la diferencia de los pesos promedio de todas las latas de sopa producidas por las compaas, suponga varianzas poblacionales diferentes y desconocidas.
Similar al planteado en :
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03e.html
8) Los siguientes datos registrados en das, representan el tiempo de recuperacin para pacientes que se tratan al azar con uno de los medicamentos para curar infecciones graves de la vejiga:
Medicamento 1 Medicamento 2
n1 = 14 n2 = 16
x1 = 17 x2 = 19
s12 = 1.5 s22 = 1.8
-
Pgina 39 de 39
Encuentre un intervalo de confianza de 99% para la diferencia promedio en el tiempo de recuperacin para los dos medicamentos, suponga poblaciones normales con varianzas iguales.
Problema propuesto ( Pagina 297 9.41 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
9) Cierto genetista se interesa en la proporcin de hombres y mujeres en la poblacin que tienen cierto trastorno sanguneo menor. En una muestra aleatoria de 1000 hombres se encuentra que 250 lo padecen, calcule un intervalo de confianza del 95% para la proporcin entre la poblacin de de hombres que padecen el trastorno sanguneo.
Problema propuesto ( Pagina 305 9.65 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007
10)Una muestra de 12 latas de sopa producida por cierta compaa produjo los siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8 11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza del 95% para la varianza de todas las latas de sopa producidas por la compaa.
3.6 REFERENCIAS BIBLIOGRFICAS
Probabilidad y Estadstica para Ingeniera y Ciencias , Walpole , Myres ,
Myres Ye .Steven, Octava Edicin , Pearson Educacion 2007. p 1-28.
Apuntes de Clase Probabilidad y Estadstica, Ing. Nstor Humberto Agudelo
Daz. 1998-2013.