inferencia basada en dos muestras
Post on 04-Jul-2022
4 Views
Preview:
TRANSCRIPT
Inferencia basada en
dos muestras
Inferencia basada en dos muestras
Hay dos muestras:
m1={X11, X21,…, Xn1}
m2={X12, X22,…, Xn2}
Cada muestra proviene de una
población
Ejemplos
Comparar el contenido de ácidos
grasos en semillas de dos variedades
distintas.
Comparar el aumento de peso en
animales alimentados con dos pasturas
diferentes.
Comparar el efecto de dos dosis de un
fungicida.
Ejemplos
Comparar los porcentajes de preñez
bajo dos protocolos de inseminación
artificial.
Comparar los porcentajes de lecturas
positivas para una virosis en pruebas
Elisa estándar y DAS-Elisa.
Inferencia basada en dos
muestras
El objetivo de la inferencia puede ser:
Estimar la diferencia entre las
medias de las poblaciones (1-2) de
las cuales proceden las muestras
Contrastar hipótesis sobre ladiferencia (1-2)
Inferencia basada en dos muestras
Si el contraste es bilateral:
0 1 2: = 0 H
1 1 2 : 0 H
Inferencia basada en dos muestras
0 1 2 1 1 2: vs. : H H
Si el contraste es unilateral derecho:
0 1 2 1 1 2: vs. : H H
Si el contraste es unilateral izquierdo:
Muestras independientes
Inferencia basada en dos muestras
Varianzas poblacionales
conocidas
Varianzas poblacionales desconocidas
varianzas iguales
varianzas diferentes
Muestras dependientes
El estadístico a usar en el contraste de medias depende de:
La naturaleza de las muestras
Si se conocen las varianzas poblacionales
Si las varianzas poblacionales son iguales o diferentes
Inferencia basada en dos muestras
Inferencia basada en dos muestras
Muestras independientes
Varianzas poblacionales conocidas
1 2 1 2
2 2
1 2
1 2
~ (0,1)X X
Z N
n n
La inferencia se basa en el estadístico:
usualmente las varianzas son desconocidas
Inferencia basada en dos muestras
Muestras independientes
Varianzas poblacionales desconocidas
¿Cómo son las varianzas poblacionales?¿Son iguales o diferentes?
2 2
1 1 2 :H
2 2
0 1 2: H
Inferencia basada en dos muestras
Muestras independientes: Varianzas
poblacionales desconocidas e iguales
1 2
1 2 1 2
2
2
1 2
~1 1
n n
p
X XT T
Sn n
2 2
2 1 1 2 2
1 2
( 1) ( 1)
2p
n S n SS
n n
La inferencia acerca de las medias se basa en el estadístico:
Prueba T para muestras independientes cuando las varianzas son homogéneas
Intervalo de confianza bilateral para la diferencia de medias está dado por:
1 2
2
1 2 (1 / 2) ; 2
1 2
1 1n n px x t s
n n
Muestras independientes: Varianzas
poblacionales desconocidas e iguales
Inferencia basada en dos muestras
Inferencia basada en dos muestras
Muestras independientes: Varianzas
poblacionales desconocidas diferentes
1 2 1 2
2 2
1 2
1 2
~ v
X XT t
S S
n n
La inferencia acerca de las medias se basa en el estadístico:
22 2
1 2
1 2
2 22 2
1 2
1 2
1 2
2
1 1
S Sn n
S Sn n
n n
Prueba T para muestras independientes cuando las varianzas no son homogéneas
Intervalo de confianza bilateral 1- para la diferencia de medias :
2 2
1 2
1 2 (1 / 2) ;
1 2
s sx x t
n n
Caso Normal-Muestras independientes
Muestras independientes: Varianzas
poblacionales desconocidas diferentes
Ejemplo
Se desea determinar si al usar fertilizaciónnitrogenada en maíz, se modifica elpromedio del peso del grano. Se realiza unensayo en el cual se aplica fertilización a 24parcelas experimentales y otras 24 parcelasno se fertilizan. Al finalizar el ensayo seregistran los valores de la variable enestudio, en mg.
Las hipótesis propuestas son
H0: 1= 2 vs H1: 1 2
Ejemplo
Los resultados del ensayo son los siguientes:
Fertilización n S2
Con fertilizante
24 311.00 1953.25
Sin fertilizante
24 261.98 1722.82
X
¿Las varianzas poblacionales son iguales o
diferentes?
Inferencia basada en dos muestras
2 2
1 1 2 :H
2 2
0 1 2: H
1 2
2
1
( 1, 1)2
2
~ n n
sF F
s
EstadísticoHipótesis
1953.951.13
1722.82F
Bajo H0 se
distribuye como
una F con 23 y 23
grados de libertad
Inferencia basada en dos muestras
Contraste para la homogeneidad de varianzas
Prueba F
La región de aceptación para un nivel de significación del 5% está delimitada por 0.43 y 2.31, correspondientes a los cuantiles /2 y (1 - /2) respectivamente
0.00 0.21 0.42 0.63 0.84 1.04 1.25 1.46 1.67 1.88 2.09 2.30 2.51 2.72 2.93 3.13 3.34 3.55
Variable
0.0
0.3
0.5
0.8
1.0
De
nsid
ad
Función de densidad
F de Snedecor(23,23,0): p(evento)=0.0500
Tabla F
25 0.001 0.025 0.050 0.950 0.975 0.990
1 0.0721 0.1759 0.2358 249.260 998.087 6239.86
2 0.1084 0.2330 0.2954 19.4557 39.4575 99.4587
23 0.2712 0.4434 0. 5066 1.9963 2.2871 2.6857
Ejemplo
Como F=1.13 está en el intervalo
(0.43; 2.31) se acepta H0: 12= 2
2
Se concluye que no hay diferencias entre
las varianzas poblacionales.
Se cumple el supuesto de homogeneidad
de varianzas
Prueba T
1 2
1 2 1 2
2
2
1 2
~1 1
n n
p
X XT T
Sn n
Reemplazando:
Prueba T
311 261.98 03.96
1 11838.385
24 24
T
2 (23) 1953.95 (23) 1722.821838.385
24 24 2pS
Prueba T
La región de aceptación para un nivel de significación del 5% está delimitada por -2.013 y 2.013, correspondientes a los cuantiles /2 y (1 -/2) respectivamente y 46 grados de libertad
-5.11 -4.09 -3.07 -2.04 -1.02 0.00 1.02 2.04 3.07 4.09 5.11
Variable
0.00
0.10
0.20
0.30
0.40
De
nsid
ad
Función de densidad
T Student(46): p(evento)=0.0500
Prueba T
Como T=3.96 no pertenece al intervalo
(-2.013; 2.013) se rechaza H0: 1= 2
El intervalo de confianza [24.11;73.94]
construido con una confianza del 95%
incluye al verdadero valor de la diferencia
entre las medias
Se concluye que hay diferencias entre las
medias.
En un estudio para analizar la evolución de tubérculos almacenados, se deseaba comparar dos épocas de cosecha: Abril y Agosto, las que determinan diferen-tes periodos de almacenamiento.La variable en estudio fue la pérdida de peso por deshidratación (en gr).El archivo Época contiene las observa-ciones del estudio.
Prueba T para muestras independientes
Ejemplo para uso de software
Muestras dependientes
Los datos se obtienen de muestrasque están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo.
Inferencia basada en dos muestras
Ejemplo -Muestras dependientes
Se quiere comparar el efecto de dos virus sobre plantas de tabaco.
Se seleccionaron al azar 8 plantas y en cada una de ellas se tomaron 2 hojas apicales.
Sobre cada hoja se aplicaron los preparados conteniendo los virus cuyos efectos se querían evaluar.
La variable de respuesta fue la superficie en mm2 de las lesiones locales que aparecían como pequeñas manchas oscuras en las hojas.
Ejemplo
X X d
Preparado 1 Preparado 2 di
31 18 13
20 17 3
18 14 4
17 11 6
9 10 -1
8 7 1
10 5 5
7 6 1
1= 15 2 = 11 = 4
0 1 2: = 0 H
1 1 2 : 0 H
0 : = 0 H
1 : 0 H
o bien:
Caso Normal-Muestras dependientes
La inferencia se basa en el siguiente
estadístico, que depende de la media y la
varianza de las diferencias y del valor
hipotetizado para el promedio poblacional de
las diferencias ()
1
2~ n
D
DT t
S
n
Caso Normal-Muestras dependientes
La prueba de hipótesis para la diferencia de medias basada en este estadístico se conoce como prueba T para muestras apareadas.
Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:
2
(1 / 2); 1D
n
SD t
n
Ejemplo
2
4 02.63
4.30
8D
DT
S
n
Fijando = 0.05, la región de aceptación
es el intervalo (t/2=-2.365 , t1- /2= 2.365),
con 7 grados de libertad
Ejemplo
Como T=2.63 es mayor que t1- /2= 2.365,
se rechaza H0: 1= 2
Se concluye que las diferencias observadas
entre las áreas dañadas por uno u otro
virus son estadísticamente significativas.
Para estudiar el efecto de la polini-zación sobre el peso promedio de lassemillas obtenidas, se efectuó unexperimento sobre 10 plantas. Lamitad de cada planta fue polinizada yla otra mitad no. Se pesaron lassemillas de cada mitad por separado,registrándose de cada planta un par de observaciones. El archivo Poliniza con-tiene los valores registrados
Prueba T para muestras apareadas
Ejemplo para uso de software
Muestras
Normales
Independientes Apareadas
Varianzas
Homogéneas
Varianzas
Heterogéneas
Prueba T Prueba T’
Prueba T para
observacionesapareadas
Resumen
top related