inferencia basada en dos muestras

Post on 04-Jul-2022

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Inferencia basada en

dos muestras

Inferencia basada en dos muestras

Hay dos muestras:

m1={X11, X21,…, Xn1}

m2={X12, X22,…, Xn2}

Cada muestra proviene de una

población

Ejemplos

Comparar el contenido de ácidos

grasos en semillas de dos variedades

distintas.

Comparar el aumento de peso en

animales alimentados con dos pasturas

diferentes.

Comparar el efecto de dos dosis de un

fungicida.

Ejemplos

Comparar los porcentajes de preñez

bajo dos protocolos de inseminación

artificial.

Comparar los porcentajes de lecturas

positivas para una virosis en pruebas

Elisa estándar y DAS-Elisa.

Inferencia basada en dos

muestras

El objetivo de la inferencia puede ser:

Estimar la diferencia entre las

medias de las poblaciones (1-2) de

las cuales proceden las muestras

Contrastar hipótesis sobre ladiferencia (1-2)

Inferencia basada en dos muestras

Si el contraste es bilateral:

0 1 2: = 0 H

1 1 2 : 0 H

Inferencia basada en dos muestras

0 1 2 1 1 2: vs. : H H

Si el contraste es unilateral derecho:

0 1 2 1 1 2: vs. : H H

Si el contraste es unilateral izquierdo:

Muestras independientes

Inferencia basada en dos muestras

Varianzas poblacionales

conocidas

Varianzas poblacionales desconocidas

varianzas iguales

varianzas diferentes

Muestras dependientes

El estadístico a usar en el contraste de medias depende de:

La naturaleza de las muestras

Si se conocen las varianzas poblacionales

Si las varianzas poblacionales son iguales o diferentes

Inferencia basada en dos muestras

Inferencia basada en dos muestras

Muestras independientes

Varianzas poblacionales conocidas

1 2 1 2

2 2

1 2

1 2

~ (0,1)X X

Z N

n n

La inferencia se basa en el estadístico:

usualmente las varianzas son desconocidas

Inferencia basada en dos muestras

Muestras independientes

Varianzas poblacionales desconocidas

¿Cómo son las varianzas poblacionales?¿Son iguales o diferentes?

2 2

1 1 2 :H

2 2

0 1 2: H

Inferencia basada en dos muestras

Muestras independientes: Varianzas

poblacionales desconocidas e iguales

1 2

1 2 1 2

2

2

1 2

~1 1

n n

p

X XT T

Sn n

2 2

2 1 1 2 2

1 2

( 1) ( 1)

2p

n S n SS

n n

La inferencia acerca de las medias se basa en el estadístico:

Prueba T para muestras independientes cuando las varianzas son homogéneas

Intervalo de confianza bilateral para la diferencia de medias está dado por:

1 2

2

1 2 (1 / 2) ; 2

1 2

1 1n n px x t s

n n

Muestras independientes: Varianzas

poblacionales desconocidas e iguales

Inferencia basada en dos muestras

Inferencia basada en dos muestras

Muestras independientes: Varianzas

poblacionales desconocidas diferentes

1 2 1 2

2 2

1 2

1 2

~ v

X XT t

S S

n n

La inferencia acerca de las medias se basa en el estadístico:

22 2

1 2

1 2

2 22 2

1 2

1 2

1 2

2

1 1

S Sn n

S Sn n

n n

Prueba T para muestras independientes cuando las varianzas no son homogéneas

Intervalo de confianza bilateral 1- para la diferencia de medias :

2 2

1 2

1 2 (1 / 2) ;

1 2

s sx x t

n n

Caso Normal-Muestras independientes

Muestras independientes: Varianzas

poblacionales desconocidas diferentes

Ejemplo

Se desea determinar si al usar fertilizaciónnitrogenada en maíz, se modifica elpromedio del peso del grano. Se realiza unensayo en el cual se aplica fertilización a 24parcelas experimentales y otras 24 parcelasno se fertilizan. Al finalizar el ensayo seregistran los valores de la variable enestudio, en mg.

Las hipótesis propuestas son

H0: 1= 2 vs H1: 1 2

Ejemplo

Los resultados del ensayo son los siguientes:

Fertilización n S2

Con fertilizante

24 311.00 1953.25

Sin fertilizante

24 261.98 1722.82

X

¿Las varianzas poblacionales son iguales o

diferentes?

Inferencia basada en dos muestras

2 2

1 1 2 :H

2 2

0 1 2: H

1 2

2

1

( 1, 1)2

2

~ n n

sF F

s

EstadísticoHipótesis

1953.951.13

1722.82F

Bajo H0 se

distribuye como

una F con 23 y 23

grados de libertad

Inferencia basada en dos muestras

Contraste para la homogeneidad de varianzas

Prueba F

La región de aceptación para un nivel de significación del 5% está delimitada por 0.43 y 2.31, correspondientes a los cuantiles /2 y (1 - /2) respectivamente

0.00 0.21 0.42 0.63 0.84 1.04 1.25 1.46 1.67 1.88 2.09 2.30 2.51 2.72 2.93 3.13 3.34 3.55

Variable

0.0

0.3

0.5

0.8

1.0

De

nsid

ad

Función de densidad

F de Snedecor(23,23,0): p(evento)=0.0500

Tabla F

25 0.001 0.025 0.050 0.950 0.975 0.990

1 0.0721 0.1759 0.2358 249.260 998.087 6239.86

2 0.1084 0.2330 0.2954 19.4557 39.4575 99.4587

23 0.2712 0.4434 0. 5066 1.9963 2.2871 2.6857

Ejemplo

Como F=1.13 está en el intervalo

(0.43; 2.31) se acepta H0: 12= 2

2

Se concluye que no hay diferencias entre

las varianzas poblacionales.

Se cumple el supuesto de homogeneidad

de varianzas

Prueba T

1 2

1 2 1 2

2

2

1 2

~1 1

n n

p

X XT T

Sn n

Reemplazando:

Prueba T

311 261.98 03.96

1 11838.385

24 24

T

2 (23) 1953.95 (23) 1722.821838.385

24 24 2pS

Prueba T

La región de aceptación para un nivel de significación del 5% está delimitada por -2.013 y 2.013, correspondientes a los cuantiles /2 y (1 -/2) respectivamente y 46 grados de libertad

-5.11 -4.09 -3.07 -2.04 -1.02 0.00 1.02 2.04 3.07 4.09 5.11

Variable

0.00

0.10

0.20

0.30

0.40

De

nsid

ad

Función de densidad

T Student(46): p(evento)=0.0500

Prueba T

Como T=3.96 no pertenece al intervalo

(-2.013; 2.013) se rechaza H0: 1= 2

El intervalo de confianza [24.11;73.94]

construido con una confianza del 95%

incluye al verdadero valor de la diferencia

entre las medias

Se concluye que hay diferencias entre las

medias.

En un estudio para analizar la evolución de tubérculos almacenados, se deseaba comparar dos épocas de cosecha: Abril y Agosto, las que determinan diferen-tes periodos de almacenamiento.La variable en estudio fue la pérdida de peso por deshidratación (en gr).El archivo Época contiene las observa-ciones del estudio.

Prueba T para muestras independientes

Ejemplo para uso de software

Muestras dependientes

Los datos se obtienen de muestrasque están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo.

Inferencia basada en dos muestras

Ejemplo -Muestras dependientes

Se quiere comparar el efecto de dos virus sobre plantas de tabaco.

Se seleccionaron al azar 8 plantas y en cada una de ellas se tomaron 2 hojas apicales.

Sobre cada hoja se aplicaron los preparados conteniendo los virus cuyos efectos se querían evaluar.

La variable de respuesta fue la superficie en mm2 de las lesiones locales que aparecían como pequeñas manchas oscuras en las hojas.

Ejemplo

X X d

Preparado 1 Preparado 2 di

31 18 13

20 17 3

18 14 4

17 11 6

9 10 -1

8 7 1

10 5 5

7 6 1

1= 15 2 = 11 = 4

0 1 2: = 0 H

1 1 2 : 0 H

0 : = 0 H

1 : 0 H

o bien:

Caso Normal-Muestras dependientes

La inferencia se basa en el siguiente

estadístico, que depende de la media y la

varianza de las diferencias y del valor

hipotetizado para el promedio poblacional de

las diferencias ()

1

2~ n

D

DT t

S

n

Caso Normal-Muestras dependientes

La prueba de hipótesis para la diferencia de medias basada en este estadístico se conoce como prueba T para muestras apareadas.

Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:

2

(1 / 2); 1D

n

SD t

n

Ejemplo

2

4 02.63

4.30

8D

DT

S

n

Fijando = 0.05, la región de aceptación

es el intervalo (t/2=-2.365 , t1- /2= 2.365),

con 7 grados de libertad

Ejemplo

Como T=2.63 es mayor que t1- /2= 2.365,

se rechaza H0: 1= 2

Se concluye que las diferencias observadas

entre las áreas dañadas por uno u otro

virus son estadísticamente significativas.

Para estudiar el efecto de la polini-zación sobre el peso promedio de lassemillas obtenidas, se efectuó unexperimento sobre 10 plantas. Lamitad de cada planta fue polinizada yla otra mitad no. Se pesaron lassemillas de cada mitad por separado,registrándose de cada planta un par de observaciones. El archivo Poliniza con-tiene los valores registrados

Prueba T para muestras apareadas

Ejemplo para uso de software

Muestras

Normales

Independientes Apareadas

Varianzas

Homogéneas

Varianzas

Heterogéneas

Prueba T Prueba T’

Prueba T para

observacionesapareadas

Resumen

top related