guia estadistica inferencial 2
TRANSCRIPT
ESCUELA POLITÉCNICA DEL EJÉRCITO
DEPARTAMENTO DE
CIENCIAS HUMANAS Y SOCIALES
CARRERA DE
EDUCACIÓN INFANTIL
MATERIA
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA INFERENCIAL
SEGUNDA GUIA Actividad de aprendizaje 2.1.
EJERCICIO 1
En una muestra de 15 hombres adultos se encontró una estatura media de 165
cm con una desviación estándar de 6.3 cm. En una muestra de 17 mujeres
adultas se halló una estatura media de 158 cm con una desviación estándar de
6.1 cm. ¿Es diferente la estatura media de los hombres que la de las mujeres?
α = 0.01.
DATOS
= 15
= 165 = 6,3
= 17
= 158 = 6,1
1. HIPÓTESIS =
=
(
)
=
(
)
2. DISTRIBUCIÓN MUESTRAL
√( )
( )
√
√( ) ( )
√
( )( )
√( )( ) ( )( )
√
√
√
√
√
√ √
( )( )
3. NIVEL DE SIGNIFICANCIA 2 colas
Situación crítica de la prueba = 4. OBSERVACIÓN
5. DECISIÓN DE RECHAZO
|
3,190 2,750
Se rechaza
6. INTERPRETACIÓN Con el 99% de certeza se dice que es diferente la estatura media entre hombres y mujeres.
EJERCICIO 2
En una investigación sobre la efectividad de un jabón antibacterial que
se utiliza para reducir la contaminación en las salas de operaciones, se
obtuvieron los datos siguientes obtenidos al probar el jabón en una
muestra de ocho salas de operaciones de los hospitales de una ciudad. A
mayor puntaje, mayor grado de contaminación.
Sala de operaciones___________________
A B C D E F G H
----------------------------------------------------------------
Antes 6.6 6.5 9.0 10.3 11.2 8.1 6.3 11.6
Después 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0
Al nivel de significancia 0.05. ¿Se puede concluir que la contaminación
disminuyó después de usar el nuevo jabón?
Especificaciones Cálculos
número del
individuo
(A) Antes
(B) Después
D Diferencia = B - A
( )
( )
A 6,6 6,8 0,2 -2,9125 8,482656
B 6,5 2,4 -4,1 -7,2125 52,02016
C 9 7,4 -1,6 -4,7125 22,20766
D 10,3 8,5 -1,8 -4,9125 24,13266
E 11,2 8,1 -3,1 -6,2125 38,59516
F 8,1 6,1 -2 -5,1125 26,13766
G 6,3 3,4 -2,9 -6,0125 36,15016
H 11,6 2 -9,6 -12,7125 161,6077
total -24,9 -49,8 369,3338
-3,1125
1. HIPÓTESIS
=
=
2. DISTRIBUCIÓN MUESTRAL
√
= √ ( )
= √
= √
=7,26
√
√
3. NIVEL DE SIGNIFICANCIA
1 cola
Situación crítica de la prueba =
4. OBSERVACIÓN Efecto de la prueba: = -3,1125 de la escala de sensibilidad Estadístico de prueba
5. DECISIÓN DE RECHAZO
Se acepta
6. INTERPRETACIÓN
Con el 95% de certeza se puede concluir que la contaminación no disminuyó después de usar el nuevo jabón
Actividad de aprendizaje 2.2. EJERCICIO 1
Un médico especialista en el control de peso recomienda 3 dietas. Como
experimento, seleccionó aleatoriamente a 15 pacientes y asignó 5 pacientes a
cada dieta. Después de tres semanas se registraron las siguientes pérdidas de
peso (en lbs.). Con un nivel de significancia de 0.05 ¿puede concluirse que hay
alguna diferencia, entre las 3 dietas, en la pérdida media de peso perdido?
Dieta A B C 5 6 7 7 7 8 4 7 9 5 5 8 4 6 9
A B C
( )
( )
(
)
5 6 7 2,151111 0,2177778 0,2844444 0 -0,2 -1,2 0 0,04 1,44 10,7555556
7 7 8 0,284444 0,2844444 2,3511111 2 0,8 -0,2 4 0,64 0,04 0,35555556
4 7 9 6,084444 0,2844444 6,4177778 -1 0,8 0,8 1 0,64 0,64 15,0222222
5 5 8 2,151111 2,1511111 2,3511111 0 -1,2 -0,2 0 1,44 0,04
4 6 9 6,084444 0,2177778 6,4177778 -1 -0,2 0,8 1 0,04 0,64
5 6,2 8,2 16,75556 3,1555556 17,822222 0 0 0 6 2,8 2,8 26,1333333
1. HIPÓTESIS
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
2. DISTRIBUCIÓN MUESTRAL
3. NIVEL DE SIGNIFICANCIA
4. OBSERVACIÓN
Efectos de Prueba:
Primero se calcula las medias y la variación total. Media Total
Medias Grupales
Variación total:
( )
Segundo, calcula los efectos principales
Efecto principal para Dieta A
( )
=−1,466
Efecto principal para Dieta B
( )
Efecto principal para Dieta C
( )
Tercero calcula la suma de cuadrados entre los grupos y
dentro de los grupos
Suma de cuadrados entre grupos
( )
[( )( )]
Suma de cuadrados dentro de los grupos
Cuarto, calcula las varianzas de los cuadrados medios
(utilizando los grados de libertad)
Varianza del cuadrado medio entre grupos
Varianza del cuadrado medio dentro de los grupos
Quinto, calcula el estadístico de prueba
Se realiza un resumen en una tabla de fuentes de variación
Fuente de variacion
SC
gl
Varianza de los
cuadrados medios: CM=
SC/gl
Entre grupos
Dentro de grupos
Total
2,695
5. DECISIÓN DE RECHAZO
Se rechaza 6. INTERPRETACIÓN
Puede concluirse con el 95% de confianza que hay diferencia, entre las 3 dietas para la pérdida de peso.
EJERCICIO 2
Al investigar sobre los peligros de la cafeína, un investigador agrega dos tipos de
cafeína (la que se encuentra en el café y la que se encuentra en el chocolate) al
suministro de agua de grupos de ratas criadas en laboratorio. Por lo general esta
especie sobrevive cerca de 13 meses. El suministro de agua del grupo de control de
ratas no fue alterado con cafeína. ¿Afecta la cafeína el tiempo de vida de las ratas?
Probar la hipótesis con los siguientes datos. Asumir la igualdad de varianzas
poblacionales. = 0.01.
Grupo de tratamiento Días que vivió la rata
Cafeína de café: 398, 372, 413, 419, 408, 393
Cafeína de chocolate: 401, 389, 413, 396, 406, 378
Control (sin cafeína): 412, 386, 394, 409, 415, 384
A B C
398 401 412 1,4938 3,1605 163,271605 -2,5 3,8333 12 6,25 14,6944 144 9,7963
372 389 386 741,049 104,4938 174,82716 -28,5 -8,1667 -14 812,25 66,6944 196 25,3519
413 413 394 189,8272 189,8272 27,2716049 12,5 15,8333 -6 156,25 250,6944 36 3,6296
419 396 409 391,1605 10,3827 95,6049383 18,5 -1,1667 9 342,25 1,3611 81
408 406 415 77,0494 45,9383 248,938272 7,5 8,8333 15 56,25 78,0278 225
393 378 384 38,7160 450,3827 231,716049 -7,5 -19,1667 -16 56,25 367,3611 256
2403 2383 2400 1439,2963 804,1852 941,6296 0 0 0 1429,5 778,8333 938 38,7778
1) HIPÓTESIS a. ( ) ( ) ( ) ( )
b. ( ) ( ) ( ) ( )
2) DISTRIBUCIÓN MUESTRAL
3) NIVEL DE SIGNIFICANCIA
4) OBSERVACIÓN
Efectos de Prueba:
Primero se calcula las medias y la variación total. Media Total
Medias Grupales
Variación total:
( )
Segundo, calcula los efectos principales
Efecto principal para Café
( )
=1,278
Efecto principal para Chocolate
( )
Efecto principal para Sin cafeína
( )
Tercero calcula la suma de cuadrados entre los grupos y
dentro de los grupos
Suma de cuadrados entre grupos
( )
[( )( )]
Suma de cuadrados dentro de los grupos
Cuarto, calcula las varianzas de los cuadrados medios
(utilizando los grados de libertad)
Varianza del cuadrado medio entre grupos
Varianza del cuadrado medio dentro de los grupos
Quinto, calcula el estadístico de prueba
Se realiza un resumen en una tabla de fuentes de variación
Fuente de variacion
SC
gl
Varianza de los cuadrados
medios: CM=
SC/gl
Entre grupos
Dentro de grupos
Total
187,3594
5) DECISIÓN DE RECHAZO
Se acepta
6) INTERPRETACIÓN
Puede concluirse con el 99% de confianza que no afecta la cafeína en la vida
de las ratas.
Actividad de aprendizaje 2.3.
EJERCICIO 1
De 64 médicos y 89 pacientes encuestados, 36 médicos y 52 pacientes se
pronunciaron a favor de un seguro médico de cobertura universal en lugar del
actual sistema médico diversificado. Construir una tabla cruzada. Probar la
hipótesis de que existe una relación entre el estatus médico-paciente y el tipo
de sistema de seguro médico preferido. α= 0.05.
A favor En contra total
Médicos 36 28 64
pacientes 52 37 89
total 88 65 153
1. HIPÓTESIS
2. DISTRIBUCIÓN MUESTRAL
( )
( )( )
( )( )
3. NIVEL DE SIGNIFICANCIA
4. OBSERVACIÓN
especificaciones cálculos
Casilla (x,y) O E (O-E) (O-E)^2 ((O-E)^2)/E
Medico a favor 36 36,8105 -0,8105 0,6568 0,01784
Paciente a favor 52 51,1895 0,8105 0,6568 0,01283
Medico en contra 28 27,1895 0,8105 0,6568 0,02416
Paciente en contra 37 37,8105 -0,8105 0,6568 0,01737
total 153 153 0 0,07221
5. DECISIÓN DE RECHAZO
Acepto
6. INTERPRETACIÓN
Con el 95% de confianza podemos decir que existe una relación entre el
estatus médico-paciente y el tipo de sistema de seguro médico preferido
EJERCICIO 2.
En las 3 regiones A, B y C de un país, de 100 personas encuestadas en cada
una de ellas, 52, 68 y 39 respectivamente apoyan al candidato A y el resto al
candidato B. ¿Existe una relación entre el candidato preferido y las distintas
regiones? α= 0.01
.
Candidato
a Candidato
b total
Región A 52 48 100
Región B 68 32 100
Región C 39 61 100
TOTAL 159 141 300
1. HIPÓTESIS
2. DISTRIBUCIÓN MUESTRAL
( )
( )( )
( )( )
3. NIVEL DE SIGNIFICANCIA
4. OBSERVACIÓN
Especificaciones cálculos
Casilla x,y O E (O-E) (O-E)^2 ((O-E)^2)/E Región A candidato a 52 53 -1 1 0,0189 Región B candidato a 68 53 15 225 4,2453 Región C candidato a 39 53 -14 196 3,6981 Región A candidato b 48 47 1 1 0,0213 Región B candidato b 32 47 -15 225 4,7872 Región C candidato b 61 47 14 196 4,1702
total 300 300 0 16,9410
5. DECISIÓN DE RECHAZO
Acepto
6. INTERPRETACIÓN
Con el 99% de certeza podemos decir que no Existe una relación entre el
candidato preferido y las distintas regiones
EJERCICIO 3
Una empresa farmacéutica se encuentra probando un nuevo fármaco contra el
cáncer en ratones genéticamente infectados. Investigaciones anteriores en sus
laboratorios demuestran que 50% de estos animales sobrevive seis meses sin
ningún tratamiento. Se administra la droga a ocho ratones. Seis de ellos
sobreviven seis meses. Probar la hipótesis de que el tratamiento administrado
ofrece una tasa superior de supervivencia que la que se observa con la
ausencia del mismo fármaco. Utilizar α= 0.01.
viven mueren total
fármaco 6 2 8
sin fármaco 4 4 8
TOTAL 10 6 16
1. HIPÓTESIS
2. DISTRIBUCIÓN MUESTRAL
( )
( )( )
( )( )
3. NIVEL DE SIGNIFICANCIA
4. OBSERVACIÓN
Especificaciones cálculos
casilla x,y O E (O-E) (O-E)^2 ((O-E)^2)/E
vive con fármaco 6 5 1 1 0,2000
vive sin fármaco 4 5 -1 1 0,2000
muere con fármaco 2 3 -1 1 0,3333
muere sin fármaco 4 3 1 1 0,3333
total 16 16 0 1,0667
5. DECISIÓN DE RECHAZO
Acepto
6. INTERPRETACIÓN
Con el 99% de certeza se asegura que el tratamiento administrado ofrece una
tasa superior de supervivencia que con la ausencia del mismo fármaco
Actividad de aprendizaje 2.4.
EJERCICIO 1
En una empresa se considera que el nivel salarial debería ser aproximadamente
paralelo a los años de estudio. En una muestra de 7 empleados se encontraron
los siguientes valores de años de educación y salario (en miles de $).
Empleado Años de educación Salario (en miles de $)
1 12 22.5
2 11 16.5
3 16 29.6
4 18 42.6
5 17 45.8
6 10 14
7 19 54
a) ¿Cuál es la variable independiente y cual al variable dependiente? Trazar
el diagrama de dispersión.
b) Calcular los estadísticos de la recta de regresión y trazar dicha recta.
c) Calcular la r de Pearson. Interpretar el resultado.
d) ¿Parece que existe una relación lineal en el patrón de coordenadas?
y x
empleado salario año estudio y^2 X^2 XY
1 22,5 12 506,25 144 270
2 16,5 11 272,25 121 181,5
3 29,6 16 876,16 256 473,6
4 42,6 18 1814,76 324 766,8
5 45,8 17 2097,64 289 778,6
6 14 10 196 100 140
7 54 19 1156 361 646
28 225 103 6919,06 1595 3256,5
0
5
10
15
20
25
0 20 40 60
año estudio
año estudio
Lineal (año estudio)
Lineal (año estudio)
( ) ( )( )
( )
( ) ( )( )
( ) ( )
( )
( ) ( )( )
√[ ( ) ] [ ( )
]
( ) ( )( )
√[ ( ) ( ) ][ ( ) ( ) ]
√[ ][ ]
EJERCICIO 2
Los días de incapacidad se definen como el número de días que los individuos no pueden llevar a cabo sus actividades normales como consecuencia de una enfermedad o una lesión. Los días de incapacidad se relacionan con los riesgos en el trabajo y ambientes domésticos, los cuales, a su vez, se relacionan estrechamente con los niveles de ingreso. Los siguientes datos indican el patrón de la relación entre los días de incapacidad al año y el ingreso familiar (en miles de $).
a) Trazar el diagrama de dispersión del ingreso familiar total (Y) regresionado a partir de los días de incapacidad (X).
b) Calcular los estadísticos de regresión y trazarla recta de regresión. c) Calcular el coeficiente de correlación bivariada r de Pearson. d) ¿Parece que existe alguna relación lineal en el patrón de las
coordenadas?
Ingreso familiar Días de incapacidad
____________________________________________________________
5 27
15 19
28 14
40 10
6 29
14 21
26 13
37 6
x y
empleado dias incapacidad
ingreso familiar X^2 Y^2 XY
1 27 5 729 25 135
2 19 15 361 225 285
3 14 28 196 784 392
4 10 40 100 1600 400
5 29 6 841 36 174
6 21 14 441 196 294
7 13 26 169 676 338
8 6 37 36 1369 222
139 171 2873 4911 2240
y = -1.5968x + 49.119
0
5
10
15
20
25
30
35
40
45
0 10 20 30 40
ingreso familiar
ingreso familiar
Lineal (ingresofamiliar)
( )
( ) ( )( )
( )
( ) ( )( )
( ) ( )
( )
( ) ( )( )
√[ ( ) ] [ ( ) ]
( ) ( )( )
√[ ( ) ( ) ][ ( ) ( ) ]
√[ ][ ]