Download - Unidad4-Pbondad de Ajuste
ANALISIS DE DATOS CATEGORICOS
Email:[email protected]
PRUEBAS DE BONDAD DE AJUSTE
• Se desconoce la distribución de la población y se desea probar la característica hipótesis de que se ajusta una distribución en particular.
• Distribución particular: binomial, poisson, uniforme, normal, exponencial, etc.
PRUEBA DE PROPORCIONES
Ho: i = io i = 1, 2, …,k
H1: i ≠ io
2
2 i ic
i
O E
E
2(1 , 1)k
EJERCICIO 1
Se cree que el 60% de los turistas que visitan una localidad lo hacen principalmente por su atractivo arqueológico (museos, ruinas arqueológicas, etc), el 30% por disfrutar de las playas y el restante 10% por realizar turismo de aventura. Para verificar este supuesto se entrevistó a 500 turistas y se les pregunto sobre el tipo de turismo que motivó su visita a la localidad.
Motivo, razón de su visita Número de turistas
museos, restos arqueológicos... 280
Playas 120
Trurismo de aventura 100
¿Podría confirmar lo supuesto?. Use un nivel de significación del 5%?
Suponga que el número de accidentes de tránsito durante una semana ha sido registrado y se muestra en la siguiente tabla.
Dia N°de accidentesDomingo 28Lunes 12Martes 10Miercoles 7Jueves 8Viernes 11Sabado 24
100
Normalmente se hubiera esperado que durante los fines de semana (sábado y domingo) ocurriera el 50% de los accidentes, mientras que el 50% restante se repartiera en forma equitativa entre los días de la semana Compruebe esta suposición a la luz de la información de la muestra. Use un nivel de significación del 5%.
EJERCICIO 2
En un área metropolitana se selecciona una muestra de 250 personas al azar y se les pregunta cuantas veces habían comprado un cierto producto durante el mes anterior. Los resultados son los de la tabla adjunta
Veces que compran N° de personas
0 85
1 80
2 45
3 20
4 15
5 5
Probar con un nivel de significación del 5% la hipótesis de que las observaciones constituyen una muestra de una población que se distribuye como una Poisson.
PRUEBA DE BONDAD DE AJUSTE DE LA DISTRIBUCCION DE POISSON
EJERCICIO 3
Cada día, de lunes a sábado, un repostero hornea tres pasteles grandes de chocolate y los que no se venden el mismo día se regalan a un centro de beneficencia. Utilice los datos de la tabla siguiente para probar con el nivel de significancia 0.05 si se pueden considerar como valores de una variable aleatoria binomial:
EJERCICIO 4
Número pasteles vendidos 0 1 2 3
Número de días 1 16 55 228
PRUEBA DE BONDAD DE AJUSTE DE LA DISTRIBUCCION BINOMIAL
TABLAS DE CONTIGENCIA
PRUEBA DE INDEPENDENCIA EN TABLAS DE CONTINGENCIA
OBJETIVO:
Determinar si existe alguna relación entre dos características diferentes.
Tablas de contingencia
Se trata de tablas en cuyas celdas figuran probabilidades y en la cual
podemos determinar unas probabilidades conociendo otras de la tabla.
TABLA DE CONTINGENCIA EN PRUEBA DE INDEPENDENCIA
Característica Ab1 .. bc
a1 n11 n1c n1.
a2 n21 n2c n2.
.. .. ..
ai ni1 nic
..
ar nr1 nrc nrc
Total n.1 n.c n
Característica BTotal
PROCEDIMIENTO
H0 : Las características A y B son independientes
H1 : Las características A y B no son independientes
ij
r
i
c
jijij
C E
EO
1 1
2
2
2(1 ,( 1)( 1))r c
α
Una muestra de pequeñas empresas se clasifica en función de su antigüedad en el mercado y del porcentaje de deudas sobre el capital que presentan, con los siguientes resultados:
Porcentaje de deudas Empresas antiguas Empresas nuevas
0 - 15 19 29
15 -30 13 10
30 - 50 7 11
50 - 70 4 32
Se tiene interés probar si existe relación en la clasificación de la pequeña empresa y el porcentaje de deudas. Usar un nivel de significación del 5 %
EJERCICIO 6
Una compañía opera con cuatro maquinas durante tres turnos al da. De los registros de producción se obtiene los datos sobre el numero de fallos que se muestran en la siguiente tabla.
Probar, con = 0,05, la hipotesis de que el numero de fallas es independiente del turno.
Máquinas
Turno A B C D
Turno 1 41 20 12 16
Turno 2 31 11 9 14
Turno 3 15 17 16 10
EJERCICIO 7
A B C D Total 1 41 20 12 16 89 36,52 20,15 15,53 16,79
2 31 11 9 14 65 26,67 14,72 11,34 12,26
3 15 17 16 10 58 23,80 13,13 10,12 10,94
Total 87 48 37 40 212
Chi-Sq = 0,549 + 0,001 + 0,804 + 0,037 + 0,701 + 0,939 + 0,484 + 0,246 + 3,255 + 1,139 + 3,412 + 0,081 = 11,649
DF = 6, P-Value = 0,070
Una muestra aleatoria de 90 adultos se clasifica de acuerdo al sexo de los individuos y al número de horas que ven televisión durante la semana:
Hombre Mujermás de 25 horas 15 29menos de 25 horas 27 19
Utilice un nivel de significación de 0,01 y pruebe la hipótesis de que el tiempo utilizado para ver televisión es independiente de si el televidente es hombre o mujer
EJERCICIO 8
Una muestra aleatoria de 200 hombres casados, se clasificó de acuerdo a la educación y número de hijos de cada uno:
Nivel de educación0-1 2 a 3 más de 3
Primaria 14 37 32Secundaria 17 x 17Universitaria 12 17 y
Nro de Hijos
Se probó la hipótesis de que el tamaño de la familia es independiente del nivel de educación del padre y el valor calculado dió 7.54. Hallar x y y sabiendo que e32=18.72.
EJERCICIO 9
Muchos investigadores consideran que los clientes del banco eligen el tipo de cuenta (dólares o nuevos soles) según el nivel de ingreso (medio, alto o muy alto). Con base en la información presentada en el cuadro, determine si la preferencia de la cuenta corriente (DÓLARES o NUEVOS SOLES) depende del nivel de ingreso. Utilice un nivel de significación del 1% y concluya en términos del problema.
EJERCICIO 10
NIVEL DE INGRESO
TIPO DE CUENTA
Dólares Nuevos
soles
Medio 135 132
Alto 285 169
Muy alto 331 76
PRUEBA DE HOMOGENEIDAD DE SUBPOBLACIONES
Se realizó un estudio sobre establecimientos comerciales en tres distritos de Lima; para lo cual se seleccionaron aleatoriamente e independientemente a personas provenientes de cada uno de los distritos en estudio.. Los establecimientos comerciales fueron clasificados según sus ventas en 4 categorías, del estudio se obtuvo los siguientes resultados:
EJERCICIO 11
EstablecimientoCategoría
Distrito
La Victoria Breña Comas
A 17 13 20
B 14 14 23
C 27 18 15
D 22 11 7
80 56 65
Realice la Prueba de hipótesis correspondiente, use =0.05.
Los datos siguientes provienen de un estudio en que a muestras aleatorias de empleados de tres oficinas gubernamentales se les preguntó si estaban a favor o en contra de un nuevo plan de pensiones. Usando un nivel de significancia del 5% pruebe la hipótesis de que la Proporción de empleados que favorece el plan es la misma en las tres oficinas.
EJERCICIO 12
Posición
Oficina A favor En contra
A 80 20
B 85 65
C 100 50