prueba de hipótesis sobre la diferencia de proporciones poblacionales
Post on 30-Dec-2015
74 Views
Preview:
DESCRIPTION
TRANSCRIPT
Objetivos :
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
Comprender el procedimiento para probar si la diferencia de proporciones poblacionales según la metodología de Prueba de Hipótesis.
Reflexionar sobre la utilidad en el campo educativo de esta técnica de inferencia estadística.
Comprender el procedimiento para probar si la diferencia de proporciones poblacionales según la metodología de Prueba de Hipótesis.
Reflexionar sobre la utilidad en el campo educativo de esta técnica de inferencia estadística.
Aceptar Rechazar Hipótesis Estadística
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
2
Introducción
Con frecuencia el interés radica en saber si dos proporciones de población son iguales.
Veamos unos casos en que se evidencia la importancia de comparar proporciones poblacionales:
El Director de una escuela desea saber si existe una diferencia entre la proporción de alumnos provenientes de escuelas públicas que faltan más de cinco días al año con respecto a la proporción de alumnos provenientes de Instituciones privadas.
Con frecuencia el interés radica en saber si dos proporciones de población son iguales.
Veamos unos casos en que se evidencia la importancia de comparar proporciones poblacionales:
El Director de una escuela desea saber si existe una diferencia entre la proporción de alumnos provenientes de escuelas públicas que faltan más de cinco días al año con respecto a la proporción de alumnos provenientes de Instituciones privadas.
Población 1: Alumnos de escuelas privadas
Población 2: Alumnos de escuelas públicas
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
3
Introducción
El director de una universidad ha decidido ofrecer todos los postgrados bajo la modalidad a distancia. Se enseña el nuevo diseño a un grupo de estudiantes recién graduado de pregrado a 30 años y a otro grupo de personas mayores a 30 años.
Los directivos de la universidad desean saber si existe una diferencia entre las proporciones de personas a las que les gusta el nuevo diseño dependiendo del grupo de edad al que pertenezcan.
Una academia de inglés desea investigar la efectividad de sus cursos entre los adultos. De manera específica, desea saber si existe una diferencia en la proporción de hombres contra la de mujeres mayores de 21 años que han suscrito el pensa de estudio ofrecido y el rendimiento académico obtenido.
El director de una universidad ha decidido ofrecer todos los postgrados bajo la modalidad a distancia. Se enseña el nuevo diseño a un grupo de estudiantes recién graduado de pregrado a 30 años y a otro grupo de personas mayores a 30 años.
Los directivos de la universidad desean saber si existe una diferencia entre las proporciones de personas a las que les gusta el nuevo diseño dependiendo del grupo de edad al que pertenezcan.
Una academia de inglés desea investigar la efectividad de sus cursos entre los adultos. De manera específica, desea saber si existe una diferencia en la proporción de hombres contra la de mujeres mayores de 21 años que han suscrito el pensa de estudio ofrecido y el rendimiento académico obtenido.
Población 1 Población 2
Edad ≤ 30 Edad > 30
Si No Si No
Población 1 Población 2
Mujeres >21 años Hombres > 21 años
Rendimiento
alto
Bajo Alto bajo
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
4
Consideraciones
Nota que en los ejemplos anteriores y en todos los que se desea comparar proporciones, cada artículo de la muestra puede clasificarse como “éxito” o “fracaso”. Es decir, no se trata de comparar mediciones (como en el caso de las medias), sino valores nominales.
Para cada uno de estos ejemplos existen 2 poblaciones la primera con media μ1 y desviación estándar de la población σ1 y la otra con su propia e independiente μ2 y σ2.
Una muestra aleatoria se extrae de N1 y otra de la segunda población N2
En la mayoría de los casos σ1 y σ2 son desconocidas, pero para muestras mayores a 30 utilizamos los datos muestrales.
Las estimaciones de los parámetros poblacionales se calculan de los datos de las muestras por medio de los estimadores X1, s1 y X2, s2 respectivamente.
Nota que en los ejemplos anteriores y en todos los que se desea comparar proporciones, cada artículo de la muestra puede clasificarse como “éxito” o “fracaso”. Es decir, no se trata de comparar mediciones (como en el caso de las medias), sino valores nominales.
Para cada uno de estos ejemplos existen 2 poblaciones la primera con media μ1 y desviación estándar de la población σ1 y la otra con su propia e independiente μ2 y σ2.
Una muestra aleatoria se extrae de N1 y otra de la segunda población N2
En la mayoría de los casos σ1 y σ2 son desconocidas, pero para muestras mayores a 30 utilizamos los datos muestrales.
Las estimaciones de los parámetros poblacionales se calculan de los datos de las muestras por medio de los estimadores X1, s1 y X2, s2 respectivamente.
Profundiza esta información en la Web
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
5
Estadístico de prueba
En este caso también, dado que las muestras deben ser mayores a 30 y tener una distribución normal, se utiliza el estadístico de la distribución normal estándar y el valor de Z se calcula por la siguiente fórmula:
P1 – P2_________________________________________________________
√(P1 x Q1)/n1 + √(P2 x Q2)/n2
Como por lo general no se conocen los parámetros poblacionales P1, P2, Q1, Q2, será necesario estimarlos a través de los estadísticos muestrales p1,p2, q1, q2.
Ha sido aceptado por los especialistas en estadística que el mejor estimador es c Pc:
(n1 x p1) + (n2 x p2)Pc = ------------------------------ y Qc = 1- Pc
n1 + n2
p1 – p2Z = -----------------------------------------------------------------------
√(Pc x Qc)/n1 + √(Pc x Qc)/n2
En este caso también, dado que las muestras deben ser mayores a 30 y tener una distribución normal, se utiliza el estadístico de la distribución normal estándar y el valor de Z se calcula por la siguiente fórmula:
P1 – P2_________________________________________________________
√(P1 x Q1)/n1 + √(P2 x Q2)/n2
Como por lo general no se conocen los parámetros poblacionales P1, P2, Q1, Q2, será necesario estimarlos a través de los estadísticos muestrales p1,p2, q1, q2.
Ha sido aceptado por los especialistas en estadística que el mejor estimador es c Pc:
(n1 x p1) + (n2 x p2)Pc = ------------------------------ y Qc = 1- Pc
n1 + n2
p1 – p2Z = -----------------------------------------------------------------------
√(Pc x Qc)/n1 + √(Pc x Qc)/n2
Z : Estadístico de prueban1 : tamaño de la primera muestra n2 : tamaño de la segunda muestra p1 : proporción de aciertos de la primera
muestra p2 : proporción de aciertos de la segunda
muestra Pc : proporción combinada de aciertosQc : 1 menos Pc (proporción de desaciertos)
Z =
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
6
Ejemplo
El consejo de universidades desea hacer un estudio sobre los gustos de la población adulta en cuanto a estudiar a distancia. Específicamente desea saber si saber si la modalidad es exitosa entre la población joven y la madura.
Para ello se toman dos muestras independientes, una de jóvenes entre 21 y 30 años y otras de adultos mayores entre 31 y 40 años.
Se usará una encuesta simple entre cursantes de postgrado de varias especialidades en que se preguntará sobre la preferencia modal para que indiquen cuál es el que les gusta más.
Los resultados fueron los siguientes:
El consejo de universidades desea hacer un estudio sobre los gustos de la población adulta en cuanto a estudiar a distancia. Específicamente desea saber si saber si la modalidad es exitosa entre la población joven y la madura.
Para ello se toman dos muestras independientes, una de jóvenes entre 21 y 30 años y otras de adultos mayores entre 31 y 40 años.
Se usará una encuesta simple entre cursantes de postgrado de varias especialidades en que se preguntará sobre la preferencia modal para que indiquen cuál es el que les gusta más.
Los resultados fueron los siguientes:
Material muy sencillo para entender este tema y que sirve de estrategia para enseñar a estudiantes el concepto de proporción
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
7
1° Organicemos la información
n1= 100, n2= 200 tamaño de la muestra 1 y 2
p1 = 0,2 y p2 = 0,5 proporción muestral que prefiere en cada población la modalidad a distancia
q1= 0,8 y q2= 0,5 proporción de muestra que prefiere otra modalidad
α = 0.05 nivel de significación para probar la hipótesis
Pc = 0,4 proporción combinada de la población que se determino favorable a la modalidad a distancia
Qc = 0,6 proporción combinada de la población no favorable
n1= 100, n2= 200 tamaño de la muestra 1 y 2
p1 = 0,2 y p2 = 0,5 proporción muestral que prefiere en cada población la modalidad a distancia
q1= 0,8 y q2= 0,5 proporción de muestra que prefiere otra modalidad
α = 0.05 nivel de significación para probar la hipótesis
Pc = 0,4 proporción combinada de la población que se determino favorable a la modalidad a distancia
Qc = 0,6 proporción combinada de la población no favorable
Población Prefirieron a distancia
Prefirieron presencial
TOTAL Proporción que prefiere a distancia
Jóvenes 20 80 100 0.20Mayores a 30 100 100 200 0.50
(n1 x p1) + (n2 x p2)Pc = ----------------------------- n1 + n2
Qc = 1- Pc
Revisa este ejemplo y otros resueltos con Excel en la
publicacionc10.xls
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
8
3° Probemos la hipótesis
Paso 1, definir hipótesis:H0: p1 = p2 H1: p1 ≠ p2
Paso 2, definir Nivel de significación (α) y dibuje la región de rechazo en la curva normal estándar (curva z): α = 0.05, Z= + - 0,025 = ± 1,96
Paso 3, Calcular el valor de Z: Z= p1 – p2/√(Pc x Qc)/n1 + √(Pc x Qc)/n2 Z = -0.30 / √ 0.002 + √ 0,001Z = -5.00
Paso 1, definir hipótesis:H0: p1 = p2 H1: p1 ≠ p2
Paso 2, definir Nivel de significación (α) y dibuje la región de rechazo en la curva normal estándar (curva z): α = 0.05, Z= + - 0,025 = ± 1,96
Paso 3, Calcular el valor de Z: Z= p1 – p2/√(Pc x Qc)/n1 + √(Pc x Qc)/n2 Z = -0.30 / √ 0.002 + √ 0,001Z = -5.00
/2/2
-z z
Σp: error estándar de la proporción de la
población
σp=√(Pc * Qc/n)
Revisa este ejemplo y otros resueltos con Excel en la
publicacionc10.xls
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
9
3° Probemos la hipótesis
Paso 4, Regla de Decisión: No rechazar la hipótesis nula, si el valor calculado de z cae entre –1.96 y +1.96. Rechazar la hipótesis nula y aceptar la hipótesis de investigación si z no cae entre –1.96 y +1.96.
Paso 5, Decisión: Debido a que el valor calculado de z (-5.00) no cae entre los valores críticos (-1.96 y +1.96), se rechaza la hipótesis nula y se acepta que las preferencias por la modalidad de estudio varían según la edad del estudiantes. En otras palabras, jóvenes y adultos no prefieren la modalidad a distancia en igual proporción
Paso 4, Regla de Decisión: No rechazar la hipótesis nula, si el valor calculado de z cae entre –1.96 y +1.96. Rechazar la hipótesis nula y aceptar la hipótesis de investigación si z no cae entre –1.96 y +1.96.
Paso 5, Decisión: Debido a que el valor calculado de z (-5.00) no cae entre los valores críticos (-1.96 y +1.96), se rechaza la hipótesis nula y se acepta que las preferencias por la modalidad de estudio varían según la edad del estudiantes. En otras palabras, jóvenes y adultos no prefieren la modalidad a distancia en igual proporción
- 1,960Zona de Rechazo
+ 1,960 Zona de Rechazo
Z = -5Z = -5
Zona de Aceptación
María Isabel Bautistambautista@aldeae.com
Prueba de Hipótesis sobre la diferencia de proporciones poblacionales
10
Lista de Referencias
Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.
Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.
Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela
Tarjeta de referencia rápida: Funciones estadísticas de Excel
http://support.microsoft.com/kb/828296/es
Sandoval, A. (s/f), Estadística II, Escuela de Ciencias Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.
Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.
Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela
Tarjeta de referencia rápida: Funciones estadísticas de Excel
http://support.microsoft.com/kb/828296/es
top related