06 prueba de hipotesis

145
ANÁLISIS DE DATOS EN INGENIERÍA 6. RUEBA DE HIPOTESIS Ing. Rodrigo Wadnipar, M. Sc. 29/03/2022 1

Upload: henry-herrera

Post on 27-Dec-2015

156 views

Category:

Documents


0 download

TRANSCRIPT

19/04/2023 1

ANÁLISIS DE DATOS EN INGENIERÍA

6. RUEBA DE HIPOTESISIng. Rodrigo Wadnipar, M. Sc.

19/04/2023 2

6.    PRUEBAS DE HIPOTESIS (6 HT, 4 HP)      6.1    Conceptos Generales (Pruebas de una y dos colas, valor P, 

   tipos de riesgo…)      6.2    Prueba de hipótesis sobre la media de una población   

   (Varianza conocida)6.3    Prueba de hipótesis sobre la media de una población    

  (Varianza desconocida)6.4    Prueba de hipótesis sobre la varianza6.5    Prueba de hipótesis sobre una proporción binomial6.6    Prueba de hipótesis para la diferencia en medias,     

     varianzas conocidas6.7    Prueba de hipótesis para el cociente de dos varianzas6.8    Prueba de hipótesis para la diferencia en medias,    

     varianzas conocidas6.9    Valores P para las pruebas Z, t, Chi, F

      6.10  Prueba de Bondad de Ajuste Chi Cuadrado

19/04/2023 33

Bibliografía• Statistics for Engineering and the Sciences. 

Mendenhall William.  Pearson Prentice-Hall, 2007. • Probabilidad y Estadística para Ingeniería y Ciencias     Walpole, Ronald E., Myers, Raymond H.,       Myers, Sharon L., YE, Keying.       Octava edición    Editorial  PEARSON  Educación.• Probabilidad y estadística aplicadas a la

ingeniería. Montgomery, Douglas C. y George C. Runger.

Editorial Limusa Wiley.

19/04/2023 4

PRUEBA DE HIPOTESIS

22

212

2121 ,,,,,

Pr

ppXXpX

hipótesisdeueba

Lenguaje Error Tipo I

y Tipo IIPruebas de 1

y 2 colas

19/04/2023 5

HIPÓTESIS ESTADÍSTICAS•A menudo, el problema al que se enfrenta el científico o el ingeniero no es tanto la estimación de un parámetro poblacional, sino más bien la formulación de un procedimiento de decisión que se base en los datos, el cual ofrezca una conclusión acerca de algún sistema científico.•Por ejemplo:Un investigador médico puede decidir, sobre la base de

evidencia experimental, si en los seres humanos beber café incrementa el riesgo de padecer cáncer.

Un ingeniero quizá tenga que decidir sobre la base de datos muéstrales si hay una diferencia entre la precisión de dos tipos de medidores.

Tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo sanguíneo de un individuo y el color de los ojos son variables independientes.

19/04/2023 6

HIPÓTESIS ESTADÍSTICAS• En cada uno de esos casos, el científico, el

ingeniero o el sociólogo postulan o conjeturan algo acerca de un sistema.

• Cada uno de ellos debe incluir el uso de datos experimentales y la toma de decisiones basadas en ellos.

• De manera formal, en cada caso, la conjetura se puede poner en forma de hipótesis estadística.

• Los procedimientos que conducen a la aceptación o rechazo de hipótesis estadísticas como éstas, comprenden un área importante de la inferencia estadística.

19/04/2023 7

HIPÓTESIS ESTADÍSTICAS

• Una hipótesis estadística es una aseveración o conjetura con

respecto a una o más poblaciones.

• La estructura de la prueba de hipótesis se formulará usando el

término hipótesis nula, el cual se refiere a cualquier hipótesis

que deseamos probar y se denota con H0.

• El rechazo de H0 conduce a la aceptación de una hipótesis

alternativa, que se denota con H1.

• A un proceso que lleva una decisión acerca de una hipótesis

particular se le llama prueba de hipótesis.

• Probar la hipótesis implica tomar una muestra aleatoria, calcular

un estadístico de prueba de los datos muéstrales, y utilizar

después el estadístico de prueba para tomar una decisión acerca

de la hipótesis nula.

19/04/2023 8

Siempre que vayamos a proponer una hipótesis estadística, en términos de la hipótesis nula H0 o de la alternativa H1, debemos tener en cuenta las siguientes advertencias:1. La hipótesis nula H0 siempre se refiere a un valor específico

del parámetro de la población (como, por ejemplo, m), no al estadístico muestral (como      ).

2. La expresión de la hipótesis nula siempre contiene un signo igual respecto al valor especificado del parámetro poblacional. Por ejemplo, H0: m = 36.

3. La expresión de la hipótesis alternativa nunca contiene un signo igual respecto al valor especificado del parámetro   poblacional. Por ejemplo, H1 siempre debe ser de la forma  H1: m ≠ 36,  H1:  m < 36  o  H1: m > 36.

HIPÓTESIS ESTADÍSTICAS (continuación)

X

19/04/2023 9

HIPÓTESIS ESTADÍSTICAS (continuación)

• La hipótesis nula, Ho se establecerá usando el signo de igualdad, es decir:

                                     H0 :  q = q0

• Donde q  representa el parámetro y q0 representa un valor para ese parámetro.

• La hipótesis alternativa se puede plantear de tres formas:1.  H1 : q > q0 (Prueba unilateral o de una cola)

2.  H1 : q < q0 (Prueba unilateral o de una cola)

3.  H1 : q ≠ q0  (Prueba bilateral o de dos colas)

• A pesar de que H0 se establece como una igualdad, decisiones de no rechazo de H0 implica que el parámetro q podría ser cualquier valor definido por el complemento de H1

Como plantear las hipótesis

19/04/2023 10

HIPÓTESIS ESTADÍSTICAS (continuación)

• Para establecer H1 tenemos en cuenta lo siguiente:1. Si se hace una afirmación o pregunta que indique una 

dirección (> o <), H1 se establece en la misma dirección.

2. Si se hace una afirmación o pregunta que indique una dirección compuesta(≥  o  ≤), H1 se establece en la dirección contraria.

3. Si se hace una afirmación o pregunta que no indique dirección, H1 se establece con el signo ≠.

Como plantear la hipotesis alternativa

11

HIPÓTESIS ESTADÍSTICAS (continuación)Planteamiento de las hipotesis• Así por ejemplo:1. Una nueva vacuna para la gripe es efectiva en no más 

de un 80%:– Ho : P = 0,8

– H1 : P > 0,8

2. Una nueva vacuna para la gripe es efectiva en por lo menos un 80%:– Ho : P = 0,8

– H1 : P < 0,8

3. Una nueva vacuna para la gripe es efectiva en un 80%:– Ho : P = 0,8

– H1 : P ≠ 0,819/04/2023

19/04/2023 12

HIPÓTESIS ESTADÍSTICAS (continuación)Importancia de establecer adecuadamente las hipótesis1ª. Afirmación: Una nueva vacuna para la gripe es efectiva en por lo 

menos un 80%:• Mal planteada

– Ho : P = 0,8

– H1 : P > 0,8

Si la decisión es rechazar Ho; la afirmación es válida.

Si la decisión es no rechazar Ho la afirmación es válida.

2ª. Afirmación: Una nueva vacuna para la gripe es efectiva en por lo menos un 80%:

• Bien planteada– Ho : P = 0,8

– H1 : P < 0,8

Si la decisión es rechazar Ho; la afirmación no es válida.

Si la decisión es no rechazar Ho la afirmación es válida.19/04/2023 12

19/04/2023 13

HIPÓTESIS ESTADÍSTICAS (continuación)

• El planteamiento formal de una hipótesis a menudo está influido por la estructura de la probabilidad de una conclusión errónea.• Si el científico se interesa en apoyar con fuerza una opinión, desea llegar a la opinión en la forma del rechazo de una hipótesis. • Ejemplo: Si un investigador médico desea mostrar evidencia sólida a favor de la opinión de que beber café aumenta el riesgo de contraer cáncer, la hipótesis a probar debería tener la forma “no hay aumento en el riesgo de padecer cáncer como consecuencia de beber café”. Como resultado, la opinión se alcanza mediante un rechazo.• De manera similar, para apoyar la afirmación de que un tipo de medidor es más preciso que otro, el ingeniero prueba la hipótesis de que “no hay diferencia en la precisión de los dos tipos de medidor”.

19/04/2023 14

PRUEBA DE UNA HIPÓTESIS ESTÁDISTICA• Ejemplo: Para ilustrar los conceptos que se utilizan al probar una hipótesis estadística acerca de una población, considere lo siguiente. Se sabe que cierto tipo de vacuna contra el resfriado tan sólo es efectiva en 25% después de un período de dos años. Para determinar si una vacuna nueva, y algo más cara, es superior al dar protección contra el mismo virus durante un período más largo, suponga que se eligen a 20 personas al azar y se inoculan. Si más de 8  de quienes reciben la nueva vacuna superan el lapso de dos años sin contraer el virus, la nueva vacuna se considerará superior a la que se usa en la actualidad. El requisito de que el número exceda de 8 es algo arbitrario, aunque parece razonable, ya que representa una ganancia modesta sobre las 5 personas que se esperaría que recibieran protección si las 20 personas se inocularon con la vacuna ya en uso. En esencia probamos la hipótesis nula de que - después de un período de dos años – la nueva vacuna es igualmente eficaz que la que, por lo general, se utiliza ahora. La hipótesis alternativa es que la nueva vacuna es de hecho superior, lo cual es equivalente a probar la hipótesis de que el parámetro binomial para la probabilidad de un éxito sobre una prueba dada es p = ¼ contra la alternativa de que p > ¼.  Esto por lo general se escribe como:

H0: p = ¼H1: p > ¼     

19/04/2023 15

PRUEBA DE UNA HIPÓTESIS ESTADÍSTICAS (continuación) ERRORES TIPO I y TIPO II

•Un proceso de decisión utilizando pruebas de hipótesis puede llevar a una de dos conclusiones incorrectas, las cuales se conocen como error tipo I y error tipo II.

•El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. La probabilidad de incurrir en este error se denota con la letra griega a y se le llama nivel de significancia.

• El error tipo II se define como la aceptación de la hipótesis nula cuando ésta es falsa. La probabilidad de incurrir en este error se denota con la letra b.

19/04/2023 16

HIPÓTESIS ESTADÍSTICAS (continuación)

Decisión sobre H0 H0 e verdadera H0 es falsaDecisión correcta Decisión incorrecta

Probabilidad = 1 - a Error Tipo II1 - a se llama grado de confianza

Probabilidad = b

Decisión incorrecta Decisión correctaError tipo I Probabilidad = 1 - bProbabilidad = aa se llama nivel de significancia

Tabla: Errores tipo I y II y sus correspondiente probabilidades

Aceptar H0

1 - b se llama potencia

Rechazar H0

19/04/2023 17

PRUEBA DE UNA HIPÓTESIS ESTADÍSTICAS (continuación)• La probabilidad de cometer un error tipo I , también llamada nivel de significancia, se denota por la letra griega α. En el caso del ejemplo de las vacunas, un error tipo I ocurrirá cuando se rechace H0 y más de 8 individuos superen el período de 2 años sin contraer el virus, al usar la nueva vacuna que en realidad equivale a la que está en uso. Por lo tanto, si X es el número de individuos que permanecen libres del virus por al menos 2 años,

• Decimos que la hipótesis nula, p = 1/4 , se prueba al nivel de significancia α = 0,0409. A veces el nivel de significancia se llama tamaño de la prueba. Una región crítica de tamaño 0,0409 es muy pequeña y, por lo tanto, es poco probable que se cometa un error tipo I. En consecuencia, sería poco probable que más de 8 individuos permanecieran inmunes a un virus por un período de más de dos años mediante el uso de una vacuna nueva, que en esencia es equivalente a la que ahora existe en el mercado.

8

0

8

0

20

9

0409.09591.0114

1,20;1

4

1,20;

4

18)(

x x

xnx

x

qpx

nxb

xbpcuandoXPItipoerrorP

a

a

19/04/2023 18

Solución:n p20 0,25

x f(x)9 0,0271 x f(x)10 0,0099 0 0,003211 0,0030 1 0,021112 0,0008 2 0,066913 0,0002 3 0,133914 0,0000 4 0,189715 0,0000 5 0,202316 0,0000 6 0,168617 0,0000 7 0,112418 0,0000 8 0,060919 0,0000 Total 2 0,959120 0,0000

Total 0,0409 1 - Total 2 0,0409

8

0

8

0

20

9

0409.09591.0114

1,20;1

4

1,20;

4

18)(

x x

xnx

x

qpx

nxb

xbpcuandoXPItipoerrorP

a

a

19/04/2023 19

PRUEBA DE UNA HIPÓTESIS ESTADÍSTICAS (continuación)

• La probabilidad de cometer un error tipo II, se denota por la letra griega β. Es imposible de calcular a menos que tengamos una hipótesis alternativa específica. Si probamos la hipótesis nula p = ¼ contra la hipótesis alternativa p = ½ , entonces seremos capaces de calcular la probabilidad de no rechazar H0 cuando es falsa. Simplemente encontramos la probabilidad de obtener 8 o menos en el grupo que supera el período de dos años cuando p = ½. En este caso,

• Esta es una probabilidad más bien alta, que indica un procedimiento de prueba donde es muy probable que rechacemos la nueva vacuna cuando, de hecho, es superior a la que está en uso. Idealmente, preferimos utilizar un procedimiento de prueba en el cual sean pequeñas las probabilidades de los errores tipo I y tipo II.

8

0

8

0

.2517,02

1,20;

2

18)(

x x

xnxqpx

nxb

pcuandoXPIItipoerrorP

b

b

19/04/2023 20

Solución:n p20 0,5

x f(x)0 0,00001 0,00002 0,00023 0,00114 0,00465 0,01486 0,03707 0,07398 0,1201

Total 0,2517

8

0

8

0

.2517,02

1,20;

2

18)(

x x

xnxqpx

nxb

pcuandoXPIItipoerrorP

b

b

19/04/2023 21

PRUEBA DE UNA HIPÓTESIS ESTADÍSTICAS (continuación)

• Es posible que el director del programa de prueba esté dispuesto a cometer un error tipo II, si la vacuna más cara no es significativamente superior. De hecho, la única ocasión en que desea estar prevenido contra un error tipo II es cuando el valor real de p es al menos 0,7. Si p = 0,7 este procedimiento de prueba da

• Con una probabilidad tan pequeña de cometer un error tipo II, es bastante improbable que se rechace la nueva vacuna cuando tiene una efectividad del 70% después de un período de dos años. Conforme la hipótesis alternativa se aproxima a la unidad, el valor de β tiende a cero.

8

0

8

0

.0051,07.0,20;

7,08)(

x x

xnxqpx

nxb

pcuandoXPIItipoerrorP

b

b

19/04/2023 22

Solución:n p20 0,7

x f(x)0 0,00001 0,00002 0,00003 0,00004 0,00005 0,00006 0,00027 0,00108 0,0039

Total 0,0051

8

0

8

0

.0051,07.0,20;

7,08)(

x x

xnxqpx

nxb

pcuandoXPIItipoerrorP

b

b

19/04/2023

EVALUACIÓN DE LOS ERRORES• Ejemplo• Un fabricante desarrolla un nuevo sedal para pesca 

que, según afirma, tiene una resistencia media a la rotura de 15 kg con una desviación estándar de 0,5 kg . Para probar la hipotesis que  m = 15 kg contra la alternativa de que   m  < 15 kg; se prueba una muestra aleatoria de 50 sedales, el fabricante considera crítico encontrar un x < 14,9  

1. Encuentre la probabilidad de cometer error tipo I.2. Encuentre la probabilidad de cometer error tipo II para 

la alternativa  m = 14,7 kg

23

19/04/2023 24

EVALUACIÓN DE LOS ERRORES (continuación)

Solución al ejemplo

29

19/04/2023 25

Relación entre los tipos de errores• Ejemplo

19/04/2023 26

Relación entre los tipos de errores (continuación)

• Ejemplo

19/04/2023 27

Relación entre los tipos de errores (continuación)

• Ejemplo

3. El aumento en el tamaño de la muestra n reducirá a a y a b.

Si en el ejercicio se aumenta n a 100 bajo las condiciones iníciales, se tiene que:

a pasó de 0,0786 a 0,02275 y b pasó de 0,00234 a 0,000032

000032,0999968,017,14|9,14

02275,015|9,14

b

a

XP

XP

19/04/2023 28

Relación entre los tipos de errores (continuación)

• Ejemplo    4. Si la hipótesis nula es falsa,  b  será menor 

cuando la distancia entre el valor real y el valor hipotético sea más grande, n = 100.

    Del ejercicio se tiene:

    Si se cambia la alternativa específica a m = 14,8 se tiene

000032,07,14|9,14 b XP

022750,08,14|9,14 b XP

29

POTENCIA DE UNA PRUEBA ESTADÍSTICA• La potencia de una prueba estadística es la

probabilidad de rechazar la hipótesis nula Ho cuando la hipótesis alternativa es verdadera, es decir la probabilidad de rechazar correctamente una hipótesis nula falsa. La potencia se calcula como: 1 – b = P (Rechazar H0|H0 es falsa)

• El valor P es el nivel de significación más bajo que llevaría al rechazo de la hipótesis nula Ho con los datos dados.

• La potencia es una medida de sensibilidad de la prueba para detectar diferencias entre el valor real del parámetro y el valor hipotético, para el ejemplo realizado la potencia de la prueba será 1 - b = 1- 0,0023 = 0,9977 es decir se rechazará Ho en forma adecuada el 99,77% de las veces.19/04/2023

24

19/04/2023 30

PASOS PARA ESTABLECER UNA PRUEBA DE HIPÓTESIS

• Paso1

• Paso2

• Paso3

19/04/2023 31

PASOS PARA ESTABLECER UNA PRUEBA DE HIPÓTESIS• Paso 4

• Paso 5

19/04/2023 32

Pasos para realizar una prueba de hipotesis (Paso 5) Utilización de la región crítica

19/04/2023 33

Pasos para realizar una prueba de hipotesis (Paso 5)

• Decisión

19/04/2023 34

Pasos para realizar una prueba de hipotesis (Paso 5)

• Utilizando el valor de P

• ¿Qué es el valor de P?

• ¿Cómo calcular el valor de P?

19/04/2023 35

Pasos para realizar una prueba de hipotesis (Paso 5)

• Decisión

57 58

19/04/2023 36

• Ejemplo 1 (Media y varianza)• (Utilice un nivel de significancia de 0.05)

19/04/2023 37

Ejemplo 2 (Proporción, muestras grandes)(Utilice un nivel de significancia de 0.05)

19/04/2023 38

Ejemplo 3 (Proporción muestras pequeñas)(Utilice un nivel de significancia de 0.05)

19/04/2023 39

Ejemplo 4 (Cociente de varianzas y Diferencia de Medias, Muestras Independientes)(Utilice un nivel de significancia de 0.05)

19/04/2023 40

Ejemplo 5 (Diferencia de Medias, Muestras dependientes)(Utilice un nivel de significancia de 0.05)

19/04/2023 41

Ejemplo 6 (Diferencia de proporciones, Proporciones iguales)(Utilice un nivel de significancia de 0.05)

19/04/2023 42

Ejemplo 7 (Diferencia de proporciones, Diferencia diferente de cero)(Utilice un nivel de significancia de 0.05)

19/04/2023 43

HIPÓTESIS ESTADÍSTICAS (continuación) Prueba de hipótesis de una y dos colas• Suponga que se tiene interés en la rapidez de combustión del propulsor sólido utilizado para impulsar los sistemas de expulsión de la tripulación de un avión. Entonces, la rapidez de combustión es una variable aleatoria que puede describirse con una distribución de probabilidad. Suponga que el interés se enfoca en la media de la rapidez de combustión (uno de los parámetros de esta distribución). Específicamente, quiere decidirse si la media de la rapidez de combustión es 50 cm/s o no. Esto puede expresarse formalmente como:

H0: µ = 50 cm/sH1: µ ≠ 50 cm/s

• Al enunciado H0: µ = 50 cm/s se le llama hipótesis nula, y al enunciado H1: µ ≠ 50 cm/s se le llama hipótesis alternativa.• Como la hipótesis alternativa especifica el valor de µ que podría ser mayor o bien menor que 50 cm/s, se llama hipótesis alternativa de dos colas. • Una hipótesis alternativa de una cola se expresa así:

H0: µ = 50 cm/s H0: µ = 50 cm/sH1: µ < 50 cm/s H1: µ > 50 cm/s

19/04/2023

Ejemplo 10.1 W: Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de grasa saturada no excede de 1.5 gramos. Establezca la hipótesis nula y alternativa a utilizar para probar esta afirmación y determine donde se localiza la región crítica.Solución: la afirmación del fabricante se debería rechazar solo si μ es mayor que 1.5 mgr y no se debería rechazar si µ es menor o igual que 1.5 mgr. Entonces, probamos

De manera que el no rechazo de H0 no descarta valores menores que 1.5 mgr. Como tenemos una prueba de una cola, el símbolo mayor indica que la región crítica yace por completo en la cola derecha de la distribución de nuestro estadístico de prueba     .

,5.1:

,5.1:

1

0

H

H

HIPÓTESIS ESTADÍSTICAS (continuación) Prueba de hipótesis de una y dos colas

X

44

19/04/2023 45

HIPÓTESIS ESTADÍSTICAS (continuación) Prueba de hipótesis de una y dos colas

Ejemplo 10.2 W: Un agente de bienes raíces afirma que el 60% de todas las viviendas privadas que se construyen actualmente son casa con tres dormitorios. Para probar esta afirmación, se inspecciona una muestra grande de viviendas nuevas. La proporción con tales casas con 3 dormitorios se registra y se utiliza como estadístico de la prueba. Establezca la hipótesis nula  y la hipótesis  alternativa a utilizarse en esta prueba y determine la posición de la región crítica.Solución: si el estadístico de prueba fuera considerablemente mayor o menor que  p = 0.6, rechazaríamos la afirmación del agente, por lo que deberíamos establecer la hipótesis 

La hipótesis alternativa implica una prueba de dos colas con la región crítica dividida por igual en ambas colas de la distribución de     , nuestro estadístico de prueba.

,6.0:

,6.0:

1

0

pH

pH

P

19/04/2023 46

HIPÓTESIS ESTADÍSTICAS (continuación)• En el problema de la rapidez de combustión, suponga que se prueba una muestra de n = 10 observaciones y se obtiene la media muestral de la rapidez de combustión. La media muestral es una estimación de la verdadera media poblacional µ. Un valor de la media muestral que está cerca del valor hipotético µ = 50 cm/s es evidencia de que la verdadera media µ es en realidad 50 cm/s; es decir, dicha evidencia apoya la hipótesis nula H0. Por otra parte, una media muestral que difiera considerablemente de 50 cm/s es evidencia a favor de la hipótesis alternativa H1. Por tanto, en este caso la media muestral es el estadístico de la prueba.La media muestral puede tomar muchos valores diferentes. Suponga que si 48.5 ≤ ≤ 51.5, no se rechazará la hipótesis nula H0: µ = 50, y cuando < 48.5 o bien > 51.5, se rechazará la hipótesis nula a favor de la hipótesis alternativa H1: µ ≠ 50. Ver siguiente figura:

X

X

XXX

Se rechaza H0 No se rechaza H0 Se rechaza H0 µ ≠ 50 cm/s µ = 50 cm/s µ ≠ 50 cm/s 48.5 µ = 50 51.5

Criterios de decisión para probar H0: µ = 50 cm/s contra H1: µ ≠ 50 cm/s.

HIPÓTESIS ESTADÍSTICAS (continuación)• En el problema de la rapidez de combustión de la carga propulsora, ocurrirá un error tipo I cuando x > 51.5 o cuando x < 48.5, dado que la verdadera media de la rapidez de combustión es µ = 50 cm/s.• Suponga que la desviación estándar de la rapidez de combustión es σ=2.5 cm/s y que la rapidez de combustión tiene una distribución para la que se cumplen las condiciones del teorema del límite central.•Entonces la distribución de la media muestral es aproximadamente normal con media µ = 50 y desviación estándar . La probabilidad de incurrir en un error tipo I es igual a la suma de las áreas que se han sombreado en las colas de la distribución normal que se muestra en la siguiente figura. Esta probabilidad puede encontrarse como:

• Los valores z que corresponden a los valores críticos 48.5 y 51.5 son

Por lo tantoEsto implica que 5.74% de todas las muestrasaleatorias llevarían al rechazo de la hipótesisH0: µ = 50 cm/s cuando la verdaderamedia de la rapidez de combustión esen realidad 50 cm/s.

79.010/5.2/ n

)505.51()505.48( a cuandoXPcuandoXP

90.179.0

505.5190.1

79.0

505.4821

zz

0574.00287.00287.090.190.1 ZPZPa

19/04/2023 47

19/04/2023 48

HIPÓTESIS ESTADÍSTICAS (continuación)• Al examinar la anterior figura se observa que α puede reducirse ampliando la región de aceptación. Por ejemplo, si los valores críticos se hacen 48 y 52, el valor de α es

• También podría reducirse α incrementando el tamaño de la muestra. Si n = 16, entonces y al utilizar la región crítica original del problema, se encuentra

0164.00082.00082.0

)40.2()40.2(625.0

505.51

625.0

505.48

a

a ZPZPZPZP

,625.016/5.2/ n

40.2625.0

505.5140.2

625.0

505.4821

zz

0114.00057.00057.0

)53.2()53.2(79.0

5052

79.0

5048

a

a ZPZPZPZP

19/04/2023 49

HIPÓTESIS ESTADÍSTICAS (continuación)• Al evaluar un procedimiento de prueba de hipótesis, también es importante examinar la probabilidad de un error tipo II, la cual se denotará por β. Es decir

b = P(error tipo II) = P(no puede rechazarse H0 cuando H0 es falsa) Suponga que es importante rechazar la hipótesis nula H0: µ = 50 siempre que la rapidez de combustión media µ se mayor de 52 cm/s o menor que 48 cm/s. Podría calcularse la probabilidad β del error tipo II para los valores µ = 52 y µ = 48, y usar este resultado para tener una idea de cual sería el desempeño del procedimiento de prueba. Específicamente, ¿cómo funcionaría el procedimiento de prueba si se desea detectar, es decir, rechazar H0 para un valor de la media µ = 52 o µ = 48? Debido a la simetría, solo es necesario evaluar uno de los dos casos, por ejemplo, encontrar la probabilidad de aceptar la hipótesis nula H0: µ = 50 cuando la verdadera media es µ = 52 cm/s.Se incurrirá en un error tipo II si la media muestral está entre 48.5 y 51.5 cuandoµ = 52. Como se ve en la figura, esta essimplemente la probabilidad de que48.5 ≤ ≤ 51.5, cuando la verdadera mediaes µ = 52 o el área sombreada bajo la distribución normal de la derecha.

X

X

19/04/2023 50

HIPÓTESIS ESTADÍSTICAS (continuación)

β = P(48.5 ≤ ≤ 51.5 cuando µ = 52) • Los valores z correspondientes a 48.5 y 51.5 cuando µ = 52 son

• Por lo tanto

• Luego si se está probando H0: µ = 50 contra H1: µ ≠ 50 con n = 10, y el verdadero valor de la media µ = 52, la probabilidad de que no pueda rechazarse la hipótesis nula falsa es 0.2643. Por simetría, el verdadero valor de la media µ = 48, el valor de β también será 0.2643.

X

63.079.0

525.5143.4

79.0

525.4821

zz

2643.00000.02643.0

)43.4()63.0()63.043.4(

bb ZPZPZP

19/04/2023 51

HIPÓTESIS ESTADÍSTICAS (continuación)• La probabilidad β de incurrir en un error tipo II aumenta con rapidez con forme el verdadero valor de µ se aproxima al valor propuesto en la hipótesis. En la siguiente figura, donde el verdadero valor de µ = 50.5 y el valor propuesto de la hipótesis es H0: µ = 50. El verdadero valor de µ está muy cerca de 50, y el valor de β es

β = P(48.5 ≤ ≤ 51.5 cuando µ = 50.5)X

19/04/2023 52

HIPÓTESIS ESTADÍSTICAS (continuación)

Fig. 9-5

19/04/2023 53

HIPÓTESIS ESTADÍSTICAS (continuación)

19/04/2023 54

1. The size of the critical region, and consequently the probability of a type I error , can always be reduced by appropriate selection of the critical values.2. Type I and type II errors are related. A decrease in the probability of one type of error always results in an increase in the probability of the other, provided that the sample size n does not change.3. An increase in sample size will generally reduce both and, provided that the critical values are held constant.4. When the null hypothesis is false, increases as the true value of the parameter approaches the value hypothesized in the null hypothesis. The value of  decreases as the difference between the true mean and the hypothesized value increases.

HIPÓTESIS ESTADÍSTICAS (continuación)

19/04/2023 55

Inferencia sobre la media de una población, varianza conocida

n

XZ

oo

• Como se supone que la población cumple las condiciones del teorema del límite central, se utiliza el siguiente estadístico de prueba:

• Ho deberá rechazarse si o , si la hipótesis es de dos colas y o si la hipótesis es de una cola, para H1: m > m0 y H1: m < m0 respectivamente.

2azZ o 2azZ o azZ o azZ o

• Fórmulas para el tamaño de muestra para , a b y ddados.

Para hipótesis alternativa de dos colas

2

222

ba

zz

n

Para hipótesis alternativa de una cola

2

22

ba

zz

n

donde .o 57 58

19/04/2023 56

Inferencia sobre la media de una población, varianza conocida (continuación)

19/04/2023 57

Inferencia sobre la media de una población, varianza conocida

(continuación)

P

 0       2.02Z

0

0

55a

35 57

55

-2.83         0            2.83

Inferencia sobre la media de una población, varianza conocida (continuación)

P/2 P/2

19/04/2023 58

0

0

55

35

55

a a

19/04/2023 59

Inferencia sobre la media de una población, varianza conocida (con)

• Cuando se hacen cálculos del tamaño de la muestra o del error tipo II, en ocasiones es más conveniente utilizar las curvas de operación característica.• En estas curvas se gráfica b contra un parámetro d para varios tamaños de muestra n.• El parámetro d se define como:

Intervalos de confianza

0d

• El intervalo de confianza del 100(1 – a) por ciento para m está dado por

nzxnzx aa 22

19/04/2023 60

Inferencia sobre la media de una población, varianza conocida (con)

• Z = Estadístico normal estándar para cierto a.• k = desviación absoluta máxima permitida sobre la media de la distribución.• s = desviación estándar de la distribución.

Otra forma de calcular el tamaño de muestra: 2

2

k

zn

a

Donde:

19/04/2023 61

Inferencia sobre la media de una población, varianza desconocida

Estadístico de prueba:

- Ho deberá rechazarse si , si la hipótesis es de dos colas y o si la hipótesis es de una cola.

ns

xto

0

1,2 no tt a

1, no tt a 1, no tt a

Intervalos de confianza- El intervalo de confianza del 100(1 – a) por ciento para m está dado por

nstxnstx nn 1,21,2 aa

19/04/2023 62

Inferencia sobre la media de una población, varianza desconocida

• Ejemplo: Se desea determinar si el contenido promedio de los envases de un lubricante específico es de 10 litros, si los contenidos de una muestra aleatoria de 10 envases son:

                                                                                                             litros.    Utilice un nivel de significancia  a  de 0,01 y suponga que los 

contenidos se ajustan a una distribución normal.• Solución:

10,2 9,7 10,1 10,3 10,1 9,8 9,9 10,4 10,3 9,8

19/04/2023 63

Inferencia sobre la media de una población, varianza desconocida

0

a = 0,01 = 10

10,2 t = 0,7729,7 P= 0,46

10,1 P= 0,4610,310,1 9,81 <= <= 10,319,89,9

10,410,39,8

10,06 promedio0,2459 desv esta9.81 ≤ µ ≤ 10.31

19/04/2023 64

Región Crítica

Valor de P

1,2 no tt aHo deberá rechazarse si , si la hipótesis es de dos colas y o si la hipótesis es de una cola.

1, no tt a1, no tt a

Valor de t

75

19/04/2023 65

Inferencia sobre la media de una población, varianza conocida y desconocida

19/04/2023 66

Inferencia sobre la media de una población, varianza conocida (con)

- t = Estadístico de la distribución t student.- k = desviación absoluta máxima permitida sobre la media de la distribución.- s = estimador de la desviación estándar de la distribución.

Cálculo del tamaño de muestra:Cuando la media y la varianza se obtuvieron de una población n1 de 30 o menos elementos, entonces el cálculo óptimo del tamaño de muestra viene dado por la siguiente fórmula:

Donde:

2

2,11

k

tsn

n a

19/04/2023 67

PRUEBA DE HIPÓTESIS PRUEBA PARA LA MEDIA - CASO DE MUESTRAS GRANDES

19/04/2023 68

PRUEBA DE HIPÓTESIS PRUEBA PARA LA MEDIA - CASO DE MUESTRAS GRANDES (continuación)

3.3

=

=

19/04/2023 69

10.5  W.    El  Instituto  Eléctrico  Edinson  publica cifras  del  número  anual  de  kw-h  que  gastan varios aparatos electrodomésticos. Se afirma que una aspiradora  gasta un promedio de 46kw-h al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras  gastan  un  promedio  de  42kw-h  al año  con  una  desviación  estándar  de  11.9kw-h, ¿en un nivel de significancia de 0.05 esto sugiere que  las aspiradoras gastan, en promedio, menos de  46kw-h  anualmente?  suponga  que  la población de kw-h es normal.

19/04/2023 70

Solución:

19/04/2023 71

DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS• Estas pruebas representan un conjunto de herramientas 

analíticas muy importantes para el científico o el ingeniero.

• Se extraen dos muestras aleatorias independientes de tamaño n1 y n2, respectivamente de dos poblaciones con media m1 y m2, y varianzas conocidas s2

1 y s22. Se sabe 

que la variable aleatoria

• Si las varianzas son conocidas e iguales, s1 = s2 =   s el estadístico anterior se reduce a:

21

211

/1/1

2

nn

XXZ

19/04/2023 72

DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS (continuación)

• Los dos estadísticos anteriores sirves como base para el desarrollo de los procedimientos de prueba que incluyen dos medias.

• La hipótesis bilateral  sobre dos medias se escribe con bastante generalidad como

                               H0: m1 – m2 = d0

• La H1 puede ser bilateral o unilateral.• El estadístico de prueba está dado por:

22

211

2

021

// nn

dXXZ

19/04/2023 73

DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS (continuación)

VARIANZAS DESCONOCIDAS PERO IGUALES• Las situaciones que más prevalecen que implican 

pruebas sobre dos medias son aquellas con varianzas desconocidas 

• El estadístico de prueba es:• Donde  S2

p  está dado por:

• Se incluye la distribución t  y no se rechaza la hipótesis bilateral cuando:

2-nn/2,2-nn/2, 2121t t- aa t

t

19/04/2023 74

10.6 W.  Se lleva a cabo un experimento para comparar el desgaste  por  abrasivos  de  dos  diferentes  materiales laminados.  Se  prueban  12  piezas  del  material  uno, exponiendo  cada  pieza  a  una  máquina  para  medir  el desgaste. Se prueban 10 piezas del material 2 de manera similar.  En  cada  caso  se  observa  la  profundidad  del desgaste.  Las  muestras  del  material  1  dan  un  desgaste promedio (codificado) de 85 unidades con una desviación estándar de 4; en tanto las muestras de material 2 dan un promedio  de  81  y  una  desviación  estándar  de  5. ¿Podríamos concluir con un nivel de significancia de 0.05 que  el  desgaste  abrasivo  del  material  1  excede  el  del material  2  en  2  unidades?  Suponga  que  las  poblaciones son aproximadamente normales con varianzas iguales.

19/04/2023 75

Solución:

0

t0

Ya que  -2,086 <= t0=1,043 <= 2,086  no rechazar H0

t0.05,20= 2,086

64

76

1.-Cuando las muestras a probar involucran a más de 30 observaciones.

Ejemplo:La altura promedio de 50 palmas que tomaron parte de un ensayo es de 78 cm. con una desviación estándar de 2.5 cm.; mientras que otras 50 palmas que no forman parte del ensayo tienen media y desviación estándar igual a 77.3 y 2.8 cm.

Se desea probar la hipótesis de que las palmas que participan en el ensayo son más altas que las otras.  Consultando el valor z de la tabla a 95% de probabilidad se tiene que es 1.96, y dado que el valor z calculado no fue mayor al valor de la tabla,  entonces se declara la prueba no significativa.Conclusión: Las alturas promedio de los 2 grupos de palmas son iguales y la pequeña diferencia observada en favor al primer grupo se debe al azar.

19/04/2023

b

b

a

a

ba

nS

nS

XXZc

22

19/04/2023

2.-Caso de número igual de observaciones y varianzas homogéneas. Ejemplo:Se plantó cierto experimento en 24 parcelas para probar el efecto de la presencia o ausencia de K  en el rendimiento de palma. Peso medio del racimo (Kg.);  a = 0.05.

n a b a2 b2

1 20,0 24,0 400,00 576,002 24,0 28,0 576,00 784,003 21,0 25,0 441,00 625,004 22,0 25,0 484,00 625,005 23,0 27,0 529,00 729,006 24,0 27,5 576,00 756,257 22,5 28,0 506,25 784,008 22,0 26,0 484,00 676,009 21,5 26,0 462,25 676,00

10 20,0 24,5 400,00 600,2511 22,0 26,5 484,00 702,2512 24,0 28,5 576,00 812,25

Suma 266,0 316,0 5918,50 8346,00

Promedio y Varianza

22.16 26.33 2,02 2,24

Se busca en la tabla de t de student con  2 (n-1) grados de libertad o sea 22,  y  se  encuentra  que  el  valor tabular  es  de  2.074  al  95%  de probabilidad,  el  cual  es menor  que la  t  calculada  y  por  lo  tanto  se declara la prueba significativa.Conclusión: La  diferencia  entre promedios observados es atribuible al  efecto  de  tratamiento  (K),  por haberse  conseguido  un  resultado significativo.

77

n

SS

XXt

ba

ba

c 22

00,7

12

16,2233,2622

ab SStc

19/04/2023 78

3.-Caso de igual número de observaciones y varianzas heterogéneas. 

Ejemplo:Se plantó cierto experimento en 24 parcelas con dos clases de semillas: semilla mezclada y semilla DxP seleccionada. Se desea saber si el rendimiento observado por la semilla seleccionada difiere a la otra; a = 0.05.Producción de palma: TM/ha/año

Semilla Semillamezclada Seleccionada

1 10,0 18,0 100,00 324,002 13,5 14,2 182,25 201,643 12,4 22,5 153,76 506,254 11,3 13,0 127,69 169,005 12,8 15,0 163,84 225,006 12,0 16,5 144,00 272,257 11,5 19,5 132,25 380,258 12,5 17,0 156,25 289,009 12,4 19,5 153,76 380,2510 11,6 21,0 134,56 441,0011 12,0 22,5 144,00 506,2512 12,5 17,5 156,25 306,25

Sumas 144,5 216,2 20880,25 46742,44

Promedio y Varianza

12,04 18,02 0,78 9,63

n a2 b2

Consultando la tabla de t con n-1 grados de libertad (22) se encuentra un valor de 2.074, por lo tanto, la diferencia se declara significativa.Conclusión: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras.

42.6

12

78.0

12

63.9

04.1202.18

ct

19/04/2023

4.-Caso de diferente número de observaciones y varianzas homogéneas   Ejemplo:Se tomó una área de terreno distribuida en 22 parcelas y a 13 de ellas se les aplicó un fertilizante nitrogenado para medir el efecto del N en el crecimiento.Área foliar de la hoja # 17 en m2

n Con N (a) Sin N (b) a2 b2

1 8,0 6,0 64,00 36,002 9,0 6,5 81,00 42,253 8,5 7,0 72,25 49,004 9,4 6,5 88,36 42,255 9,3 6,4 86,49 40,966 8,4 7,1 70,56 50,417 8,5 7,2 72,25 51,848 8,6 6,2 73,96 38,449 8,0 6,3 64,00 39,69

10 8,5 72,2511 9,0 81,0012 8,5 72,2513 8,4 70,56

Sumas 112,10 59,20 968,93 390,84

Promedio y Varianza

8,62 6.57 0,19 0,18

Consultando la tabla de t con n-1 grados de libertad (20) se encuentra un valor de 2.086, por lo tanto, la diferencia se declara significativa.Conclusión: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras. 79

846.10

9

19.0

13

19.0

57.662.8

ct

19/04/2023 80

UNA MUESTRA: PRUEBA SOBRE UNA SOLA PROPORCION

• Considérese el problema de probar la hipótesis de que la proporción de éxitos de un experimento binomial es igual a algún valor específico, así

H0: p = p0

H1: p < p0

• Se utiliza una distribución binomial para calcular el valor de P así: P = P(X ≤ x cuando p = p0).

• El valor de x es el número de éxitos en nuestra muestra de tamaño n.

• Si este valor P es menor o igual a a, nuestra prueba es significativa en el nivel a y rechazamos H0 a favor de H1.

19/04/2023 81

UNA MUESTRA: PRUEBA SOBRE UNA SOLA PROPORCION (continuación)

• De madera similar para probar la hipótesis

H0: p = p0

H1: p > p0

• En el nivel de significancia a calculamos

P = P(X > x cuando p = p0)

• El valor de x es el número de éxitos en nuestra muestra de tamaño n.

• Si este valor P es menor que o igual a a, nuestra prueba es significativa en el nivel a y rechazamos H0 a favor de H1.

19/04/2023 82

UNA MUESTRA: PRUEBA SOBRE UNA SOLA PROPORCION (continuación)

• Finalmente para la hipótesis

H0: p = p0

H1: p ≠ p0

• Al nivel de significancia a, calculamos

P = 2P(X ≤ x cuando p = p0) si x < np0, o

P = 2P(X ≥ x cuando p = p0) si x > np0

• El valor de x es el número de éxitos en nuestra muestra de tamaño n.

• Si este valor P es menor o igual a a, nuestra prueba es significativa en el nivel a y rechazamos H0 a favor de H1.

19/04/2023 83

Ejemplo 10.10 WUn constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen actualmente en una ciudad. ¿Estaría de acuerdo con esta afirmación, si una encuesta aleatoria de casas nuevas en esta ciudad demuestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia del 0.10.Solución: 1. H0: p = 0.7

2. H1: p ≠ 0.7

3. a = 0.104. Estadístico de prueba: Variable binomial  X  con p = 0.7 y  n = 155. Cálculos:  x = 8 y   np0 = (15)(0,7) = 10.5.  Por lo tanto el valor 

de P calculado es:

6. Decisión: No rechace H0, ya que no hay razón suficiente para dudar de la afirmación del constructor. 

10.02622.07.0,15;27.0|828

0

x

xbpXPP

19/04/2023 84

Cálculos de 

a = 0,1n = 15x p0 0,000000011 0,000000502 0,000008203 0,000082944 0,000580585 0,002980296 0,011590007 0,034770018 0,08113003

0,131142572p = 0,26228515

10.02622.07.0,15;27.0|828

0

x

xbpXPP

19/04/2023 85

Ejemplo 10.11 W

• Un medicamento que se prescribe comúnmente para aliviar la tensión nerviosa se considera que es efectivo en tan solo el 60%. Resultados experimentales con un nuevo fármaco que se suministra a una muestra aleatoria de 100 adultos que padecen de tensión nerviosa demuestran que 70 tuvieron alivio. ¿Esta es evidencia suficiente para concluir que el nuevo medicamente es superior al que se prescribe actualmente? Utilice un nivel de significancia de 0.05. 

Solución: 1. H0: p = 0.6

2. H1: p > 0.6

3. a = 0.05 4. Región crítica: z = 1,645 5. Cálculos: x = 70, n = 100, = 70/100 = 0.7 y

P = P(Z > 2,04) < 0,0207

6. Rechace H0 ya que P = 0.0207 es menor que a = 0.05 y concluya que el nuevo fármaco es superior.

,04.2

100/4.06.0

6.07.0

z

nqp

Pp

nqp

Pp

Z

Z

2/

2/

a

a

p

19/04/2023 86

Prueba Chi-cuadrada

• La prueba de Chi cuadrada se usa para determinar si una población tiene una distribución teórica específica.

• Las pruebas se basan en qué tan buen ajuste se tiene, entre la frecuencia de ocurrencia (FO) de las observaciones en una muestra observada y las frecuencias esperadas (FE) que se obtienen a partir de la distribución hipotética.

19/04/2023 87

Ejemplo 02:• Considere la distribución de probabilidad que se obtiene al 

lanzar un dado legal un determinado número de veces, lo cual equivale a probar la hipótesis de que la distribución de resultados es la distribución uniforme discreta y  f(x) = 1/6, para x = 1, 2, 3, 4, 5, 6.

• Si lanzamos el dado 120 veces y se registra cada resultado, y si el dado está balanceado, se experimentaría que cada cara ocurriera 20 veces.

• Los resultados de este experimento se muestran a continuación:

Frecuencias 1 2 3 4 5 6Observada 20 22 17 18 19 24Esperada 20 20 20 20 20 20

19/04/2023 88

Ejemplo 02 (continuación):

• Al comparar las frecuencias observadas (FO) con las frecuencias esperadas (FE) correspondientes, se debe decidir si es posible que tales discrepancias ocurran como resultado de fluctuaciones del muestreo y de que el dado está balanceado o que éste no es legal, y de que la distribución de resultados no es uniforme.

• La prueba de bondad de ajuste entre las FO y las FE se basa en la cantidad

m

i i

ii

FE

FEFO

1

22

0

7.1

20

2024201920182017202252020 2222222

0

19/04/2023 89

Ejemplo 02 (continuación):

• Los grados de libertad v se determinan así:v = m – (k – 1), donde:m = número de clasesk = número de parámetros de la distribuciónv = 6 – (2 – 1) = 5c2

0.05,5 = 11.070

• Como c02 = 1.7 es menor que el valor crítico c2

0.05,5 = 11.070, no se rechaza H0. Se concluye que no hay suficiente evidencia de que el dado no esté balanceado.

19/04/2023 90

Ejemplo 03:

• Probar la hipótesis de que la distribución de frecuencias de las duraciones de baterías, dadas en la siguiente tabla puede aproximarse mediante una distribución normal con media m = 3.5  y una desviación estándar  s = 0.7.

No. Clase LIC LSC1 1,45 1,95 22 1,95 2,45 13 2,45 2,95 44 2,95 3,45 155 3,45 3,95 106 3,95 4,45 57 4,45 4,95 3

Límite de ClaseFrecuencias Observadas

FO

19/04/2023 91

Ejemplo 03 (continuación):

• Solución: En los datos suministrado se observan clases con frecuencias menores de 5, por lo tanto hay que unir clases consecutivas para que su frecuencia sea mayor o igual a 5, así:

No. Clase LIC LSC1 1,45 2,95 72 2,95 3,45 153 3,45 3,95 104 3,95 4,95 8

Nueva Tabla de Frecuencias Observadas Límite de Clase

FO

19/04/2023 92

Ejemplo 03 (continuación):

• Para calcular las FE se debe calcular primero la probabilidad esperada de cada frecuencia y el resultado multiplicarlo por el número de datos n.

• Clase 1: =-2.93 =-0.79

P = P(-2.93 < Z < -0.79) = P(Z < -0.79) – P(Z < -2.93)P = 0.2143

FE = 0.2143 * 40 = 8.573

19/04/2023 93

Ejemplo 03 (continuación):

• Los cálculos son los siguientes:

• Los resultados de los cálculos para cada FE se muestran en la siguiente tabla:

Cálculo FE1

Z1 = -2,93 p = 0,2143Z2 = -0,79 FE1 = 8,57

Cálculo FE2

Z1 = -0,79 p = 0,2555Z2 = -0,07 FE2 = 10,22

Cálculo FE3

Z1 = -0,07 p = 0,2683Z2 = 0,64 FE3 = 10,73

Cálculo FE4

Z1 = 0,64 p = 0,2410Z2 = 2,071 FE4 = 9,64

94

Ejemplo 03 (continuación):

• Las frecuencias observadas son:

19/04/2023

No. Clase LIC LSC1 1,45 2,95 7 -2,93 -0,79 0,2143 8,5732 2,95 3,45 15 -0,79 -0,07 0,2555 10,223 3,45 3,95 10 -0,07 0,64 0,2683 10,734 3,95 4,95 8 0,64 2,07 0,2410 9,64

Límite de ClaseFO z1 z2 FEp

Nueva Tabla de Frecuencias Observadas y Frecuencias Esperadas

19/04/2023 95

Ejemplo 03 (continuación):

• Cálculo de c20

No. Clase LIC LSC1 1,45 2,95 7 8,573 0,292 2,95 3,45 15 10,22 2,243 3,45 3,95 10 10,73 0,054 3,95 4,95 8 9,64 0,28

20 = 2,85

Nueva Tabla de Frecuencias Observadas y Frecuencias Esperadas

Límite de ClaseFO FE 2

0

19/04/2023 96

Ejemplo 03 (continuación):

• El valor de c20.05,3 = 7.815

• Conclusión:   Como c20 = 2.85 es menor que 

c20.05,3 = 7.815, no hay razón para rechazar H0 y 

se acepta que la distribución de probabilidades que modela los datos de las baterías  es una distribución normal con media m = 3.5  y una desviación estándar         s = 0.7.

19/04/2023 97

Prueba Chi-cuadrada

19/04/2023 98

El  primer  problema,  relacionado  con  los parámetros  de  una  distribución  conocida  o supuesta  es  el  problema  que  hemos  analizado  en los párrafos anteriores. 

Ahora examinaremos el problema de verificar  si el conjunto  de  datos  se  puede  ajustar  o  afirmar  que proviene de una determinada distribución. 

Las  pruebas  estadísticas  que  tratan  este  problema reciben el nombre general de “Pruebas de Bondad de Ajuste”.  Se  analizarán  dos  pruebas  básicas  que pueden aplicarse:

19/04/2023 99

La prueba de bondad de ajuste de Chi - Cuadrado y la prueba de bondad de ajuste de Kolmogorov-Smirnov. 

Ambas  pruebas  caen  en  la  categoría  de  lo  que  en estadística  se  denominan  pruebas  de  “Bondad  de Ajuste”  y miden,  como el nombre  lo  indica,  el  grado de  ajuste  que  existe  entre  la  distribución  obtenida  a partir  de  la muestra  y  la  distribución  teórica  que  se supone debe seguir esa muestra. 

Ambas pruebas están basadas en la hipótesis nula de que  no  hay  diferencias  significativas  entre  la distribución muestral y la teórica.

19/04/2023 100

Se utiliza una prueba de bondad de ajuste cuando se desea determinar si un conjunto de datos se ajusta a alguna distribución especifica.

1 Cntinuas: Normal, Exponencial, Uniforme,etc.

2 Discretas: Binomial, Poisson, hipergeometrica,etc.

Prueba de Bondad de Ajuste

19/04/2023 101

Prueba de Bondad de Ajuste

 de chi cuadrado

La prueba de bondad de ajuste de chi cuadrado está basada en la estadística

que tiene una distribución chi cuadrado con k - 1 grados de libertad, donde:k : Número de clases, foi: frecuencias observadas, fei: frecuenciasesperadas.Para utilizar esta estadística es necesario que fei ≥ 5; en algunos casos es necesario combinar celdas adyacentes para superar este inconveniente.

19/04/2023 102

grado

19/04/2023 103

DETERMINACION DEL TIPO DE DISTRIBUCION

1. Series de Tiempo.2. Tabla de Frecuencias.3. Tipo de Distribución.4. Validación tipo de Distribución:

a) Prueba de bondad de ajuste de c2  (Ji-Cuadrado).b) Prueba de bondad de ajuste de Kolmogorov –

Smirnov.

19/04/2023 104

Series de Tiempo:La mayor parte de la información se encuentra distribuida en series a través del tiempo, así:

DÍA PRODUCCIÓN DÍA PRODUCCIÓN1 25 11 52 5 12 73 3 13 104 8 14 425 6 15 86 8 16 117 2 17 158 13 18 209 15 19 3010 45  

19/04/2023 105

Gráfico de la Serie de Tiempo

0

5

10

15

20

25

30

35

40

45

50

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

DIAS

PR

OD

UC

CIO

N

19/04/2023 106

(continuación)• Esta información, tabulada en dicho formato 

no es de utilidad cuando se trata de obtener un comportamiento basado en variabilidad con cierto comportamiento probabilístico.

• Así pues, si el analista desea conocer el comportamiento, es necesario modificar la forma de datos y presentarla como tablas de frecuencia, con la finalidad de realizar cualquiera de las siguientes pruebas:

a) Prueba de bondad de ajuste de c2 (Ji-Cuadrado)b) Prueba de bondad de ajuste de Kolmogorov -

Smirnov

19/04/2023 107

DATOS OBSERVADOS DE LA DEMANDA DE AUTOMOVILES DURANTE 42 DIAS

DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA1 11 12 11 23 7 34 12 10 13 0 24 13 35 23 0 14 7 25 11 36 74 2 15 6 26 8 37 15 7 16 8 27 3 38 56 5 17 1 28 2 39 97 8 18 4 29 2 40 138 12 19 4 30 0 41 109 13 20 3 31 12 42 1210 9 21 11 32 711 9 22 7 33 5

Ejercicio No. 1:

19/04/2023 108

DEMANDA DE AUTOMOVILES DURANTE 42 DIAS

0

2

4

6

8

10

12

14

1 4 7

10

13

16

19

22

25

28

31

34

37

40

DIAS

DE

MA

ND

A

19/04/2023 109

Regla de Sturgesm = 3.3(log n) + 1

Donde  n  es el número de medidas y  log n  es el logaritmo de  n  en base 10

CÁLCULO DEL NÚMERO DE CLASES

nm

19/04/2023 110

GRÁFICO DE FRECUENCIAS

0

2

4

6

8

1 2 3 4 5 6 7

INTERVALO

FR

EC

UE

NC

IA

SOLUCION UTILIZANDO LA PRUEBA DE BONDAD DE AJUSTE DE JI-CUADRADO1º- Agrupar lo n datos en una tabla de frecuencia con:

736,6

1623,1*3,3

1)42log(3,3

748.6

42

m

m

m

m

m

nm

R = U – Lw = R/m

INTERVALO FRE. OBSERV.DE A FOi

1 -0,5 1,5 62 1,5 3,5 63 3,5 5,5 54 5,5 7,5 75 7,5 9,5 66 9,5 11,5 67 11,5 13,5 6

NUMERO DE CLASES m

TABLA DE FRECUENCIA

2º- Establecer la hipótesisCon base en el gráfico de la tabla de frecuencias, la distribución de probabilidades que mejor modela los datos es la distribución uniforme, con parámetros b = 13,5  y  a = -0,5, quedando de esta forma:

19/04/2023 111

14

1

)5,0(5,13

11)(

abxf

H0: La distribución es Uniforme, así:H1: La distribución no es Uniforme

14

1)( xf

3º- Calcular la frecuencia esperada FEi • Con base en la distribución de probabilidades 

propuesta en la hipótesis nula, se calcula la frecuencia esperada así:

• Como la hipótesis es una distribución uniforme, todos los intervalos tienen la misma frecuencia esperada, así:

19/04/2023 112

i

i

i

i

ls

li

ls

lii dxndxxfnFE14

1)(

614

242

1442

14

142

5.5

5.3

5.5

5.33 x

dxFE

En la siguiente tabla se muestra el cálculo de las frecuencias esperadas

19/04/2023 113

INTERVALO FRE. OBSER. FRE. ESPER.

DE A FOi FEi

1 -0,5 1,5 6 62 1,5 3,5 6 63 3,5 5,5 5 64 5,5 7,5 7 65 7,5 9,5 6 66 9,5 11,5 6 67 11,5 13,5 6 6

NUMERO DE

CLASES m

1o. TABLA DE FRECUENCIA

4º- Cálculo del Estimador c02

• Este estimador se calcula utilizando la siguiente ecuación:

• Desarrollándola se tiene:

19/04/2023 114

m

i i

ii

FE

FEFO

1

22

0

333,0

6

6766565 2222

0

5º- Comparación del estimador c02 con c2

,a v

• Si el estimador c02 es menor o igual que el valor 

correspondiente a c2,a v   con    v = m – (k -1) grados de 

libertad y un nivel de confianza de 1 – a, entonces  no hay razón para rechazar la hipótesis nula.

• Para el ejemplo se tiene:

• Como c02 = 0,333 es mucho menor que  c2

0.05,6 = 12,59   no hay razón para rechazar la hipótesis nula de que la distribución de probabilidades es uniforme.

19/04/2023 115

59.1226,05.0

2))12(7,(05.0

2))1(,( a km

19/04/2023 116

Ejercicio No. 2:

DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA1 1 14 5 27 4 40 12 2 15 1 28 1 41 83 3 16 2 29 6 42 24 4 17 7 30 1 43 15 1 18 1 31 5 44 56 2 19 2 32 2 45 27 1 20 4 33 1 46 38 2 21 3 34 4 47 49 1 22 1 35 3 48 710 3 23 6 36 2 49 211 5 24 1 37 1 50 612 2 25 3 38 2 51 113 1 26 1 39 3 52 2

DATOS OBSERVADOS DE LA DEMANDA DE CAFÉ DURANTE 52 DÍAS

19/04/2023 117

19/04/2023 118

SOLUCION UTILIZANDO LA PRUEBA DE BONDAD DE AJUSTE DE JI-CUADRADO1º- Agrupar lo n datos en una tabla de frecuencia con:

82111026,752 nm R = 8 w = 1

FRE. OBS.

DE A FOi

1 0,5 1,5 172 1,5 2,5 133 2,5 3,5 74 3,5 4,5 55 4,5 5,5 46 5,5 6,5 37 6,5 7,5 28 7,5 8,5 1

SUMA 52

NUMERO DE CLASES m

TABLA DE FRECUENCIA INTERVALO

19/04/2023 119

0 1 2 3 4 5 6 7 8 90

2

4

6

8

10

12

14

16

18GRÁFICO DE FRECUENCIA FOi

DÍA

FREC

UEN

CIA

2º- Establecer la hipótesis

19/04/2023 120

Con base en el gráfico de la tabla de frecuencias, la distribución de probabilidades que mejor modela los datos es una distribución exponencial con media  l = 2,769, quedando de esta forma:

769,2/

769,2

11)( x

x

exf e

INTERVALO FRE. OBS.DE A FOi

1 0,5 1,5 17 1 172 1,5 2,5 13 2 263 2,5 3,5 7 3 214 3,5 4,5 5 4 205 4,5 5,5 4 5 206 5,5 6,5 3 6 187 6,5 7,5 2 7 148 7,5 8,5 1 8 8

Suma = 52 SUMATORIA = 144MEDIA = 2,769

NUMERO DE

CLASES

MARCA DE CLASE

MC * FOi

TABLA DE FRECUENCIA

19/04/2023 121

3º- Calcular la frecuencia esperada FEi

• Con base en la distribución de probabilidades propuesta en la hipótesis, se calcula la frecuencia esperada así:

• Como la hipótesis es una distribución exponencial, todos los intervalos tienen diferente frecuencia esperada, así:

Compendió: Ing. Rodrigo Wadnipar

i

i

i

i

ls

li

xls

lii dxendxxfnFE 769,2/

769,2

1)(

7611,153031.0*52152769,2

152

5.1

5.0769,2

5.1

5.0

769,2/1

xx edxeFE

19/04/2023 122

e = 2,71828182846 n = 52 = 2,769

Clase e-x/2,769 1 - e-x/2,770 Probi FEi

lim sup = 1 0,6969 0,3031 0,3031 15,76112 0,4857 0,5143 0,2112 10,98393 0,3385 0,6615 0,1472 7,65474 0,2359 0,7641 0,1026 5,33465 0,1644 0,8356 0,0715 3,71776 0,1146 0,8854 0,0498 2,59097 0,0798 0,9202 0,0347 1,8056

>8 0,0000 1,0000 0,0798 4,1515 Totales 1,00000 52

CALCULOS DE LA FRECUENCIA ESPERADA

19/04/2023 123

INTERVALO FRE. OBS. FRE. ESP.

DE A FOi FEi

1 0,5 1,5 17 15,76112 1,5 2,5 13 10,98393 2,5 3,5 7 7,65474 3,5 4,5 5 5,33465 4,5 5,5 4 3,71776 5,5 6,5 3 2,59097 6,5 7,5 2 1,80568 7,5 8,5 1 4,1515

SUMA 52 52

NUMERO DE CLASES m

TABLA DE FRECUENCIA

19/04/2023 124

4º- Cálculo del Estimador c02

• Este estimador se calcula utilizando la siguiente ecuación:

m

i i

ii

FE

FEFO

1

22

0

FRE. OBS. FRE. ESP.

FOi FEi

17 15,7611 0,097413 10,9839 0,37007 7,6547 0,05605 5,3346 0,02104 3,7177 0,02143 2,5909 0,06462 1,8056 0,02091 4,1515 2,3924

3,0438ESTIMADOR 02 =

(FEi - FOi)^2 /FEi

19/04/2023 125

5º- Comparación del estimador c02 con c2

,a v

• Si el estimador c02  es menor o igual que el valor 

correspondiente a c2a,v  con    m – (k -1) grados de 

libertad y un nivel de confianza de 1 – a, entonces  no hay razón para rechazar la hipótesis nula.

• Para el ejemplo se tiene:

• Como c02 = 3,0438 es mucho menor que  c2

0.05,8 = 15,51  no hay razón para rechazar la hipótesis nula de que la distribución de probabilidades es exponencial con media          l = 2,769.

Compendió: Ing. Rodrigo Wadnipar

51,1528,05.0

2))11(8,(05.0

2))1(,( a km

19/04/2023 126

EJEMPLOS RESUELTOS

19/04/2023 127

,!x

exf

x

x = 0, 1, 2, ...

19/04/2023 128

19/04/2023 129

5

19/04/2023 130

19/04/2023 131

19/04/2023 132

uniforme

19/04/2023 133uniforme.

uniforme.uniforme.

19/04/2023 134

19/04/2023 135

315,005,0105,01

101

599,005,0105,00

100

1101

0100

p

p

19/04/2023 136

19/04/2023 137

19/04/2023 138

8.1

40

4044

40

4034

40

4044

40

4038 2222

02

19/04/2023 139

EJERCICIOS PROPUESTOS

19/04/2023 140

EJERCICIO EN CLASE 01Determine si los contenidos de nicotina de cierta marca de cigarrillos se ajustan a una distribución normal de media   m = 1,8 y desviación estándar  s = 0,4: si una muestra aleatoria de contenidos arrojó los siguientes  valores:

0,7 1,4 1,6 1,7 1,8 1,9 2,1 2,30,9 1,5 1,6 1,7 1,8 1,9 2,1 2,31,1 1,5 1,7 1,7 1,8 1,9 2,1 2,41,2 1,6 1,7 1,8 1,9 1,9 2,1 2,51,4 1,6 1,7 1,8 1,9 1,9 2,2 2,6

19/04/2023 141

EJERCICIO EN CLASE 02Se seleccionan 3 artículos de un lote que contiene 5 artículos defectuosos y 3 artículos no defectuosos. Después de registrar el número X de artículos defectuosos, los artículos se reemplazan al lote y el experimento se repite 300 veces. Los resultados obtenidos son los siguientes:

Con un nivel de signicancia de 0,05 pruebe la hipotesis que los datos registrados se pueden ajustar mediante una distribución hipergeométricah(x; 8, 3, 5), x = 0, 1, 2, 3.

x 0 1 2 3f(x) 6 83 156 55

19/04/2023 142

EJERCICIO EN CLASE 03De acuerdo con el ejercicio anterior, suponga que la selección se realiza una por uno con reemplazo, realice el experimento 100 veces y determine si el número de artículos seleccionados Y  se ajustan a una distribuciónbinomial (Establezca cuáles serán los parámetros)

19/04/2023 143

EJERCICIO EN CLASE 04 Un proveedor indica que siempre entrega su mercancía en 7 

días o menos, el jefe del almacén hizo un muestreo de las últimas entregas de este proveedor y obtuvo los siguientes días de entrega para sus pedidos: 

  

 

Preguntas:a)  Verifique si en realidad sus pedidos tardan 7 días o menos.b)  Cuál es la distribución de probabilidades de las entregas de 

sus pedidos, use la prueba de bondad de ajustes de Ji-cuadrado

8 12 7 2 5 911 6 8 14 7 139 5 7 5 9 87 11 6 8 6 89 10 9 4 9 811 11 9 5 8 912 10 8 10 5 46 11 8 4 7 68 8 8 10 11 66

19/04/2023 144

• EJERCICIO EN CLASE 05• La siguiente tabla muestra la demanda de café a 

través del tiempo en toneladas/día, con base en esa información y usando la prueba de Ji-Cuadrado determine la distribución de probabilidades que más se ajusta a esos datos. 

DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA1 0 14 5 27 4 40 32 2 15 13 28 8 41 63 3 16 9 29 10 42 94 4 17 7 30 1 43 15 1 18 10 31 5 44 56 9 19 2 32 16 45 127 0 20 4 33 2 46 08 2 21 8 34 4 47 49 21 22 3 35 5 48 7

10 8 23 6 36 0 49 211 7 24 11 37 1 50 612 2 25 1 38 11 51 113 0 26 14 39 2

DATOS OBSERVADOS DE LA DEMANDA DE CAFÉ DURANTE 51 DÍAS

19/04/2023 145

• EJERCICIO EN CLASE 06• El peso en Kg. De 50 piezas se comporta 

aleatoriamente  de acuerdo con:

• Con base en los anteriores datos, determine con un nivel de confianza del 95%, la distribución de probabilidades que más se adecue  a ellos: Use la prueba de bondad de ajuste de Ji cuadrado

0.13 45.22 8.64 93.11 39.73 43.45 108.00 0.74 46.06 32.37120.50 56.14 33.80 12.78 7.08 2.87 77.08 18.60 55.67 5.5045.41 28.94 151.90 17.51 32.93 19.06 17.53 8.75 3.20 14.8620.87 6.44 3.20 103.90 20.90 47.26 120.30 0.62 29.57 33.3135.72 16.93 17.72 10.02 33.35 55.91 3.03 20.81 34.56 9.94