pruebas de hipotesis.pdf
TRANSCRIPT
Estadística y Control de Calidad. Unidad 2
PRUEBAS DE HIPÓTESIS
Martínez López Moises
Ingeniería Mecatrónica, Instituto Tecnológico de Tlaxiaco [email protected]
Resumen.
En este trabajo se describen los conceptos
de: prueba de hipótesis, hipótesis alternativa,
hipótesis nula, región de rechazo, distribución
normal, prueba t; Para las pruebas de hipótesis
generalmente se trabaja con la media aritmética,
media poblacional, desviación estándar y el
tamaño de la muestra, dentro del desarrollo de
este trabajo se presentan dos ejemplos de
pruebas de hipótesis, para tener una mayor
exactitud en el calculo de las medidas de
tendencia central y dispersión que se utilizan se
utilizo Matlab.
1. Introducción.
La estadística Inferencial tiene dos
principales actividades, una de ellas es la prueba
de hipótesis, estas son muy utilizadas en los
procesos de control de calidad, ya que tienen que
verificar que el producto que están realizando
cumpla con los estándares que debe de tener. En
el presente trabajo se abordaran los conceptos de:
prueba de hipótesis, hipótesis alternativa,
hipótesis nula, distribución normal estándar,
región de rechazo, errores tipo I y II, nivel de
significancia y prueba t, incluyendo ejemplos que
engloban cada tema tratado.
2. Hipótesis Estadística.
Spiegel Murray R. [1] expone que “Al
intentar alcanzar una decisión, es útil hacer
hipótesis (o conjeturas) sobre la población
implicada. Tales hipótesis, que pueden ser o no
ciertas, se llama hipótesis estadísticas. Son, en
general, enunciados acerca de las distribuciones
de probabilidad de las poblaciones. ”
3. Prueba de Hipótesis.
Larson Harold J. [4] define: “Una prueba
de hipótesis es una partición de un espacio
muestral en dos partes, llamadas la región de
rechazos (o región critica) y la región de
aceptación.”
Triola Mario F. presenta la siguiente
definición: “En estadística, una hipótesis es una
aseveración o afirmación acerca de una propiedad
de una población. Una prueba de hipótesis (o
prueba de significancia) es un procedimiento
estándar para probar una aseveración acerca de
una propiedad de una población.”
Con las definiciones que presentan los
diferentes autores se puede decir que las pruebas
de hipótesis son aquellas que sirven para poder
observar las propiedades de una población, una
prueba de hipótesis esta compuesta por la región
de aceptación y la región de rechazo.
4. Hipótesis Nula.
Chao Linconln L. [2] define que: “La
hipótesis nula, Ho, es una declaración tentativa de
que un parámetro de la población es igual a un
valor específico. A menudo en tal declaración está
implícita la idea de que “no hay diferencia” y de
ahí el nombre de hipótesis “nula”.”
[5] “La hipótesis nula (denotada por Ho)
es la afirmación de que el valor de un parámetro
de población (como una porción, media o
desviación estándar) es igual a un valor acervado.
La hipótesis se prueba en forma directa, en el
sentido de que se supone que es verdadera, y
llegamos a una conclusión para rechazar Ho o no
rechazar Ho.”
La hipótesis nula es aquella que esta
sujeta a comprobación, con el apoyo de la
declaración de parámetros y sus distribuciones,
ubicando su estadístico de prueba en la zona de
rechazo o aceptación, se podrá tomar la decisión
de aceptar o rechazar la hipótesis nula, y
finalmente presentar una conclusión del muestreo
que se haya realizado .
5. Hipótesis Alternativa.
Chao Linconln L. [2] presenta la
siguiente definición: “La hipótesis alternativa, H1,
Estadística y Control de Calidad. Unidad 2
es una declaración tentativa de que el mismo
parámetro de la población tiene un valor diferente
del especificado en la hipótesis nula.”
[5] “La hipótesis alternativa (denotada
por H1 o Ha o HA) es la afirmación de que el
parámetro tiene un valor que, de alguna manera,
difiere de la hipótesis nula.”
La hipótesis alternativa es la declaración
contraria a la hipótesis nula,
6. Distribución Normal Estándar.
Chao Linconln L. [2] expone que: “Para
obtener probabilidades para un cierto intervalo de
valores, es necesario conocer la distribución
probabilísticas. Sin embargo, hay tantas variables
normales que resultan poco práctico desarrollar
una distribución probabilística distinta para cada
una. Afortunadamente, existe una distribución
probabilística que puede aplicarse a cada una de
las posibles variables aleatorias normales: la
distribución normal estándar. Se trata de la
distribución probabilística de la variable normal
estándar Z, la cual se define como:
en donde X es la variable aleatoria normal que
tiene media y desviación típica . Obsérvese
que la puntuación Z es la diferencia entre el valor
observado de X y su media, expresada en
términos de su desviación típica. Entonces, el
valor de Z es igual al numero de desviaciones
típicas y a menudo se le denomina desviación
normal.”
Se puede observar que los parámetros de
la distribución normal estándar son la media ( ) y
desviación estándar ( ), cuyos valores son 0 y 1
respectivamente. Tomando en cuenta que la
grafica de esta distribución es simétrica con
respecto al eje que atraviesa la media igual a cero
( )
7. Estadísticos de Pruebas.
Mario F. Triola[5] define que: ”El estadístico
de prueba es un valor que se utiliza para tomar la
decisión sobre la hipótesis nula, y se calcula
convirtiendo al estadístico muestral (como la
proporción muestral , la media muestral , o la
desviación estándar muestral s) en una puntuación
(como z, t o X2), bajo el supuesto de que la
hipótesis nula es verdadera.
Estadístico de prueba para proporciones.
Estadísticos de prueba para medias.
O
Estadístico de prueba para desviaciones estándar.
El estadístico de prueba para una media usa la
distribución normal o la distribución t de estudent,
dependiendo de los requisitos que se satisfagan.”
Por lo que se puede concluir que el estadístico
de prueba es usado para decidir si se rechaza la
hipótesis nula (Ho)
8. Región de Rechazo.
Mario F. Triola[5] expone que: “Región
critica (o región de rechazo) es el conjunto de
todos los valores del estadístico de prueba que
pueden provocar que rechacemos la hipótesis
nula.”
Analizando la definición se puede decir que
la región de rechazo es la que puede provocar que
rechacemos la hipótesis nula, la región de rechazo
depende del valor que se le asigne a α (Nivel de
Significancia)
9. Nivel de Significancia.
Mario F. Triola [5] define que: “El nivel de
significancia (denotado por α) es la probabilidad
(1)
(2)
(3)
(4)
(5)
Estadística y Control de Calidad. Unidad 2
de que el estadístico de prueba caiga en la región
critica, cuando la hipótesis nula es verdadera
Analizando la definición se puede decir que
el nivel de significancia es el valor que se le
asigna a α, ya que de este depende la probabilidad
que el estadístico caiga en la región de rechazo, y
en algunos casos se puede cometer el error de
rechazar Ho cuando es verdadera.
10. Errores tipo I y tipo II.
Mario F. Triola [5] puntualiza que:
“Error tipo I: El error de rechazar la hipótesis
nula cuando en realidad es verdadera. Se utiliza el
símbolo α (alfa) para representar el error tipo I.
Error tipo II: El error de no rechazar la
hipótesis cuando en realidad es falsa. Se utiliza el
símbolo β (beta) para representar la probabilidad
de un error tipo II.”
11. Pruebas de dos colas, cola
izquierda, cola derecha.
Mario F. Triola [5] puntualiza que:
“Prueba de dos colas: La región critica se
encuentra en las dos regiones extremas (colas)
bajo la curva.
Prueba de cola izquierda: La región critica se
encuentra en la región extrema izquierda (cola)
bajo la curva.
Prueba de cola derecha: La región critica se
encuentra en la región extrema derecha (cola) bajo
la curva.”
12. Distribución t.
Gil Infante Said et al. expone [6] que:
“La distribución muestral de la estadística de
prueba t, llamada distribución t, tiene, como en el
caso de z, forma acampanada o de montículo, y es
perfectamente simétrica respecto a t=0. A
diferencia de z, es mucho más variable,
alargándose con rapidez hacia la derecha y hacia
la izquierda, un fenómeno que se puede explicar
fácilmente.”
También se puede decir que la
distribución t tiene también por característica que
se puede aplicar a muestras menores a 30,
A continuación se presentan dos
ejemplos de pruebas de hipótesis.
13. Ejemplo 1. Utilizando la Prueba z
En la materia de Estadística y Control de
Calidad se realizo un muestreo de diferentes
resistencias (100,270,330 y 1k), se
determinara si estas cumplen con las
especificaciones que el fabricante dice utilizando
la herramienta de prueba de hipótesis
*Pruebas de Hipótesis para las resistencias de
100.
Con ayuda de Matlab se obtuvieron los siguientes
valores de una muestra de 160 datos.
: 98.9488
: 0.5618
: 100
De acuerdo con el tamaño de la muestra se aplico
la prueba z, y se tendrá que determinar si:
Ho: =100. H1: ≠100.
z=-23.6756
Al asignarle el valor a (nivel de significancia)
=0.05, teniendo en cuenta que se tiene que probar
con una distribución de dos colas entonces
quedaría /2, por lo que Z/2= Z0.025=1.96.
|-23.6756|>|1.96| entonces se rechaza Ho.
Por lo que se acepta H1
Con esto se puede concluir que las resistencias no
cumplen con el valor de la especificación de 100
con un nivel de significancia del 5%
*Prueba de Hipótesis para las resistencias
de 270.
Estadística y Control de Calidad. Unidad 2
Con ayuda de Matlab se obtuvieron los
siguientes valores de de una muestra de 150 datos.
: 265.0662
: 2.4703
: 270
De acuerdo con el tamaño de la muestra
se aplico la prueba z, y se tendrá que determinar
si:
Ho :=270 H1 ≠270
z=-24.4732
Al asignarle el valor a (nivel de significancia)
=0.05, teniendo en cuenta que se tiene que probar
con una distribución de dos colas entonces
quedaría /2, por lo que Z/2= Z0.025=1.96.
|-24.4732|>|1.96| entonces se rechaza Ho.
Por lo que se acepta H1
Con esto se puede concluir que las resistencias no
cumplen con el valor de la especificación de 270
con un nivel de significancia del 5%
*Pruebas de Hipótesis para las
resistencias de 330
Con ayuda de Matlab se obtuvieron los
siguientes valores de una muestra de 160 datos.
: 324.7563
: 2.3943
: 330
De acuerdo con el tamaño de la muestra
que tenemos se aplico la prueba z, y se tendrá que
determinar si:
Ho: =330. H1: ≠330.
z=-27.7151
Al asignarle el valor a (nivel de significancia)
=0.05, teniendo en cuenta que se tiene que probar
con una distribución de dos colas entonces
quedaría /2, por lo que Z/2= Z0.025=1.96.
|-27.7151|>|1.96| entonces se rechaza Ho.
Por lo que se acepta H1
Con esto se puede concluir que las resistencias no
cumplen con el valor de la especificación de 330
con un nivel de significancia del 5%
*Pruebas de Hipótesis para las
resistencias de 1K.
Con ayuda de Matlab se obtuvieron los
siguientes valores de una muestra de 160 datos.
: 984.2375
: 7.1756
: 1000
De acuerdo con el tamaño de la muestra
que tenemos se aplico la prueba z, y se tendrá que
determinar si:
Ho: =330. H1: ≠330.
z=-27.7900
Al asignarle el valor a (nivel de significancia)
=0.05, teniendo en cuenta que se tiene que probar
con una distribución de dos colas entonces
quedaría /2, por lo que Z/2= Z0.025=1.96.
|-27.7900|>|1.96| entonces se rechaza Ho.
Por lo que se acepta H1
Con esto se puede concluir que las resistencias no
cumplen con el valor de la especificación de 1K
con un nivel de significancia del 5%
Estadística y Control de Calidad. Unidad 2
14. Ejemplo 2. Utilizando la Prueba t
“Student”.
En la materia de Estadística y Control de
Calidad se realizo un muestreo de unos
relevadores. Para saber si estos cumplen con las
especificaciones se utilizara la prueba t por el
número del tamaño de la muestra.
n=15
Con ayuda de Matlab se obtuvieron los siguientes
valores de la muestra.
: 5.5707
: 0.5863
: 5
Determinar si:
Ho: =330. H1: ≠330.
Para la prueba t
t=3.771
Al asignarle el valor a (nivel de significancia)
=0.05, teniendo en cuenta que se tiene que probar
con una distribución de dos colas entonces
quedaría /2, por lo que Z/2= Z0.025=1.96.
|3.771|>|1.96| entonces se rechaza Ho.
Por lo que se acepta H1
Con esto se puede concluir que los relevadores no
cumplen con el valor de la especificación que dice
el fabricante con un nivel de significancia del 5%
15. Conclusión.
Las pruebas de hipótesis son un potente
auxiliar para los procesos de control de calidad, ya
que con ellas se pueden determinan mediante
muestreos si un producto se encuentra dentro de
la región de aceptación o dentro de la región de
rechazo, estas las podemos emplear para la toma
de decisiones importantes.
Referencias Bibliograficas
[1]Spiegel Murray R..- ESTADÍSTICA; Edit. Mc Graw
Hill; México’1995
[2]Chao Linconl L.- INTRODUCCION A LA
ESTADISTICA; Edit. Cecsa; México’1995
[3]Fuenlabrada Samuel; Probabilidad y Estadistica;
Edit.Mc Graw Hill; México’2004.
[4]Larson Harold J..-Introducción a la teoría de
probabilidades e inferencia Estadística; Edit. Limusa;
México’1992
[5]Triola Mario F..-ESTADISTICA; Edit.Pearson.
México’2009;
[6] Gil Infante Said y Zárate de Lara Guillermo
P..-Métodos Estadísticos; Edit.; Edit. Trillas;
México’ 1990.