tema: prueba o verificacion de hipotesis catedrático:

50
TEMA: PRUEBA O VERIFICACION DE HIPOTESIS Catedrático: Fernando Fernández Rodiles Introducción. Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de las características de un conjunto de datos (describirlos); tal vez no tendría el carácter de ciencia. El principal objetivo de la Estadística con lo cual actualmente le da una importancia relevante, es el de hacer inferencias acerca de una población a partir de una muestra; es decir hacer válido el resultado del análisis de un conjunto de elementos extraídos de una población (denominado muestra) para la población de la cual se obtuvo. Entendiendo por población a la colección de toda la posible información que caracteriza un fenómeno. Entendiendo por población, un concepto mucho más general del que tiene el significado común esta palabra, no necesariamente implica que está constituida por personas. En este sentido una población es cualquier colección ya sea de un número finito de mediciones o una colección grande, virtualmente infinita de datos acerca de algo de interés. Estadísticamente hablando de una población interesa conocer determinadas características de ella, las cuales se presentan en diferentes magnitudes en forma de valores; dichas características denominadas parámetros se pueden describir matemáticamente. Para llegar a conocer su valor, se puede proceder de dos formas: El Censo y El Muestreo. CENSO, consiste en analizar el 100% de los elementos que constituyen la población. MUESTREO, hace referencia al análisis de solo una parte representativa de los elementos que tiene la población. Una buena muestra es aquella que refleja las características esenciales de la población de la cual se obtuvo. En problemas cotidianos y reales se puede considerar que presenta mayores ventajas el muestreo con respecto al censo, algunas de las ventajas y desventajas se comentan a continuación. Ventajas del muestreo Más económico que el censo. Reduce considerablemente el tiempo de aplicación. _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag. Ingeniería Industrial 1

Upload: fernandez1234

Post on 15-Jun-2015

208 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Introducción.

Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de las

características de un conjunto de datos (describirlos); tal vez no tendría el carácter de ciencia.

El principal objetivo de la Estadística con lo cual actualmente le da una importancia relevante,

es el de hacer inferencias acerca de una población a partir de una muestra; es decir hacer válido el

resultado del análisis de un conjunto de elementos extraídos de una población (denominado muestra)

para la población de la cual se obtuvo.

Entendiendo por población a la colección de toda la posible información que caracteriza un

fenómeno. Entendiendo por población, un concepto mucho más general del que tiene el significado

común esta palabra, no necesariamente implica que está constituida por personas. En este sentido

una población es cualquier colección ya sea de un número finito de mediciones o una colección

grande, virtualmente infinita de datos acerca de algo de interés.

Estadísticamente hablando de una población interesa conocer determinadas características de

ella, las cuales se presentan en diferentes magnitudes en forma de valores; dichas características

denominadas parámetros se pueden describir matemáticamente. Para llegar a conocer su valor, se

puede proceder de dos formas: El Censo y El Muestreo.

CENSO, consiste en analizar el 100% de los elementos que constituyen la población.

MUESTREO, hace referencia al análisis de solo una parte representativa de los elementos que tiene

la población. Una buena muestra es aquella que refleja las características esenciales de la población

de la cual se obtuvo.

En problemas cotidianos y reales se puede considerar que presenta mayores ventajas el

muestreo con respecto al censo, algunas de las ventajas y desventajas se comentan a continuación.

Ventajas del muestreo

Más económico que el censo.

Reduce considerablemente el tiempo de aplicación.

Proporciona resultados más oportunos, dado que permite la obtención rápida de información

sobre un proceso variable y de alguna forma la determinación de su estado en un tiempo fijo.

Más adecuado cuando los datos se obtienen de la destrucción de los elementos en estudio.

Cuando la población es dinámica y no puede mantenerse el tiempo suficiente para su estudio.

Desventajas del muestreo.

Los resultados no son tan exactos como con el censo.

Requiere de una preparación o capacitación de la persona que lo aplica.

Pero respecto al muestreo. ¿Qué tan valida sería el resultado o la conclusión a la cual se llegara;

si la muestra en la cual se tomara la decisión estuviera basada en un segmento de la población que

no fuera representativo de la misma.

Ejemplos……..

¿Que tanta validez, confiabilidad o certeza, se tendría ………… ?

Si para obtener el grado de contaminación de un río, la muestra se obtuviera de las aguas del _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

1

Page 2: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

nacimiento del mismo.

Si para obtener el índice de personas analfabetas en el país la muestra se obtuviera de la

población que vive en las zonas urbanas.

Si para definir al candidato ganador en unas elecciones para ocupar un puesto a nivel nacional, la

muestra se obtuviera de una determinada ciudad o estado del país.

Si para obtener el índice de desempleo en un estado, la muestra se obtuviera de la población de

una ciudad industrial del mismo.

Por último, si para aceptar o rechazar el embarque relacionado con un pedido de 200 rollos de tela

de 150 mts. c/u. El encargado o responsable tomará la decisión del resultado de la inspección

efectuada a los rollos de tela seleccionados de aquellos de más fácil accesibilidad.

La respuesta a cada uno de los ejemplos sería la misma:

¡ Ninguna validez…. Ninguna confianza ….. Ninguna certeza !

Pero, la pregunta o preguntas ahora serían ………

¿Cuándo es o no válida una muestra?

¿Cuándo es o no confiable una muestra?

¿Cuándo es o no certera una muestra?

De igual manera, podría existir una sola respuesta a cualquiera de estos tres

cuestionamientos:

Tiene validez, es confiable o certero el resultado, cuando la muestra esta compuesta por

elementos que representen las características de la población.

TIPOS DE MUESTREO

Hay dos maneras de seleccionar elementos de una población para conformar una muestra:

Muestreo no aleatorio o a juicio.

Muestreo aleatorio o probabilístico.

MUESTREO NO ALEATORIO O A JUICIO.

Está basado en el siguiente criterio:

“No todas las muestras tienen un interés de generalización, pudiendo tener un

interés de tipo analítico"

Debido a ello, las muestras son seleccionadas de manera tal que contengan el tipo de

elementos sobre los cuales hacen referencia las proposiciones de la hipótesis que está siendo

sometida a prueba. El muestreo a juicio, también llamado no probabilístico o no aleatorio, se

realiza, teniendo conocimiento de las características de los elementos de la población; situación que

se toma en cuenta al momento de seleccionar los elementos que pasarán a formar parte de la

muestra en la realización del estudio. Ejemplo.

Una ama de casa que acude al súper a comprar manzanas; seleccionará para compra solo

aquellas manzanas que cubren las características para el fin que persigue en su utilización; aquellas

que son las “mejores”. Y puede ser, que para una ama de casa diferente, seleccionará manzanas con

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

2

Page 3: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

otras características, pero para ella serán las “mejores”.

El entrenador de la selección nacional de fútbol, seleccionará solo los “mejores” jugadores. Que

serán aquellos jugadores que piense les serán aptos para el sistema que desea implantar.

Por lo expuesto anteriormente, la selección de los elementos que constituyen la muestra se realiza

en base al criterio o juicio del investigador. Estos no se seleccionan por procedimientos al azar sino en

base al conocimiento o interés que el investigador muestre sobre un determinado elemento, lo que

genera que no todos los elementos que forman parte de la población que se está analizando tienen

probabilidad de ser seleccionados. En lo general estos métodos no probabilísticos carecen de validez

científica, además que no tienen una base teórica para calcular la escala de error ni la

representatividad de la muestra, dado que los elementos seleccionados solo representan las carac-

teresticas de la persona que los elige.

De lo visto, puede decirse que son dos las principales características de los elementos

seleccionados de esta manera.

1. Los elementos de la muestra obtenida no representan las características de los elementos que

componen la población.

2. No todos los elementos que componen la población tienen la misma oportunidad de ser elegidos.

Los principales métodos de muestreo no probabilístico son:

MUESTREO DECISIONAL.

Se presenta cuando los entrevistadores o investigadores de campo utilizan su criterio para

elegir a los elementos con los cuales formarán la muestra. En este tipo de muestreo, el elemento

seleccionado cubre determinadas características las cuales son definidas a juicio del entrevistador.

Este tipo de muestreo es empleado en las llamadas " encuestas de opinión ", donde las personas que

se toman en cuenta para la muestra deben de cubrir determinadas características con el tema tratado.

MUESTREO DE CUOTA.

Se realiza una clasificación de la población en estudio en función al objetivo del estudio y se

utilizan estas categorías previamente fijadas para obtener un número predeterminado de elementos

de cada categoría. Son muestras casi estratificadas y son utilizadas por las agencias de investigación

de mercados. Esta técnica consiste en fijar un número de individuos por entrevistar y dejar totalmente

al entrevistador (profesional o no), su localización. El sesgo que introduce el entrevistador, al

seleccionar únicamente elementos que de acuerdo a su interés o facilidad determine que serán parte

de la muestra. Es una de las desventajas más importantes que tiene este tipo de muestreo.

MUESTREO BASADO EN EXPERTOS.

Los elementos se eligen con base en la opinión de personas con autoridad y suficientemente

informadas acerca de la población bajo estudio. Los elementos que formarán la muestra serán

resultado de la de la experiencia o conocimiento del comportamiento de la población analizada.

Por ejemplo en una investigación sobre la problemática de la educación en el bachillerato. Al _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

3

Page 4: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

entrevistar a los directores de escuelas de este nivel; la muestra estará formada por aquellos

dirigentes de las instituciones que se consideren más apropiadas al problema planteado.

MUESTRAS CASUALES.

Este método consiste en investigar a cualquier grupo de personas que son de fácil acceso o

que acuden a un lugar determinado. Son las muestras más utilizadas por los reporteros de los medios

de comunicación ( prensa, radio, televisión ), así como de algunas agencias que realizan estudios de

mercadeo de opinión. La técnica consiste en entrevistar a los individuos en forma casual, por ejemplo

a uno de cada cinco individuos que pasen por la calle.

MUESTREO ALEATORIO O PROBABILÍSTICO

Tiene como objetivo obtener muestras representativas de la población que se analiza basado

en la aleatoriedad en la selección de los elementos que formarán la muestra.

Puede decirse que son dos las principales características de los elementos seleccionados de esta

manera.

1. Los elementos de la muestra obtenida representan las características de los elementos que

componen la población.

2. Todos los elementos que componen la población tienen la misma oportunidad de ser

elegidos.

En lo general estos métodos tienen una base teórica para calcular la escala de error y la

representatividad de la muestra. Los principales métodos de muestreo aleatorio o probabilístico son:

MUESTREO ALEATORIO SIMPLE.

Procedimiento:

1. Asignar un número a cada uno de los elementos que constituyen la población.

2. Utilizando la tabla de números aleatorios (también llamada de dígitos aleatorios) ó bien,

introduciendo en un recipiente tantos papelitos numerados como elementos tiene la población y

una vez revueltos estos, extraer del recipiente tantos papeles como elementos formen la muestra.

Tabla de número aleatorios.

Está formada por filas (→) y columnas (↓). Dependiendo del autor, cada columna está

formada de diferente número de dígitos ( 2, 5, 10, … ). Los dígitos que forman las filas y columnas se

han generado por un proceso completamente aleatorio. La probabilidad que aparezca cualquier dígito

entre cero y nueve o una secuencia de dígitos es la misma en toda la tabla.

Ventajas del muestreo aleatorio simple.

a. De fácil aplicación.

b. Muy utilizado cuando la población de la cual se extraerán las muestras es finita.

c. Es el indicado cuando no se pueden formar grupos (estratos o conglomerados), con la población.

Desventajas del muestreo aleatorio simple.

a. Es difícil aplicarlo para poblaciones muy grandes.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

4

Page 5: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

b. Se requiere tener una lista completa de los elementos de la población.

MUESTREO ESTRATIFICADO.

Es empleado este tipo de muestreo cuando la naturaleza de la población y el objetivo del

estudio lo permiten. Consiste en formar grupos (estratos) con elementos que presentan pequeñas

diferencias entre sí; pero una diferencia significativa entre grupos o estratos.

Procedimiento

1. Definir de una manera clara y detallada la manera en que se formarán los estratos (elementos

con similares características ). Asociando a cada elemento con uno y solo un estrato.

2. Una vez especificados los estratos, se selecciona aleatoriamente de cada uno de ellos el número

de elementos que participarán en la muestra.

Ventajas del muestreo estratificado

a. Frecuentemente el costo de la recolección de los datos en el muestreo estratificado se reduce al

estratificar en grupos cuyos elementos tienen características similares pero que difieren de un

grupo a otro.

b. Garantiza que en la muestra estén participando elementos de los diferentes grupos que

constituyen la población, los cuales representan las diferentes características que están

contenidas en la misma, generando con ello mayor representatividad de la muestra.

c. Ofrece la oportunidad de comparación entre los diferentes estratos.

Desventajas del muestreo estratificado.

a. La principal y posiblemente la única, es que no siempre es posible conformar grupos o estratos

con elementos que presenten similitud en cuanto a las características del objetivo del estudio y

ello debido a que la naturaleza de la población no lo permite.

MUESTREO POR CONGLOMERADOS.

Se emplea el muestreo por conglomerados cuando por la naturaleza de la población y el

objetivo del estudio es posible formar grupos (llamados conglomerados), con elementos que

presentan significativas variaciones entre sí, pero existe similitud en cuanto a su conformación entre

grupos o conglomerados.

Procedimiento.

1. Se divide la población en grupos con elementos heterogéneos en cuanto a las características;

objeto del estudio.

2. Definidos estos se seleccionan aleatoriamente uno a uno los conglomerados hasta completar el

tamaño de la muestra.

3. Se efectúa un censo en los conglomerados seleccionados.

Ventajas del muestreo por conglomerados.

a. No se requiere tener una lista completa de los elementos de la población.

b. Para poblaciones grandes o dispersas reduce significativamente los costos con su aplicación.

Desventajas del muestreo por conglomerados.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

5

Page 6: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Si al conformar los conglomerados no se tiene el cuidado de que estos queden integrados con

elementos que difieren en sus características, en caso de ser estos seleccionados; desplazarán a

otros conglomerados más representativos de la población dado que si cubren condiciones de

heterogeneidad, provocando con ello que la muestra no represente adecuadamente a la población al

quedar excluidos por haberse completado el tamaño la muestra

Una manera de reducir el error de muestreo, es disminuir el número de elementos que

integran los conglomerados, lo que incrementará el número de conglomerados.

MUESTREO SISTEMATICO.

En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo

uniforme que es medido en tiempo, orden o espacio.

Procedimiento

1. Se define la magnitud del intervalo, la cual se obtiene al dividir el total de elementos de la

población entre el número de elementos que constituirán la muestra.

2. Se elige aleatoriamente un elemento dentro de los primeros "k" elementos que constituyen el

primer intervalo formado dentro del marco muestral y posteriormente se selecciona en forma

sucesiva el "k- ésimo " elemento que sigue al último que se obtuvo.

Ventajas del muestreo sistemático.

Es especialmente útil en auditorias, cuando la información relevante se registra en forma

ordenada; por ejemplo en computadora o en un archivo de tarjetas. La selección de cuentas de

crédito, registro de mantenimiento de equipo o datos de ventas de los registros de la compañía.

Desventajas del muestreo sistemático.

Hay situaciones en las que no debe emplearse. Por ejemplo, cuando existe una periodicidad

en el comportamiento de la población; en este caso el muestreo sistemático puede causar un sesgo,

al introducir el error de muestreo que resulta de la influencia periódica.

Frecuentemente los registros de ventas y los datos financieros que se observan en el tiempo,

tienen un comportamiento cíclico: las ventas en los restaurantes son mayores durante el fin de sema-

na que durante el resto de los días, los niveles de dinero en efectivo son más altos alrededor de los

días 15 y 30 de cada mes, los prestamos personales son más frecuentes en los meses de invierno.

Problema 1.La siguiente es una muestra del salario mensual obtenido por el personal de una empresa ubicada

en el norte del país. El monto del salario esta en función al puesto y funciones que tiene el personal. Los valores están expresados en miles de pesos. Estime el salario promedio de todo el personal.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

6

Page 7: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Seleccionando una muestra aleatoria de 20 elementos; aplicando el muestreo:1. ALEATORIO SIMPLE. 2. POR CONGLOMERADOS.

3. ESTRATIFICADO. 4. SISTEMATICO

1 2 3 4 5 6 7 8 9 10NIVEL: GERENTES

1 33.1 31.4 33.5 28.9 29.8 29.6 27.8 32.6 31.8 29.7 2 32.6 31.8 29.7 26.8 26.9 32.8 31.9 29.5 29.5 33.3

NIVEL: MANDOS MEDIOS 3 29.7 26.8 26.9 32.8 31.9 31.6 29.8 32.1 29.5 28.7 4 18.3 15.5 18.8 17.9 17.8 16.4 19.3 18.0 17.9 15.5 5 16.9 17.7 19.9 20.0 15.9 18.6 19.9 20.0 15.7 17.6 6 17.8 16.4 19.3 18.0 17.9 18.3 15.9 17.5 19.9 17.9 7 17.9 16.9 17.9 19.9 20.0 15.7 17.6 18.3 15.5 18.8 8 19.3 18.0 17.9 18.3 15.9 17.5 19.9 17.9 16.9 17.9

NIVEL: PERSONAL DE OFICINAS 9 2.3 2.5 1.9 2.0 1.9 1.8 2.4 2.8 2.4 2.010 1.8 1.9 2.0 1.9 2.0 2.3 2.5 1.9 2.0 1.911 2.6 1.9 2.0 1.9 1.8 2.4 1.9 2.0 2.3 2.5

NIVEL: PERSONAL OPERATIVO12 5.9 4.5 6.7 4.8 6.3 4.1 4.9 5.5 5.5 6.713 4.5 6.3 6.3 5.4 6.4 6.9 5.6 7.3 6.9 4.014 5.3 5.9 4.5 6.7 4.8 4.1 4.9 5.5 4.9 7.015 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.116 5.3 5.9 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.417 4.5 6.7 4.8 4.1 4.9 5.9 4.5 6.7 4.8 4.118 5.3 5.9 4.5 6.7 4.8 6.3 6.3 5.4 6.4 6.919 5.9 4.5 6.7 4.8 4.1 4.9 5.5 5.5 6.7 4.820 5.3 5.9 4.5 4.1 4.9 5.9 4.5 6.7 4.8 4.521 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.122 5.3 5.9 4.5 4.1 4.9 4.5 6.3 6.7 4.8 4.123 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.824 4.6 6.6 6.2 5.8 6.2 6.5 5.4 4.5 6.3 6.725 4.5 6.3 6.3 5.4 4.8 4.1 4.9 5.9 6.7 4.826 5.8 6.2 6.5 5.4 6.2 5.8 6.2 6.5 5.4 7.627 6.6 6.2 5.8 6.2 6.5 4.8 4.1 4.9 5.5 5.528 5.4 6.4 6.9 5.6 7.3 6.2 6.5 5.4 7.6 6.029 4.6 6.6 6.2 5.8 6.2 6.5 5.4 7.6 6.0 4.1

30 5.8 5.5 4.5 6.7 4.8 4.1 4.9 6.3 5.4 6.4 31 4.5 6.7 4.5 6.7 4.8 4.1 4.9 5.2 5.5 5.4

32 4.5 6.3 6.3 5.4 6.4 6.9 5.6 7.3 6.9 4.033 5.3 5.9 4.5 6.7 4.8 6.6 6.2 5.9 4.5 6.734 5.3 5.9 4.5 4.1 4.9

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

7

Page 8: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

ALEATORIO SIMPLE ESTRATIFICADO CONGLOMERADOS SISTEMATICO

PASOS A SEGUIR.1. Se asigna un número a ca-da uno de los elementos de la población.

2. Utilizando la tabla de núme- ros aleatorios o escribiendo en un papel todos los números que conforman la población se introducen en un recipiente y después de revolverlos se ex trae al azar la muestra.

VENTAJAS..a. Selecciona a la muestra por métodos que le permiten a ca- da elemento tener la misma probabilidad de formar parte de la muestra.

b. Para poblaciones finitas no muy extensas es el método más rápido y menos costoso.

DESVENTAJASa. El azar en la selección, en ocasiones no garantiza la repre- sentatividad de la muestra esto ocasiona la necesidad de incre- mentar el número de muestras.

PASOS A SEGUIR..1. Formar grupos con elemen- tos que tengan aproximadamen te las mismas características respecto al objetivo del estudio.2. De cada grupo o estrato for- mado, seleccionar el número de elementos que participaran en la muestra.

VENTAJAS.a. El costo de la recolección y análisis de los datos se redu- ce al estratificar en grupos cu-yos elementos tienen caracte- rísticas similares pero que difie- ren de un grupo a otro.b. Garantiza que en la muestra estén participando elementos con diferentes las característi- cas que componen la poblaciónc. Permite analizar diferencias entre los estratos sin necesidad de mayor trabajo.

DESVENTAJASa. Por la naturaleza de la pobla- ción en ocasiones no es senci- llo formar estratos

PASOS A SEGUIR..1. Formar grupos con elemen- tos que tengan diferencias signi ficativas respecto a las caracte- rísticas del estudio.2. Se selecciona uno a uno de los grupos hasta completar el tamaño se la muestra.3. Se realiza un censo en los conglomerados seleccionados.

VENTAJAS.a. No se necesita una lista de los elementos de la población. b. Para grandes poblaciones es más económico que otros.

DESVENTAJAS.a. Si al formar un conglomera- do no se cumple con la hetero- geneidad de sus elementos en caso de salir este seleccionado desplazará a otros conglomera- dos más representativos al que- dar excluidos por haberse com- pletado la muestra. b. Se contrarresta lo anterior reduciendo el número de ele-mentos en los conglomerados.

PASOS A SEGUIR.1. Se define un intervalo uniforme, medido en tiempo, orden o espacio ( k = N / n )

2. Se elige aleatoriamente un elemento del primer intervalo.

3. La posición que guarda el elemento seleccionado en el primer intervalo marca la posición de los demás elementos en los siguientes intervalos.

VENTAJAS.a. Útil cuando la información se tiene adecuadamente ordena- da, por ejemplo en computadora o en archivo de tarjetas ( auditorias, cuentas de crédito, da- tos de ventas, etc. ) DESVENTAJASa. Se corre el riesgo de que la muestra no sea representativa cuando los datos presentan tendencia cíclica, al seleccionar elementos que solo se presentan sistemáticamente.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag. Ingeniería Industrial

8

Page 9: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

CUESTIONARIO

1. ¿Cual es el objetivo del muestreo ?.2. ¿Cual es la relación del muestreo con la Estadística?3. ¿Cuándo es más conveniente el muestreo con respecto al censo?4. ¿Que significado tiene denominar a una muestra como muestra aleatoria?5. ¿Cuales de los siguientes ejemplos están relacionados con muestras aleatorias y

cuales no ? Explique en cada caso. Preguntas que de parte de la Gerencia de una tienda se aplican a cada décimo

cliente respecto a las ofertas que se realizan. Selección de árboles de un aserradero para ser convertidos en madera. Selección de “n” alumnos por el Director de una Escuela, para representar en un

concurso de conocimientos. Integrar a la Selección de fútbol para representar a México en la próxima Copa del

Mundo 2006 a celebrarse en Alemania. Control del contenido en peso de las cajas de una fabrica de galletas.

COMENTARIOS REFERENTES A LA APLICACIÓN DE MUESTREOAntes de definir el tipo de muestro a utilizar para la conformación de la muestra es

necesario identificar y delimitar los factores que afectan o modifican el resultado del análisis, que se pretende realizar.

En los ejemplos siguientes se enumeran algunos factores que pueden estar presentes en el estudio a realizar. Sin embargo, una vez identificados es necesario definir ¿Cuáles de ellos van a ser tomados en cuenta para la realización del estudio.

Ejemplos:Objetivo: Estimar el tiempo promedio en realizar el maquinado de una pieza.FACTORES.

1. El número de operarios que realiza esta operación.2. Las máquinas utilizadas para la realización de esta operación.3. Los tipos de herramienta de corte empleados para el maquinado de esta pieza.4. Las jornadas de trabajo (matutino, vespertino, nocturno, mixto).5. El tiempo durante la jornada en que serán tomadas las lecturas.

Objetivo: Estimar la preferencia por el consumo de una determinada marca de refresco.FACTORES.

1. Las edades de los consumidores.2. Las condiciones climatológicas.3. Como bebida sola o acompañado. 4. Los puntos de venta del producto.

Objetivo: Estimar el tiempo promedio en realizar el recorrido de una distancia..FACTORES.

1. Tipo de vehiculo.2. Analizar condiciones durante el traslado: hora en realizarlo, día de la semana,

temporada.3. Operario.4. Alternativas de rutas.

Objetivo: Estimar la preferencia por el voto de un candidato a un puesto público. FACTORES.

1. Las edades de los votantes.2. El nivel económico de las personas.3. El grado académico de las personas. 4. La región geográfica (norte, centro, sur). 5. Zona geográfica (urbana, rural)

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

9

Page 10: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Ejercicio I.

Utilizando las tablas de la distribución normal y mediante un bosquejo de un gráfico de la

curva normal, determine el valor del área involucrada en cada ejercicio.

1. p ( z < 1.02 ) 6. p ( -0.38 < z < 1.01) 11. p ( - 1.25 > z > 1.25 )

2. p ( z > -0.05 ) 7. p (-1.06 < z < 1.60) 12. p ( - 4.66 > z > -0.55 )

3. p ( z > -1.25 ) 8. p (-1.03 < z < -0.05) 13. p ( - 0.80 > z > 0.80 )

4. p ( z < 1.90 ) 9. p (- 1.85 < z < 6.53) 24. p ( -1.00 > z > 1.00 )

5. p ( z > -3.59 ) 10. p (- 3.59 < z < 3.59) 15. p ( - 5.25 > z > 4.75 )

Ejercicio II.

Encuentre el valor de z si el área bajo la curva normal estándar:

1. A la derecha de z es de 0.3085 6. A la derecha de z es de

0.5948

2. A la izquierda de z es de 0.3632 7. A la izquierda de z es de

0.6591

3. A la derecha de z es de 0.8006 8. A la derecha de z es de

0.1000

4. A la izquierda de z es de 0.6500 9. A la derecha de z es de

0.6443

5. A la derecha de z es de 0.7000 10. A la izquierda de z es de

0.0500

Ejercicio III.

Encuentre el valor de z si el área bajo la curva normal estándar:

1. Entre 0 y z con z positivo es de 0.1368 6. Entre 0 y z con z negativo es de 0.2019

2. Entre 0 y z con z positivo es de 0.0200 7. Entre 0 y z con z negativo es de 0.1500 _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

10

Page 11: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

3. Entre 0 y z con z positivo es de 0.1700 8. Entre 0 y z con z negativo es de 0.1000

4. Entre 0 y z con z positivo es de 0.3078 9. Entre 0 y z con z negativo es de 0.1910

5. Entre 0 y z con z positivo es de 0.0250 10. Entre 0 y z con z negativo es de 0.4500

TEOREMA DE CHEBYSHEV

Proporciona la estimación de la probabilidad de que una variable aleatoria asuma un

valor dentro de k desviaciones estándar de su media para cualquier valor de k.

La probabilidad de que una variable aleatoria que cuyo valor se distribuye

normalmente, asuma un valor dentro de k desviaciones estándar de la media es al menos

de: 1 – 1 / k 2. Esto es:

p ( - k < X < + k ) 1 - 1 / k2

Ejemplos:

Si k = 2

Entonces: p ( - 2 < X < + 2 ) 0.75 % de los valores de X

Si k = 3

Entonces: p ( - 3 < X < + 3 ) 0.89 % de los valores de X

Ejercicio 1. Si x se distribuye normalmente con media =55 y desviación estándar =10

I. Determine la: 1. p ( x > 39 ) 3. p ( 32 < x < 59 )2. p ( x < 55 ) 4. p ( 30 > x > 50 )

II. Determine Xo si:

5. p ( X > Xo ) = 0.35 7. p ( X > Xo) = 0.55

6. p ( X < Xo ) = 0.80 8. p ( X < Xo ) = 0.05

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

11

Page 12: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 1En las indicaciones de diseño del diámetro interior de la polea de una grúa mecánica se

distribuye aproximadamente en forma normal con una media de 25 cms. Con una tolerancia de ( + -- ) 0.15 cms. El torno de la empresa donde son fabricadas estas poleas se ajusta para producir las poleas con un diámetro de 25 cms. Pero debido a que no es un torno nuevo, este presenta desajustes que generan que el diámetro interior de las poleas presente una desviación estándar de 0.33 cms. Basados en estos datos determine el porcentaje de poleas maquinadas en este torno que tendrán un diámetro de: 1. Al menos 24.8 cms. 2. Cuando más 25.3 cms.3. Al menos 24.8 cms. 4. No menos de 25.2 cms pero al menos 25.5 cms.5. Entre 24.5 y 25 cms.6. Como máximo 23.8 pero mínimo 24.5 cms.7. Cuando más 23.9 cms. pero cuando menos 24.8 cms.8. Al menos ¿Qué diámetro interior tendrán el 65 % de las poleas maquinadas en este torno?9. Como máximo ¿Qué diámetro interior tendrá el 85% de las poleas maquinadas en el torno ?10. ¿Que porcentaje de poleas deberán rechazarse por no cubrir las especificaciones de diseño ?

Problema 2. Con objeto de establecer la programación de "corridas" y de acuerdo con un estudio se estableció

que el tiempo promedio en recorrer la distancia Orizaba-Puebla (sin paradas en terminales intermedias), por los autobuses de una línea camionera se distribuye normalmente con una media de 2 horas con 10 minutos y con una desviación estándar de 25 minutos. En base a estos datos determine:

1. ¿ Cuantos de los próximos 55 autobuses que realicen este recorrido lo harán en un tiempo no mayor de 135 minutos ?.

2. ¿ Al menos que tiempo harán el 45% de los autobuses ?3. ¿ Cuantos de los próximos 86 autobuses que realicen este recorrido lo harán en un tiempo mínimo

de 120 minutos ?.4. La probabilidad que un autobús realice un tiempo de al menos 110 pero cuando más 145 minutos

en recorrer esta distancia.5. ¿ Cuantos de los próximos 40 autobuses recorrerán esta distancia en un tiempo de al menos 140

minutos.6. ¿ Qué porcentaje de los autobuses hacen este recorrido en un tiempo máximo de 130 minutos

pero un mínimo de 145 minutos ?.7. ¿ Como mínimo en que tiempo harán este recorrido el 60 % de los autobuses ?.8. Si el tiempo programado es de mínimo 115 minutos y el máximo 150 minutos, en recorrer esta

distancia. ¿ Cuantos de los próximos 80 autobuses cubrirán su recorrido en este intervalo de tiempo ?.

9. ¿Cuándo más que tiempo harán el 75% de los autobuses?10. Si 3 horas, es el máximo de tiempo permitido en recorrer dicha distancia, ¿Qué porcentaje de los

autobuses llegarán fuera de este tiempo?.

Problema 3.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

12

Page 13: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

La máquina empleada para el llenado de las cajas de galletas de una determinada marca, está regulada para efectuar dicha operación, despachando en promedio 1 kg. con una desviación estándar de 55 grs. En base a esta información y suponiendo que el contenido de cada caja se distribuye normalmente determine:1. ¿Que porcentaje de cajas serán llenadas con al menos 975 grs. ?2. La probabilidad de que una caja contenga un mínimo de 980 grs. pero no más de 1050 grs.3. La fracción de cajas que contienen un máximo 980 grs. pero no menos de 1050 grs.4. ¿Que proporción de cajas serán llenadas con al menos 950 grs. pero cuando más 1 kg.?5. ¿Cuántas de las 500 próximas cajas a ser llenadas contendrán entre al menos 975 grs. pero

cuando más 1020 grs. ?. 6. La empresa podría ser sujeta a una multa si las cajas no contienen en promedio al menos 950 grs.

¿Habría probabilidad de que esto sucediera?.7. Por otra parte la empresa registraría perdidas si las cajas son llenadas con más de 1 050 grs.

¿Habría probabilidad de que esto sucediera?.

Problema 4. El consumo de refresco no embotellado en la cooperativa de una escuela en época de calores, se distribuye normalmente con una media de 85 litros diarios y una desviación estándar de 13 litros. En base a estos datos determine, el porcentaje de días en que el consumo:

1. Esta entre 70 y 90 litros diarios.2. Es de cuando más 90 litros diarios.3. Es de al menos 75 litros diarios.4. Es a lo más de 80 litros pero no menos de 87 litros diarios.5. Es mínimo de 75 pero máximo de 98 litros diarios.6. Cuando más ¿Cuál será el consumo en el 35% de los días en dicha época?.7. Al menos ¿Cuál será el consumo en el 55% de los días en época de calores?.8. Máximo ¿Cuál será el consumo en el 75% de los días en dicha época?.9. mínimo ¿Cuál será el consumo en el 35% de los días en época de calores?.10. Si la persona que administra la cooperativa no quiere quedarse sin refresco ¿Cómo mínimo

con que cantidad de refresco deberá contar al inicio del día si desea que no más del 15% de los alumnos que solicitan comprar refresco, se queden sin ser atendidos ?.

Problema 5.En general el mantenimiento preventivo es más barato que el que se lleva a cabo una vez que el

equipo falla debido a que se efectúa en periodos de tiempo menos críticos. Una planta utiliza 3000 bombillas eléctricas cuya duración tiene una distribución normal con una media de media de 1 200 horas y una desviación estándar de 185 horas. 1. ¿Con que frecuencia deben cambiarse las bombillas para que no más del 12% de ellas se fundan

en los periodos de reemplazo ?.2. Cómo máximo ¿Cuántas horas dilatarán el 90 % de las bombillas ?. 3. ¿Cuál es la probabilidad que una bombilla dure al menos 1000 hrs. pero cuando más 1 300 hrs. ?.4. ¿Cuál es la probabilidad que una bombilla dilate máximo 1 250 hrs. pero mínimo 1 525 hrs. ?.5. ¿Cuantas bombillas habría que cambiar a las 1 000 hrs. ?.6. El número de lámparas que estarán en servicio después de 1 350 horas.7. De acuerdo a las normas establecidas para espacios de este tipo "deben estar en servicio al

menos el 75 % de las lámparas”. ¿A las cuantas horas debe cambiarse las lámparas fundidas?8. Como mínimo ¿Cuánto durarán el 55 % de las lámparas?9. Si para cubrir las condiciones de iluminación no deben estar fundidas más del 35 % de las

lámparas ¿A las cuantas horas habrá que cambiar las lámparas fundidas?10. Si no debe haber más de 200 lámparas fundidas en el local. ¿A las cuantas horas sucederá esto?

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

13

Page 14: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

11. Para una adecuada iluminación del local deberán estar en funcionamiento al menos 1 100 lámparas. ¿A las cuantas horas debe cambiarse las lámparas fundidas?

TEOREMA DEL LÍMITE CENTRAL

- Los valores de las medias obtenidas de muestras de magnitud n (con n > 30)

seleccionadas de una población con media y desviación estándar tendrán aproximadamente una distribución normal.

- Los valores de las medias obtenidas de muestras seleccionadas de poblaciones que se

distribuyen normalmente tendrán una distribución normal sin importar la magnitud de n.

De donde se tiene que:

La media o promedio de todas las medias de las muestras extraídas de la

población es igual a la media de toda la población

=

La desviación estándar de las muestras:

Para poblaciones grandes ( 20 n < N )

Para poblaciones pequeñas ( 20 n ≥ N )

Estandarización de los valores de ( pasar de a z ) :

Desestandarización de los valores de z ( pasar de z a )

Ejercicio 1.

I. Si se distribuye normalmente con μ = 80, σ =11 y n= 37 determine la:

1, p ( > 76.1) 2. p ( < 73. 9 ) 3. p(74.5 > > 76.5) 4. ,p (75.9 > > 76.8)

II. Determine el valor de si

5. p( > ) = 0.8729 6. p( < ) = 0.2843 7. p( < )=0.6368

III. Determine la probabilidad que el promedio sea de: _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

14

Page 15: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

8, Al menos 76.60 9, Cuando más 74.40 10, Mínimo de 74.35 pero máximo de 75.50.

IV. 11. Al menos ¿Cuál será el valor del 45 % de las medias de estas muestras ? 12. Máximo ¿Qué valor tendrán el 65 % de estas muestras ?.

Problema 1. El fabricante de baterías (acumuladores) para automóvil marca “AMERICA” afirma que estos tienen una vida útil que se distribuye normalmente con una media de 4.7 años y una desviación estándar de 0.95 años. Basado en estos datos determine:1. ¿Cuantos de los próximos 500 acumuladores fabricados tendrán una duración entre 5

y 6 años? 2. Máximo cuanto durarán el 25 % de los acumuladores de esta marca.3.¿Cuantos de los próximos 450 fabricados tendrán una duración de cuando menos 3.5

pero a lo más 5.3 años ?. 4.Mínimo que duración tendrán el 35 % de los acumuladores de esta marca.

5. ¿ Cuantos de los próximos 300 acumuladores fabricados tendrán una duración entre 7 y 8 años ?.

6. ¿Cuantos de los próximos 250 acumuladores fabricados tendrán una duración de no más de 5 años?

7. Una compañía de taxis con el objeto de evitar contratiempos al ofrecer servicio por política ha definido que la probabilidad de que el acumulador le falle no debe sobrepasar el 15%. En que tiempo deberá cambiar el acumulador de sus vehículos.

8. Al menos ¿Qué duración tendrán el 40 % de los acumuladores de esta marca?9. A lo sumo ¿Cuál será la duración del 90% de estos acumuladores?10. El fabricante repone por un acumulador nuevo, cualquier acumulador que resultase

defectuoso en su periodo de garantía. ¿Qué garantía debe ofrecer el fabricante en tiempo si no quiere reponer más del 10% de los acumuladores vendidos ?.

Problema 2. La máquina empleada para el llenado de sacos de azúcar en un Ingenio Azucarero, está regulada para efectuar dicha operación, despachando en promedio 50 Kgs. con una desviación estándar de 2.5 kgs. El control del peso vertido se verifica tomando periódicamente una muestra de 15 sacos, calculando el contenido promedio. Si el valor promedio de estas muestras se distribuye nor-malmente. Determine la probabilidad que el peso promedio de cualquiera de estas muestras sea de:1. Al menos 49.5 kgs.2. Máximo 51.5 kgs.3. No menos de 49 pero a lo más 51 kgs.4. Mínimo 47 pero máximo 50 kgs.5. Más de 50.5 kgs. pero a lo sumo 53 kgs.6. No más de 48 kgs. pero como mínimo 49.5 kgs.7. Cuando más ¿Cuál será el valor del 83 % de las muestras de esta magnitud ?. 8. Cuando menos ¿Cuál será el valor del 60 % de las muestras de esta magnitud ?.9. ¿ No mayor de que valor tendrá el 83 % de las muestras de esta magnitud ?. 10. Cuando menos ¿Cuál será el valor del 60 % de las muestras de esta magnitud ?.

Problema 3.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

15

Page 16: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Con el objeto de verificar el peso real de llenado de una máquina en una empresa galletera, un estudio de la misma arrojó que el contenido promedio de las cajas en una de sus presentaciones; llenadas con esta máquina está normalmente distribuida con una media de 995 gramos y una desviación estándar de 21 gramos. Determine el porcentaje de cajas llenadas con:1. Al menos 950 gramos pero cuando más 1010 gramos. 2. Un máximo de un kilogramo. 3. Si se genera una perdida en las utilidades cuando las cajas son llenadas con 1025 gramos ó más.

¿ Que % de las cajas es llenado con este contenido ?.4. Si se esta sujeto a una sanción económica cuando las cajas no tengan un contenido mínimo de

975 gramos. ¿ Existe esta posibilidad ?.5. Si son utilizados cajas con una capacidad de 1050 gramos. ¿Cuántas cajas posiblemente no

podrán ser cerradas de las próximas 1000 cajas ?. 6. Al menos ¿Que contenido de galletas contendrán el 35 % de las cajas llenadas por esta máquina?7. Máximo ¿Que contenido de galletas contendrán el 45 % de las cajas llenadas por esta máquina?8. Cuando menos ¿Que contenido de galletas contendrán el 75 % de las cajas llenadas por esta

máquina?9. No más de ¿Que contenido de galletas contendrán el 85 % de las cajas llenadas por esta

máquina?10. Aplique e interprete el teorema de Chebyshev cuando: K = 2 y k =3.

Problema 4. La máquina empleada para el llenado de las cajas de galletas de una determinada marca, está regulada para efectuar dicha operación, despachando en promedio 1 000 grs. con una desviación estándar de 95 grs. En base a esta información, determine la probabilidad que muestras seleccionadas aleatoriamente de 65 cajas contengan en promedio:1.¿ Al menos 985 grs. ?2.La fracción de muestras de esta magnitud que pesen en promedio un máximo 980 grs. pero no

menos de 1 020 grs.3.¿Que proporción de muestras de esta magnitud pesaran en promedio al menos 975 grs. pero

cuando más 1 kg.?4. Al menos cuanto pesarán en promedio el 60% de las muestras.5. Cuando más cuanto pesarán en promedio el 35% de las muestras. 6. Para verificar si se esta cumpliendo con el peso etiquetado en una inspección la PROFECO

selecciona aleatoriamente 20 cajas y aplica una sanción en caso que el peso promedio obtenido en la muestra no contenga al menos el 95% del peso etiquetado. ¿Habría probabilidad de que esto sucediera?.

7. Por otra parte la empresa para controlar el peso selecciona aleatoriamente 15 cajas y para el proceso para corregirlo, si el peso promedio de la muestra no esta entre un 5% del peso etiquetado. ¿En que porcentaje de las muestras el peso promedio se sale de este rango?.

8. Mínimo cuanto pesarán en promedio el 35% de muestras seleccionadas de 25 cajas?.9. Máximo cuanto pesarán en promedio el 80% de muestras seleccionadas de 30 cajas?.10. No más de cuanto pesarán en promedio el 25% de muestras seleccionadas de 15 cajas?.

Problema 5. Un fabricante de neumáticos para automóvil afirma que su vida útil promedio es de 25 000 kms. con una desviación estándar de 950 kms. En base a esta información determine: el porcentaje de llantas con una duración de:1. Al menos 34 000 kms.2. Cuando más 36 500 kms.3. Al menos 35 500 kms. pero cuando más 36 000 kms.4. No menos de 33 000 kms. pero cuando más 34 500kms. _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

16

Page 17: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

5. Entre 34 000 y 36 000 kms.6. Como máximo 33 500 pero mínimo 35 000 kms.7. Cuando más 35 900 pero cuando menos 36 300 kms.8. Al menos ¿Qué duración tendrán el 75 % de los neumáticos de esta marca?9. Como máximo ¿Cuál será la duración del 90 % de los neumáticos de esta marca?10. ¿Qué garantía debe ofrecer el fabricante en tiempo si quiere que no más del 10% de

los neumáticos vendidos sean devueltos ?.DISTRIBUCION t de Student

Si el valor de la variable aleatoria continua t se distribuye como una distribución t de Student.

I. Determinar la:

1. p ( t > -2.201 = 11 ) 6. p ( 0.879 > t > 2.228 = 10 )

2. p ( t < 1.943 = 6 ) 7. p ( 0.863 < t < 1.740 = 17 )

3. p ( t > 2.080 = 21 ) 8. p ( 2.042 > t > 2.750 = 30 )

4. p ( t < 0.856 = 25 ) 9. p ( 0.860 < t < 1.725 = 20 )

5. p ( t > 2.947 = 15 ) 10.p ( 1.061 > t > 1.717 = 22 )

II. Determinar el valor de to cuando:

1. p ( t > to = 11 ) = 0.25 6. p ( t < to = 11 ) = 0.85

2. p ( t < to = 19 ) = 0.75 7. p ( t > to = 9 ) = 0.80

3. p ( t > to = 21 ) = 0.025 8. p ( t < to = 18 ) = 0.25

4. p ( t < to = 10 ) = 0.975 9. p ( t > to = 23 ) = 0.25

5. p ( t > to = 17 ) = 0.99 10. p ( t < to = 30 ) = 0.25

III. Casos especiales: Determinar el valor de to cuando

1. p ( t > to = 51 ) = 0.25 6. p ( t < to = 11 ) = 0.93

2. p ( t < to = 36 ) = 0.75 7. p ( t > to = 9 ) = 0.17

3. p ( t > to = 45 ) = 0.025 8. p ( t < to = 18 ) = 0.87

4. p ( t < to = 54 ) = 0.975 9. p ( t > to = 23 ) = 0.13

5. p ( t > to = 33 ) = 0.99 10. p ( t < to = 30 ) = 0.18

IV. Otros casos: Determinar el valor de to cuando

1. p ( t < to = 46 ) = 0.92 3. p ( t > to = 49 ) = 0.17

2. p ( t > to = 45 ) = 0.012 4. p ( t < to = 38 ) = 0.87

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

17

Page 18: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

DISTRIBUCION Chi-Cuadrada

Si el valor de la variable aleatoria continua se distribuye como una

distribución Chi-Cuadrada.

Determine la:

1. p ( > 5.58 = 11 ) 5. p ( 3.94 < < 15.99 = 10 )

2. p ( < 21.3 = 22 ) 6. p ( 9.39 > > 26.00 = 18 )

3. p ( < 14.26 = 29 ) 7. p ( 11.81 < < 21.7 = 27 )

4. p ( > 18.55 = 12 ) 8. p ( 16.79 < < 29.3 = 30 )

II. Determinar el valor de cuando:

1. p ( > = 13 ) = 0.95 6. p ( < = 23 ) =

0.75

2. p ( > = 40 ) = 0.50 7. p ( > = 20 ) =

0.35

3. p ( < = 18 ) = 0.10 8. p ( < = 3 ) = 0.75

4. p ( < = 29 ) = 0.25 9. p ( > = 6 ) =

0.60

5. p ( > = 13 ) = 0.95 10. p ( < = 15 ) = 0.756

III. Casos especiales: Determinar el valor de cuando:

1. p ( > = 43 ) = 0.50 6. p ( > = 25 ) = 0.43

2. p ( < = 57 ) = 0.10 7. p ( < = 33 ) = 0.65

3. p ( > = 65 ) = 0.25 8. p ( > = 13 ) = 0.60

4. p ( < = 45 ) = 0.95 9. p ( > = 23 ) = 0.35

5. p ( > = 50 ) = 0.50 10. p ( < = 35 ) = 0.35

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

18

Page 19: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

IV. Otros casos especiales: Determinar el valor de cuando:

1. p ( > = 48 ) = 0.30 3. p ( < = 53 ) = 0.72

2. p ( < = 56 ) = 0.35 4. p ( > = 63 ) = 0.60

DEFINICIÓN.

Estadística es el arte o ciencia de coleccionar reunir y analizar información procedente de una población para inferir a partir de ella en una serie de conclusiones, las cuales son válidas para la población de la cual se extrajo la información..

Para su estudio la Estadística se divide en dos áreas:

ESTADÍSTICA DESCRIPTIVA.

ESTADÍSTICA INFERENCIAL.

ESTADÍSTICA DESCRIPTIVA:

Tiene como objetivo el procesamiento de información obtenida de una muestra o toda una población con el objeto de definir valores o representarlos a través de gráficos de toda la información analizada.

ESTADÍSTICA INFERENCIAL: Consiste en analizar el resultado del análisis hecho a una muestra seleccionada aleatoriamente de

una población, haciendo válido dicho resultado para toda la población de la cual se extrajo la muestra. Se pueden hacer inferencias acerca de los parámetros de una población de dos formas:

I. ESTIMACIÓN DE PARÁMETROS. Estimar el valor del parámetro de una población

II. PRUEBA O VERIFICACION DE HIPÓTESIS. Verificar si el valor que se supone tiene

el parámetro de una población es cierto o es falso.

En ambos casos se toma como base el resultado obtenido al analizar una muestra obtenida de la población que interesa y hacer valido el resultado para toda la población de la cual se extrajo la muestra.

ESTIMACIÓN DE PARÁMETROS

ESTIMAR DEL VALOR DEL PARÁMETRO DE UNA POBLACIÓN. Es definir a través de un proceso estadístico, el valor aproximado del verdadero valor que tiene el parámetro de una población a partir del análisis de una muestra de elementos extraídos de la población de la cual se extrajo. La estimación del parámetro de una población puede realizarse de dos maneras:

a. Estimación puntualConsistente en definir un único valor del parámetro que se está estimando.Ejemplos:

1. “Se estima que el porcentaje de piezas defectuosas al final de una línea de producción es del 8%“

2. “ El volumen promedio de gasolina vendida por día en una estación de serviciose estima en 3500 lts”.

3. “Se estima que la varianza con respecto al promedio de duración de una bombilla eléctrica de la marca OSRAM en 800 horas ”.

b. Estimación por intervalo.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

19

Page 20: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Consistente en definir un rango de valores ( con un límite inferior y otro superior) dentro del cual puede caer el verdadero valor del parámetro que se está estimando.

Ejemplos:1. “Se estima que el porcentaje de piezas defectuosas al final de una línea de producción está

entre el 7 y el 9% “

1. “ El volumen promedio de gasolina vendida por día en una estación de serviciose estima entre 3200 y 3800 lts”.

2. “La desviación estándar con respecto al promedio de la duración de una bombilla eléctrica de la marca OSRAM se estima entre 750 y 850 horas”.

Nivel de Confianza en la estimación del parámetro:

Mide que tan probable es que el valor estimado del parámetro se encuentra dentro del rango

de valores definidos en la estimación.

Esta Confianza o Probabilidad es expresada en porcentaje (%), en un rango de valores que

comúnmente se establece entre el 90 y 99 %.

MAGNITUD DE LAS MUESTRAS PARA SER EMPLEADAS EN LA ESTIMACIÓN DE

PARÁMETROS POBLACIONALES

El número de muestras necesarias para la estimación del parámetro de una población depende de

tres factores:

a. Del grado de confianza con que se pretende estimar el parámetro. Ha mayor confianza

deseada mayor deberá ser el número de elementos que compondrán la muestra Este grado

de confianza se ve reflejado en el valor del estadístico z en la curva normal.

b. De la heterogeneidad de los valores analizados en la muestra. Ha mayor diferencia o

dispersión de estos mayor será el número de elementos que compondrán la muestra. Esto se

refleja en el valor de la desviación estándar de la muestra ()

c. De la exactitud con la que se desee estimar el parámetro (E).

FORMULA EMPLEADA PARA OBTENER EL NÚMERO DE

MUESTRAS NECESARIAS PARA ESTIMAR:

LA MEDIA DE UNA POBLACIÓN

LA MEDIA DE UNA POBLACIÓN

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

20

Page 21: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 1. Una actividad básica y fundamental en el trabajo

realizado en la implementación de un Sistema de Gestión Calidad en una empresa es la del establecimiento de procedimientos. La frase “Un procedimiento malo, es mejor que aquel que no existe”, tiene trascendental

importancia al iniciar un proceso de mejora continua. En el proceso de estandarización de procedimientos; una empresa de la Industria automotriz, ha tenido significativos avances, que le ha redituado un nivel competitivo en precio y calidad en el mercado al cual son dirigidos sus productos. Uno de los procesos que ha mejorado significativamente es el del ensamble del eje de transmisión; que por su importancia se les ha puesto mayor atención. La tabla siguiente presenta los resultados obtenidos en muestras seleccionadas aleatoriamente antes de estandarizar el procedimiento y con el proceso ya estandarizado.

DESCRIPCIÓNM E T O D O

INICIAL ESTANDARIZADO tamaño de la muestra 61 81

tiempo promedio (minutos) 75.3 54.5

varianza 59.6 27.3Ensambles realizados en un tiempo máximo de 60 min. 28 21

ejes con fallas en su operación

8 8

En base a los resultados observados en la tabla. Determine un intervalo de confianza del:1. 95% para el tiempo promedio empleado en realizar el ensamble, con cada uno de los

métodos.2. 93% para el ahorro en tiempo al establecer el procedimiento estandarizado.3. 90% para el porcentaje de ensambles que se realizan en un máximo de 60 minutos en

cada situación. 4. 95% para la varianza y desviación estándar con respecto al tiempo empleando en

realizar el ensamble de dicho dispositivo con cada uno de los métodos. 5. 98% para cocientes de las varianzas con respecto el tiempo empleando en realizar el

ensamble de dicho dispositivo, al establecer la propuesta de mejora.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

InternationalOrganization for Standarization

21

Page 22: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Suponiendo que la distribución muestral de las proporciones se aproxima a la distribución normal, determine un intervalo de confianza del:

6. 95% para el porcentaje de ejes con fallas en su operación en cada una de las situaciones.

7. 95% para el porcentaje de ejes sin fallas en su operación en cada una de las situaciones

8. 92% para la disminución en el porcentaje de eje con fallas al establecer la estandarización del procedimiento.

Problema 2. Para evaluar y justificar el cambio realizado en la fundición del moldeo de piezas,

tendiente a la reducción el tiempo del proceso al pasar del moldeo por inyección al moldeo por compresión, El Gerente de Producción de una empresa de la Industria Metalmecánica, realizó el siguiente estudio. Empleando los dos tipos de moldeo de forma aleatoria, en la fundición del moldeo de piezas.

El moldeo por inyección es un proceso semi-continuo que consiste en inyectar un polímero en estado fundido (o ahulado) en un molde cerrado a presión y frío, a través de un orificio pequeño llamado compuerta. En ese molde el material se solidifica, comenzando a cristalizar en polímeros semicristalinos. La pieza o parte final se obtiene al abrir el molde y sacar de la cavidad la pieza moldeada.

El moldeo por compresión es un proceso de conformado de piezas en el que el material, generalmente un polímero, es introducido en un molde abierto al que luego se le aplica presión para que el material adopte la forma del molde y calor para que el material reticule y adopte definitivamente la forma deseada.

Los resultados se presentan en la siguiente tabla:

DESCRIPCIÓNTIPO DE MOLDEO

INYECCIÓN COMPRENSIÓN

Numero de piezas 28 25

Tiempo promedio por pieza (hrs.)

18.6 15.3

Desviación estándar 6.7 3.1

Suponiendo que el tiempo de fundición con cualquiera de estas alternativas, se distribuye normalmente. Determine un Intervalo de Confianza del:1. 95% para el tiempo promedio de fundición con el Moldeo por Compresión. 2. 95% para el tiempo promedio de fundición con el Moldeo por Inyección. 3. 90% para la diferencia en el tiempo promedio de fundición entre estas dos alternativas 4. 96% para la varianza y desviación estándar con respecto al tiempo promedio en realizar el

proceso de fundición con el Moldeo por Compresión.5. 96% para la varianza y desviación estándar con respecto al tiempo promedio en realizar el

proceso de fundición con el Moldeo por Inyección.6. 90% para la disminución en la varianza con respecto al tiempo promedio en realizar el proceso de

fundición con el Moldeo por Compresión respecto al Moldeo por Inyección.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

22

Page 23: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 3.En su proceso de fabricación, las empresas frecuentemente incurren en costos significativos,

ya sea por la creación de nuevos procedimientos o bien por el ausentismo del operario titular; lo que origina retrasos en la línea de producción, al perderse el ritmo que afecta la continuidad de la misma, en operaciones subsecuentes. Las empresas, buscando disminuir la magnitud de este problema han buscado alternativas como son: 1. Nuevos métodos de entrenamiento para capacitar al empleado a un nivel aceptable de eficiencia

en el menor tiempo posible.2. Contar con empleados que operen como “comodín sustituto”, por ausentismo del titular.

El siguiente problema plantea esta situación. Una nueva operación de ensamblado en una planta de la Industria Metal-Mecánica requiere de un

periodo de entrenamiento de aproximadamente 45 días, para que un empleado nuevo alcance un grado óptimo de eficiencia. Ha sido propuesto un nuevo método de adiestramiento para capacitar al empleado a un nivel aceptable de eficiencia en un menor tiempo con respecto al que ya operaba, además que la operación misma se intenta hacer más eficiente con respecto al tiempo de su ejecución. Para valorarlo se han entrenado 2 grupos de nueve empleados cada uno. Un grupo, con el nuevo método (con un periodo de capacitación de 30 días) , y el otro con el método de capacitación con el cual ya se contaba (con un periodo de capacitación de 45 días). Una vez concluidos los periodos de capacitación para cada grupo de operarios, fueron cronometrados sus tiempos en la realización de la operación.

El tiempo (expresado en minutos), fue registrado para cada empleado al final del periodo de entrenamiento, obteniéndose los resultados que se presentan en la siguiente tabla:

METODO 1 2 3 4 5 6 7 8 9 10 ACTUAL 58 55 54 59 56 56 58 53 55 56

PROPUESTO 51 50 45 48 45 47 46 47 49 52

DESCRIPCIÓN

METODO DE CAPACITACIÓN

ACTUAL45 días

PROPUESTO30 días

Número de operaciones analizadasTiempo promedio por ensamble Varianza Desviación estándar

Suponiendo que los tiempos empleados en el ensamble de dicho dispositivo se distribuyen normalmente en cada método; en base a esta información estime un intervalo de confianza del: 1. 90% para el tiempo promedio realizado en la operación de ensamblado por los operarios

capacitados con cada uno de los métodos (ACTUAL Y PROPUESTO).

2. 95% para la diferencia en el tiempo promedio realizado en la operación de ensamblado por los operarios capacitados con cada uno de los métodos (ACTUAL Y PROPUESTO).

3. 95% para la Varianza y Desviación Estándar con respecto al tiempo promedio realizado en la operación de ensamblado por los operarios capacitados con cada uno de los métodos (ACTUAL Y PROPUESTO).

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

23

Page 24: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 4. Con el objeto de analizar la eficiencia del trabajador durante su jornada de trabajo.

Fueron cronometrados los tiempos en realizar una misma operación durante el transcurso de una jornada laboral y con un mismo procedimiento, para lo cual se estratifico la jornada en cuatro periodos, mismos que se establecieron de la siguiente manera: 7-9, 9-11, 11-13 y de 13-15 hrs. La tabla presenta los resultados obtenidos después de cronometrar el tiempo en realizar la operación durante un periodo de tres meses:

DESCRIPCIONPERIODO ANALIZADO (horas)

A 7 - 9

B9 - 11

C11 - 13

D13 - 15

número de muestras 91 86 81 96tiempo promedio

(minutos) 18.9 min. 16.3 min. 15.7 min. 20.4 min.

varianza 37.5 29.3 14.2 20.4operaciones realizadas

en un tiempo máx. de 14 min.

27 34 49 48

En base a la información presentada en la tabla, determine un intervalo de confianza del:1. 95% para el tiempo promedio en realizar la operación para cada uno de los periodos. 2. 98% para la diferencia en el tiempo promedio en realizar la operación entre los

diferentes periodos.3. 95% para la varianza y desviación estándar con respecto tiempo promedio en realizar

la operación para cada uno de los periodos.4. 93% para el porcentaje de piezas realizadas en máximo 14 minutos para cada uno de

los periodos.5. 93% para el porcentaje de piezas realizadas en mínimo 14 minutos para cada uno de

los periodos

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

24

Page 25: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

PRUEBA O VERIFICACIÓN DE HIPÓTESISEs la segunda parte en la cual la Estadística en su área Inferencial se divide para

su estudio.

PROBAR O VERIFICAR UNA HIPÓTESIS. Es tomar una decisión respecto al valor que tiene el parámetro; o bien. Es comprobar a través de un proceso estadístico si el valor que se supone tiene el parámetro de una población es cierto o es falso.

PROCEDIMIENTO. Para comprobar si el valor del parámetro sometido a prueba es cierto o es falso, es extraída y procesada una muestra de la población que se estudia. El resultado obtenido se compara con el valor sometido a prueba (valor hipotético). De esta comparación se generan dos alternativas:1. Si no existe una diferencia “significativa “ entre estos dos valores; el valor que se

supone tiene el parámetro de la población ( valor hipotético ), se ACEPTA como cierto.2. Si existe una diferencia “significativa” entre el valor del parámetro obtenido en la

muestra y el valor hipotético sometido a prueba, el valor que se supone tiene el parámetro de la población ( valor hipotético ), se RECHAZA como falso .

REGIONES DE ACEPTACION Y DE RECHAZO.Ejemplo: Yo supongo que esta moneda es “ legal ”, entendiendo como tal; que la moneda no está cargada en ninguno de sus lados, o bien, que existe la misma probabilidad que al lanzarla caiga “cara” o “cruz”. ( Es decir que al ser lanzada un número de veces el 50 % de los resultados serían cara y el otro 50 % sería cruz ). Para probar esto, una alternativa sería lanzarla un número determinado de veces y observar: ¿Cuántas caras y cuantas cruces que se presentan ?.

Basados en esto; por ejemplo en n = 100 lanzamientos de la moneda esperaríamos obtener: 50 caras y 50 cruces.Pero una vez realizado el experimento

¿A que conclusión llegaríamos sobre el resultado obtenido ?. Veamos algunas alternativas analizadas por el lado de las caras:a. Resultado: 50 caras Con este resultado se comprobaría que la moneda es legal. Pero con……..

b. Resultado: 51 caras.c. Resultado: 53 caras. d. Resultado: 55 caras. e. Resultado: 60 caras. f. Resultado: 65 caras. ¿ Y

con estos ?g. Resultado: 70 caras

O bien:

a. Resultado: 49 carasb. Resultado: 47 carasc. Resultado: 45 caras

d. Resultado: 40 caras e. Resultado: 35 caras f. Resultado: 30 caras

Aquí, la clave estaría; en establecer …..“ un rango de aceptación, es decir, el mínimo y el máximo número de caras, dentro del cual consideraría que la moneda es legal ”.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

¿ Con estos resultados consideraría Ud. que la moneda no es legal ?

¿ Con estos resultados

consideraría Ud. que la moneda no es

¿ Y con estos ?

25

Page 26: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Es decir un intervalo de resultados en el cual se consideraría que no existe una diferencia significativa entre lo que nos esperábamos encontrar y el resultado. Por ejemplo:

3940 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61

REGION REGION DE DE RECHAZO ( RR ) REGION DE ACEPTACION ( RA ) RECHAZO ( RR ) En prueba de hipótesis el principal objetivo es “Establecer el o los límites de aceptación hasta el cual ( es ) se consideraría (an) que lo que se esta comprobando es cierto ó es falso”.

REGION DE ACEPTACION ( RA ): Zona de resultados en la cual se considera que no existe una diferencia significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.

REGIÓN DE RECHAZO ( RR ): Zona de resultados en la cual se considera que existe una diferencia significativa entre el valor hipotético sometido a prueba y el valor del parámetro muestral.

TIPOS DE HIPOTESISEl primer paso a dar al realizar una prueba de hipótesis es el de hacer el planteamiento de dos proposiciones que están relacionadas con el valor supuesto del parámetro que se intenta someter a prueba. Dichas proposiciones son denominadas: HIPOTESIS NULA e HIPOTESIS ALTERNATIVA.

HIPOTESIS NULA : ( Ho )La proposición planteada en esta hipótesis deberá colocar a la persona que realiza la prueba en una posición imparcial a lo que intenta probar. El objetivo final de toda prueba de hipótesis es el de aceptar o rechazar la proposición planteada en la hipótesis nula; por esta razón algunos autores la denominan hipótesis de trabajo.

HIPOTESIS ALTERNATIVA: ( H1 )La proposición en esta hipótesis generalmente se plantea en función a lo que se intenta probar. Los autores la denominan hipótesis de investigación. Esta hipótesis es aceptada cuando el resultado del proceso estadístico no sostiene lo planteado en la hipótesis nula.

TIPOS DE PRUEBAS ( UNA Y DOS COLAS )

En función a lo que se intenta probar respecto al valor del parámetro. Las pruebas de hipótesis se clasifican en dos tipos:

Sean: PRUEBAS DE TIPO I: PRUEBAS DE UN EXTREMO ( UNA COLA )

a. EXTREMO IZQUIERDO O COLA IZQUIERDA: Se genera cuando interesa que el valor del parámetro sometido a prueba alcance un mínimo valor para aceptar lo planteado en la hipótesis nula.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

HO : θ = θ0

H1 : θ < θ0

RR RA

26

Page 27: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

b. EXTREMO DERECHO O COLA DERECHA: Se genera cuando interesa que el valor del parámetro muestral sometido a prueba no sobrepase un mínimo valor para aceptar lo planteado en la hipótesis nula.

PRUEBAS DE TIPO II: DOS EXTREMOS ( DOS COLAS )Se genera cuando interesa por una parte que el valor del parámetro sometido a prueba alcance un mínimo; pero por otra, que no sobrepase un máximo para aceptar lo planteado en la hipótesis nula.

NIVEL DE SIGNIFICANCIA ( ) Establece los valores en el límite de aceptación o rechazo de la proposición

planteada en la hipótesis nula ( el límite inferior y/o superior de aceptación ). El nivel de sigificancia generalmente se establece en términos de porcentaje, el cual generalmente oscila entre un 1 y 10 %, aún cuando pueden aplicarse niveles de significancia de otras magnitudes. Pudiéndose establecer que la probabilidad de rechazar Ho cuando esta es cierta es directamente proporcional a la magnitud de dicho nivel de significancia.No hay un estándar o un nivel universal de significancia para probar una hipótesis. Es posible probar una hipótesis a cualquier nivel de significancia.

ERRORES TIPO I y TIPO II ( y )

Al tomar la decisión de aceptar o rechazar la hipótesis nula, existe la posibilidad de caer en alguno de dos errores posibles:

ERRORES TIPO I ( )En una prueba estadística, es el error que se comete al tomar la decisión de rechazar la hipótesis nula cuando ésta es cierta.

ERRORES TIPO II ( )

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

HO : θ = θ0

H1 : θ > θ0

RA RR

HO : θ = θ0

H1 : θ ≠ θ0

RR RA RR

27

Page 28: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

En una prueba estadística, es el error que se comete al tomar la decisión de no rechazar la hipótesis nula cuando ésta es falsa.

Ejemplo:Imagine las situaciones posibles que se pueden llegar a establecer en un juicio

respecto a la decisión que toma un juez al emitir su veredicto en relación al acusado.

VEREDICTO DEL JUEZ

INOCENTE CULPABLE

SITUACION DEL ACUSADO

INOCENTE ACIERTO ERROR I I

CULPABLE ERROR I ACIERTO

Planteamiento de las hipótesis:Ho: El acusado es inocenteH1: El acusado es culpable

El error TIPO I ( ) ocurriría cuando siendo inocente el acusado se le declara culpable (se rechaza Ho ) El error TIPO II ( ) Ocurriría cuando siendo culpable el acusado se le

declara inocente ( se acepta Ho).

Para un problema en general, el cuadro anterior podría quedar de la siguiente manera:

ERRORES TIPO I y TIPO II ( y )

DECISIONHIPOTESIS NULA

CIERTA FALSA

ACEPTAR HoDECISIONCORRECTA

ERRORTIPO II

( )

RECHAZAR HoERRORTIPO I ( )

DECISIONCORRECTA

Notas:1. Toda prueba o verificación de hipótesis tiene como objetivo aceptar o rechazar lo

planteado en la hipótesis nula Ho. Por ello, a esta hipótesis se le denomina Hipótesis de trabajo

2. La proposición planteada en Ho, deberá colocar a la persona que realiza la prueba en una posición imparcial a lo que se trata de probar con respecto al valor del parámetro.

3. El planteamiento hecho con respecto al valor del parámetro sometido a prueba en la hipótesis nula H1 ( < , ≠ , > ), será el que define el tipo de prueba:

Sea : cualquier parámetro ( , , P, x - y , Px - Py , x2 / y

2 ) poblacional

sometido aprueba y o el valor supuesto del parámetro sometido a prueba (valor hipotético de prueba), entonces se podría probar que

< o menor con respecto a un valor. ( extremo izquierdo ó cola izquierda ).

≠ o diferente con respecto a un valor ( dos extremos o dos colas ).

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

28

Page 29: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

> o mayor con respecto a un valor ( extremo derecho o cola derecha ).

INSTRUCCIONES: Los siguientes problemas tienen como objetivo que el alumno:

I. Identifique el parámetro ó parámetros que se someterán a prueba.

II. Exprese con palabras el planteamiento de las hipótesis: NULA ( Ho )

y ALTERNATIVA ( H1 ).

III. El planteamiento hecho con palabras lo traduzca a expresiones

algebraicas.

EJERCICIO 1. En los años 90, el porcentaje de alumnos de nuevo ingreso en una institución de educación superior que abandonaban sus estudios durante el primer semestre debido a que la carrera que habían elegido no cubría sus expectativas, era del 25 %. Para los periodos transcurridos en este nuevo siglo fue analizada una muestra de alumnos que abandonaron sus estudios por diferentes causas. En base al análisis de los resultados obtenidos:

1. Se quiere probar si el porcentaje de deserción por esta causa es el mismo, es decir; si puede considerarse que el porcentaje de deserción sigue siendo del 25 %.

2. Se quiere probar si se ha incrementado el porcentaje de deserción por esta causa, es decir; si puede considerarse que actualmente es mayor del 25 %.

3. Se quiere probar si ha disminuido el porcentaje de deserción, es decir; si puede considerarse que actualmente es menor al 25 %.

EJERCICIO 2. El contenido en impreso en la etiqueta de una determinada marca de refresco es de 225 mililitros. Para comprobar dicho contenido se seleccionaron aleatoriamente botellas conteniendo dicho refresco y el volumen promedio obtenido fue utilizado para comprobación. En base al análisis de los resultados obtenidos:

1. Se quiere comprobar si el contenido es el mismo que el que dice la etiqueta.2. Se quiere probar si dicho volumen es de al menos 225 mililitros.3. Se quiere probar si dicho volumen supera los 225 mililitros.4. Se quiere probar si dicho volumen no supera los 225 mililitros5. Se quiere probar si el volumen es inferior al impreso en la etiqueta.

EJERCICIO 3. Se trata de probar si el procedimiento propuesto para disminuir el tiempo empleado en la realización de una operación, es mejor que el procedimiento actual. Para compararlos, se aplicó un procedimiento específico a cada uno de dos grupos seleccionado aleatoriamente de alumnos y se compararon los resultados obtenidos con uno y otro método. Basados en estos resultados, se quiere probar:1. La calificación promedio obtenida por los alumnos con el método TRADICIONAL es mínimo 75.2. La calificación promedio obtenida por los alumnos con el método basado en el APRENDIZAJE

SIGNIFICATIVO supera los 90 puntos.3. Si no existe una diferencia en el nivel de aprovechamiento entre uno y otro método.4. Si el método basado en el APRENDIZAJE SIGNIFICATIVO actual es mejor que el basado en el

método TRADICIONAL.5. Si el método basado en el MÉTODO TRADICIONAL es mejor que el basado en el APRENDIZAJE

SIGNIFICATIVO.6. Si la calificación promedio alcanzada con el método de APRENDIZAJE SIGNIFICATIVO supera

en al menos 5 puntos a la calificación promedio alcanzada con el método de MÉTODO TRADICIONAL.

7. Si el Porcentaje de alumnos reprobados empleando el MÉTODO TRADICIONAL es de cuando más el 25%.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

29

Page 30: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

8. Si el Porcentaje de alumnos reprobados empleando el APRENDIZAJE SIGNIFICATIVO es máximo del 15%.

9. Si es mayor el porcentaje de alumnos reprobados con el MÉTODO TRADICIONAL que empleando el método de APRENDIZAJE SIGNIFICATIVO.

EJERCICIO 4. Los folletos de publicidad de un automóvil compacto de conocida marca, manejan que el

promedio de rendimiento del mismo, en condiciones normales de operación es de 17.4

kilómetros / litro. Para someter a prueba esta afirmación se realizan pruebas en diferentes

autos de dicha marca.

1. Se quiere probar si el rendimiento difiere con lo que dice la publicidad.

2. Se quiere probar si dicho rendimiento es superior a lo que afirma la publicidad.

3. Se quiere probar si el rendimiento es inferior a lo que los folletos publicitarios afirman.

EJERCICIO 5.

El gerente de una línea de autobuses realiza la programación de sus corridas con base en que un

autobús requiere en promedio, un tiempo de cuando más 40 minutos en recorrer la distancia

Orizaba-Córdoba, Para corroborar esto fueron cronometradas una muestra seleccionada

aleatoriamente de corridas. Desarrolle el planteamiento de las hipótesis Nula y Alternativa

(expresando con palabras y posteriormente a través de símbolos).

EJERCICIO 6.

El promotor de una dieta para reducir peso afirma que en promedio, la persona que se someta a ella

siguiendo las indicaciones, reducirá al menos 2 kgs. en una semana. Para probar esta afirmación fue

seleccionada aleatoriamente una muestra de personas sometidas a tal régimen.

Desarrolle el planteamiento de las hipótesis Nula y Alternativa

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

30

Page 31: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

EJERCICIO 7. Un estudio relacionado con el nivel de consumo diario y la preferencia de dos de las principales marcas de refresco de cola ( marcas A y B para nuestro ejemplo ) en una amplia región del país, involucró la aplicación de encuestas a una muestra de personas seleccionada aleatoriamente de la región; en base a los resultados del análisis de la muestra. Se desean probar los siguientes supuestos:

I. ¿Cuales serían el o los parámetros que utilizaría para medir? a. La preferencia de cualquiera de las dos marcas: Nombre ____________ Símbolos ____________

b. El consumo de refresco de cualquiera de las dos marcas: Nombre __________ Símbolos ____________

II. Exprese con palabras y después con expresiones algebraicas el planteamiento de las hipótesis: NULA ( Ho ) y ALTERNATIVA ( H1 ).

1. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es de cuando menos 200 mililitros diarios.

2. Si el consumo promedio del refresco de cola para las personas que demandan la marca A es mayor a 200 mililitros diarios.

3. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es de cuando más 200 mililitros al día.

4. Si el consumo promedio de refresco de cola para las personas que demandan la marca B es menor a 200 mililitros al día

5. Si se puede considerar que al menos el 60% de las personas que consumen refresco de cola, prefieren la marca A.

6. Si se puede considerar que menos del 60% de las personas que consumen refresco de cola, prefieren la marca A.

7. Si se puede considerar que máximo 35% de las personas que demandan para consumo refresco de cola, prefieren la marca B.

8. Si se puede considerar que el consumo promedio de las personas que prefieren refresco de cola es el mismo en las dos marcas.

9. Si es significativamente menor el consumo promedio de las personas que prefieren la marca B que aquellos que se inclinan por la marca A.

10. Si los que prefieren la marca A consumen en promedio al menos 50 mlls. más de refresco al día que los que prefieren la marca B.

11. Si es significativamente mayor la preferencia por parte de los consumidores de refresco de cola por la marca A que por la marca B.

12. Si difiere significativamente la preferencia por parte de los consumidores de refresco de cola por la marca A que por la marca B.

13. Si la varianza con respecto a las ventas promedio de la marca A es la misma que la varianza con respecto a las ventas promedio de la marca B.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

31

Page 32: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

14. Si la varianza con respecto a las ventas promedio de la marca A es la mayor que la varianza con respecto a las ventas promedio de la marca B.

Problema 1.

En especial para el Ingeniero Industrial, la Ergonomía representa una herramienta muy útil para hacer más eficientes las operaciones realizadas en un proceso; debido a que tiene como objetivo el ahorro de movimientos y desplazamientos improductivos por

parte del operario a través del diseño adecuadamente estructurado de su estación de trabajo. El problema que a continuación se presenta está relacionado con lo anteriormente expuesto.

Fue realizado un estudio ergonométrico con el objeto de reducir el tiempo en el ensamble de una bomba centrífuga. Los resultados de los tiempos fueron comparados

con registros de tiempos que se tenían antes de ser rediseñada la estación.

Ambos resultados, expresados en minutos, se muestran en la siguiente tabla:

D E S C R I P C I O N ALTERNATIVA

INICIAL MODIFICADONumero de observaciones 71 81

Tiempo promedio 97.9 71.8Desviación estándar 23.4 15.5

Bombas ensambladas en menos de 60 min.

15 7

En base a estos resultados. ¿Puede considerarse, a un nivel de significancia del1. 10 % Si el tiempo promedio en realizar la operación con el método INICIAL es de

diferente a los 100 minutos?.2. 8% Si puede considerarse que se reduce significativamente el tiempo de ensamble, en

al menos 28 min. en realizar la operación con el método MODIFICADO?.3. 8% Si se reduce en al menos 28 min. en realizar la operación con el método

MODIFICADO?. 4. 5% Si el porcentaje de piezas defectuosas con el método INICIAL es superior al 15%.

Suponga que la distribución muestral de las proporciones es aproximadamente normal?.

5. 5% Si el porcentaje de piezas defectuosas con el método MODIFICADO es inferior al 10%. Suponga que la distribución muestral de las proporciones es aproximadamente normal?.

6. 10 % Si la varianza con respecto al tiempo promedio en realizar la operación con el método INICIAL supera los 525?.

7. 10 % Si la varianza con respecto al tiempo promedio en realizar la operación con el método MODIFICADO es inferior a los 250?.

8. 5 % Si la varianza con respecto al tiempo promedio en realizar la operación con el método MODIFICADO es significativamente menor que con el INICIAL?.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

32

Page 33: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 2. Sin aún haber logrado su certificación en ISO: 9001:2000 una empresa de

la Industria Metalmecánica en el trabajo realizado para la estandarización de procedimientos para la implementación del Sistema de Gestión de Calidad, ha tenido significativos avances, que le ha redituado una disminución de los tiempos de fabricación de sus productos. Uno de los procesos que ha mejorado

significativamente es el de barrenado de las plantillas metálicas que soportan los “flushes” de los evaporadores para el secado de la melaza en el proceso de producción de azúcar. La tabla siguiente presenta los resultados obtenidos en muestras seleccionadas aleatoriamente antes de estandarizar el procedimiento, y los resultados del proceso actual con la propuesta de mejora, en el tiempo de realización de esta actividad.

DESCRIPCIÓNPROCEDIMIENTO

INICIAL ACTUALtamaño de la muestra 26 24

tiempo promedio (minutos) 85.8 62.9varianza 49.1 13.5

En base a los resultados presentados en la tabla. ¿Puede considerarse a un nivel de significancia del:1. 5% que el tiempo promedio en realizar esta operación con el procedimiento inicial

superaba los 80 minutos ?.2. 10% que el tiempo promedio en realizar esta operación con el procedimiento actual es

de cuando más 1 hora ?.3. 5% que al aplicar la mejora el tiempo disminuyó significativamente ?.4. 10% que con el procedimiento actual existe un ahorro de tiempo de al menos 25

minutos con respecto al procedimiento inicial ?.5. 5% que la varianza con respecto al tiempo promedio en realizar la operación con el

procedimiento inicial era superior a 45 ?.6. 5% que la varianza con respecto al tiempo promedio en realizar la operación con el

procedimiento actual es máximo de 13 ?.7. 5% que la varianza con respecto al tiempo promedio en realizar la operación con el

procedimiento actual es significativamente menor que con el procedimiento actual?.

Problema 3: Con el objeto de evaluar la aplicación de un nuevo plan de Seguridad Industrial

implementado en una empresa de la Industria Metal-Mecánica para la disminución de accidentes laborales que se ven reflejados en la pérdida de horas de trabajo,

independientemente de la cuota que la empresa debe cubrir al IMSS, debido a los incidentes presentados. De los registros ó estadística semanales de la empresa, fue seleccionada una muestra de los resultados obtenidos antes y después de implementar dicho plan, obteniéndose los resultados que se presentan en la siguiente

tabla:

DESCRIPCIÓN ANTES DESPUES

# de semanas 23 18# promedio de horas

improductivas.195.5 157.6

Desviación estándar 47.5 35.1

En base a estos resultados. ¿Puede considerarse, a un nivel de significancia del _____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

33

Page 34: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

1. 10% Si el número promedio de horas improductivas ANTES de la implementación del Plan de Seguridad superaba las 175 horas por semana.

2. 10% Si el número promedio de horas improductivas DESPUES de la implementación del Plan de Seguridad es de a lo más 150 horas por semana?.

3. 8% Si se redujo de forma significativa el número promedio de horas improductivas DESPUES de la implementación del Plan de Seguridad ?.

4. 8% Si se redujo en al menos 30 horas por semana DESPUES de la implementación del Plan de Seguridad ?.

Problema 4. La empresa fabricante de papel utilizado para la elaboración de bolsas para caramelos, por

exigencias de sus clientes, está interesada en mejorar la resistencia a la tensión de la bolsa que envuelven al producto. El grupo de ingeniería realiza experimentos sobre la concentración de madera dura en la pulpa, con porcentajes de 15 y 25%. Para ello decide fabricar 17 especimenes de prueba para cada nivel de concentración, utilizando una planta piloto. Los 34 especimenes se someten a tensión en una máquina de de laboratorio, en un orden aleatorio.

D E S C R I P C I Ó NCONCENTRACIÓN

15% 25%numero de pruebas 17 17

resistencia promedio (lbs. /in2) 4.93 7.05varianza 2.49 1.86

desviación estándar 1.58 1.36

En base a estos resultados ¿Se puede considerar a un nivel de significancia del: 1. 5% que la resistencia promedio del papel con una concentración de madera dura del 15% es

inferior a 5 kgs./cm2 . 2. 10% que la resistencia promedio del papel con un 25% de concentración de madera dura, es

mayor a los 6.5 kgs./cm2 .3. 10% que la resistencia promedio del papel con un 25% de concentración de madera dura, es

mayor a la resistencia promedio del papel con una concentración de madera dura con un 15%?.4. 10% que la resistencia promedio del papel con un 25% de concentración de madera dura, es

mayor en al menos 1.75 kgs./cm2 a la resistencia promedio del papel con una concentración de madera dura con un 15%?.

5. 5% si la varianza con respecto a la resistencia promedio del papel con una concentración de madera dura con un 15% es de al menos a 2.5 kgs./cm2.

6. 5% si la varianza con respecto a la resistencia promedio del papel con una concentración de madera dura con un 15% es inferior a 1.5 kgs./cm2.

7. 5% si la varianza con respecto a la resistencia promedio del papel con una concentración de madera dura con un 15% es mayor a la varianza del papel con una concentración del 25%?.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

34

Page 35: Tema: Prueba o Verificacion de Hipotesis Catedrático:

TEMA: PRUEBA O VERIFICACION DE HIPOTESISCatedrático: Fernando Fernández Rodiles

Problema 5. La siguiente tabla presenta el volumen de ventas por día de litros de gasolina,

observado en dos estaciones de servicio. Los datos presentados, fueron obtenidos al seleccionar una muestra aleatoria del registro de ventas diarias con el cual se cuenta:

OBSERVACIONESGASOLINERÍA

A B

# de días en la muestra. 71 81

ventas promedio 3 750 lts. 2 980 lts.desviación estándar 859 lts. 642 lts.

# de días en que las ventas fueron superiores a 2000 lts. 41 28

En base a estos resultados. ¿Puede considerarse, a un nivel de significancia del :1. 6 % si volumen promedio vendido por día en la gasolinera A es superior a 3 700 lts?.2. 5 % si volumen promedio vendido por día en la gasolinera B no supera los 2 900 lts?.3. 8% si el promedio de ventas diarias en la en la gasolinera A es significativamente superior a las

ventas promedio de la gasolinera B?.4. 10% si el promedio de ventas en la en la gasolinera A es superior en al menos 800 lts. por día a

las ventas promedio de la gasolinera B ?.5. 8% si más del 50% de los días, las ventas en la gasolinera A superan los 2000 lts?.6. 8% si al menos el 40% de los días, las ventas en la gasolinera B superan los 2000 lts?.7. 5 % si la desviación estándar con respecto a las ventas en la gasolinera A es inferior 875 lts?.8. 5 % si la desviación estándar con respecto a las ventas en la gasolinera B es superior

a 600 lts?9. 5 % si la varianza con respecto a las ventas promedio en la gasolinera A es

significativamente mayor a la varianza con respecto a las ventas promedio de la gasolinera B?.

_____ Cuaderno de trabajo de la materia de Estadística I _____ Pag.

Ingeniería Industrial

35