apuntes_estadistica_aplicada_

12
INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA M.C. Maribel Ocampo Casados 1 I INFERENCIA ESTADÍSTICA La inferencia estadística consiste en aquellos métodos por los que se realizan inferencias o generalizaciones acerca de una población. El objetivo de la inferencia estadística es hacer afirmaciones válidas acerca de la población o proceso con base en la información contenida en una muestra. En la industria, estas afirmaciones tienen por objetivo coadyuvar en la toma de decisiones para mejorar el desempeño de todos los procesos de la organización. La inferencia estadística se puede dividir en dos áreas principales que son estimación y prueba de hipótesis. Para distinguir claramente las dos áreas consideremos los siguientes ejemplos: Estimación Un candidato a un puesto público puede desear estimar la verdadera proporción de votantes que lo favorecerán mediante la obtención de las opiniones de una muestra aleatoria de 100 votantes. La fracción de votantes en la muestra que favorecerá la candidata se podría utilizar como una estimación de la verdadera proporción de la población de votantes. Prueba de hipótesis Considere ahora el caso en el que se esta interesado en encontrar si la marca A de cera para piso es mas resistente al desgaste que la marca B se puede plantear la hipótesis de que la marca A es mejor que B y, después de la prueba apropiada aceptar o rechazar esta hipótesis Definición estimación Valor especifico observado de un estimador. Estimación de Intervalo Un rango de valores donde se estima está el valor de un parámetro. Tipos de estimaciones Podemos hacer dos tipos de estimaciones concernientes a una población Estimación puntual. Un estimador puntual de un parámetro desconocido, es un estadístico que genera un valor numérico simple que se utiliza para hacer una estimación del valor del parámetro desconocido. Por ejemplo, tres parámetros relacionados con las características de calidad de un proceso, sobre los que frecuentemente se desea hacer inferencia, son: La media del proceso (población). La varianza 2 o desviación estándar del proceso. La proporción p de artículos defectuosos. Estimación de intervalo. Es un rango de valores que se utiliza para estimar un parámetro de la población. Es una forma operativa de saber “donde puede estar el parámetro” con cierto nivel de

Upload: ivan-gomez

Post on 27-Oct-2015

1.204 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

1

I INFERENCIA ESTADÍSTICA La inferencia estadística consiste en aquellos métodos por los que se realizan inferencias o generalizaciones acerca de una población. El objetivo de la inferencia estadística es hacer afirmaciones válidas acerca de la población o proceso con base en la información contenida en una muestra. En la industria, estas afirmaciones tienen por objetivo coadyuvar en la toma de decisiones para mejorar el desempeño de todos los procesos de la organización. La inferencia estadística se puede dividir en dos áreas principales que son estimación y prueba de hipótesis. Para distinguir claramente las dos áreas consideremos los siguientes ejemplos: Estimación Un candidato a un puesto público puede desear estimar la verdadera proporción de votantes que lo favorecerán mediante la obtención de las opiniones de una muestra aleatoria de 100 votantes. La fracción de votantes en la muestra que favorecerá la candidata se podría utilizar como una estimación de la verdadera proporción de la población de votantes. Prueba de hipótesis Considere ahora el caso en el que se esta interesado en encontrar si la marca A de cera para piso es mas resistente al desgaste que la marca B se puede plantear la hipótesis de que la marca A es mejor que B y, después de la prueba apropiada aceptar o rechazar esta hipótesis Definición estimación Valor especifico observado de un estimador. Estimación de Intervalo Un rango de valores donde se estima está el valor de un parámetro. Tipos de estimaciones Podemos hacer dos tipos de estimaciones concernientes a una población Estimación puntual. Un estimador puntual de un parámetro desconocido, es un estadístico que genera un valor numérico simple que se utiliza para hacer una estimación del valor del parámetro desconocido. Por ejemplo, tres parámetros relacionados con las características de calidad de un proceso, sobre los que frecuentemente se desea hacer inferencia, son:

La media del proceso (población).

La varianza 2 o desviación estándar del proceso.

La proporción p de artículos defectuosos. Estimación de intervalo. Es un rango de valores que se utiliza para estimar un parámetro de la población. Es una forma operativa de saber “donde puede estar el parámetro” con cierto nivel de

Page 2: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

2

seguridad o confianza. Construir un intervalo al (1- ) 100% de confianza para un parámetro

desconocido , consiste en estimar dos números (estadísticos) L y U tales que la probabilidad de

que se encuentre entre ellos sea 1- , es decir,

1)( ULP

*Ejemplo: El jefe de departamento diría algo como esto “Estimo que la inscripción real para el próximo semestre estará entre 330 y 380 estudiantes y es muy probable que la inscripción exacta caiga dentro de este intervalo” ESTIMADOR Y ESTIMADORES Cualquier estadístico de la muestra que se utilice para estimar un parámetro poblacional se conoce como estimador es decir un estimador es un estadístico de la muestra utilizado para estimar un

parámetro poblacional. Por ejemplo la media de la muestra _

x puede ser un estimador de la media

poblacional . La diferencia de medias muestrales 21 xx puede ser un estimador de la diferencia

de 21 . La varianza muestral 2s se puede utilizar como un estimador de la varianza

poblacional 2 .

Intervalo de confianza de ; con conocida.

1-

z 2/z 0 2/z

Figura 1 12/2/ zzzP

Si _

x es la media de una muestra aleatoria de tamaño n de una población con varianza 2 ,

conocida, un intervalo de confianza de (1- ) 100% para está dada por

2/

2/ 2/

Page 3: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

3

, 2/

_

2/

_

nzx

nzx

donde 2/z es el valor z que deja un área de 2/ a la derecha.

Ejercicios 1. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la población de todos los focos que produce esta empresa. 2. Las estaturas de una muestra aleatoria de 50 estudiantes universitarios muestran una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Construya un intervalo de confianza de 98% para la estatura media de todos los estudiantes de la universidad. 3. Una muestra aleatoria de 100 propietarios de automóviles de automóviles muestra que, en el estado de Virginia un automóvil se maneja, en promedio 23,500 kilómetros por año con una desviación estándar de 3900 kilómetros. Construya un intervalo de confianza de 99% para el número promedio de kilómetros que se maneja un automóvil anualmente en Virginia. Intervalo de confianza para ; con desconocida.

1-

t

2/t 0 2/t

Figura 1 12/2/ tttP

Si _

x y s son la media y la desviación estándar de una muestra aleatoria de una población normal

con varianza 2 , desconocida, un intervalo de confianza de (1- ) 100% para es

, 2/

_

2/

_

n

stx

n

stx

donde 2/t es el valor t con 1 n grados de libertad, que deja un área de 2/ a la derecha.

2/

2/ 2/

Page 4: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

4

Ejercicios

1. Una muestra aleatoria de 10 barras de chocolate energético de cierta marca tiene, en

promedio, 230 calorías con una desviación estándar de 15 calorías. Construya un intervalo

de confianza de 99% para el contenido medio real de calorías de esta marca de barras de

chocolate energético. Suponga que la distribución de las calorías es aproximadamente

normal.

2. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de las

piezas y los diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros.

Encuentre un intervalo de confianza de 99% para el diámetro medio de las piezas de esta

máquina, suponga una distribución aproximadamente normal.

3. Una muestra aleatoria de 12 graduadas de cierta escuela secretarial escriben a máquina

un promedio de 79.3 palabras por minuto con una desviación estándar de 7.8 palabras por

minuto. Suponga una distribución normal para el número de palabras que se escriben por

minuto, encuentre un intervalo de confianza de 95% para el número promedio de palabras

escritas por todas las graduadas de esta escuela.

II PRUEBAS DE HIPOTESIS.

Hipótesis estadística: Es un enunciado en el que se supone cierta condición respecto a un parámetro poblacional. Dicho enunciado se estructura con base en información previa de dicho parámetro y puede ser expresado de cualquiera de las siguientes maneras:

1. El parámetro toma o no un valor específico. 2. El parámetro es mayor o menor a un valor. 3. El parámetro de una población es: igual, diferente, mayor o menor al mismo parámetro de

otra población.

Muestra estadística : _

x , ,2s s,

p

Población parámetro: , ,2 , p

Hipótesis nula: Es una prueba de hipótesis, debemos establecer el valor supuesto o hipotético del parámetro de población antes de comenzar a tomar la muestra. La suposición que debemos probar

se conoce como hipótesis nula y se simboliza 0H , o “H subcero”.

Hipótesis alternativa: Si los resultados de nuestra muestra no respaldan la hipótesis nula, debemos concluir que se cumple alguna otra cosa. Siempre que rechazamos la hipótesis, la conclusión que sí

aceptamos se llama hipótesis alternativa cuyo símbolo es 1H , ó “H sub-uno”.

Page 5: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

5

Para la hipótesis nula: 200:0 H , consideramos tres hipótesis alternativas posibles:

200:1 H

200:1 H

200:1 H

TIPOS DE PRUEBAS DE HIPÓTESIS DE ACUERDO A H1

Pruebas unilaterales: Hipótesis unilateral e hipótesis bilateral: Contrastar una hipótesis es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos permitimos admitir hay coincidencia aceptamos la hipótesis y en caso contrario lo rechazamos.

200:0 H

200:1 H

200:1 H

Son aquéllas en que el nivel de significancia se ubica a un extremo de la distribución de probabilidad tomada como referencia. Pruebas bilaterales: Los contrastes pueden ser unilaterales o bilaterales (también llamado de una o dos colas). Según establezcamos las hipótesis, si las definimos en términos de igual y diferente estamos ante una hipótesis bilateral. Si suponemos una dirección en términos de mayor o menor, estamos ante una hipótesis unilateral.

200:0 H

200:1 H Bilateral

Es cuando el nivel de significancia se reparte en los 2 extremos de la distribución de probabilidad tomada como referencia.

Unilateral

Page 6: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

6

Procedimiento para la prueba de hipótesis:

1) Establecer la hipótesis nula y la alternativa de acuerdo al enunciado o planteamiento del problema, en función del parámetro que se somete a prueba. Para Ho siempre se establece

una expresión de igualdad (Ho =) y para 1H , corresponde una condición de tipo >, < ó .

2) Establecer el nivel de confianza para la prueba de acuerdo al error tipo 1 que estamos

dispuestos a permitir.

3) Seleccionar la tabla de probabilidad que corresponde al parámetro que se está probando y a la información disponible y establecer valores críticos y regiones de aceptación y rechazo.

4) Calcular el valor del estadístico con la información muestral.

5) Ubicar el valor del paso anterior y observar si se encuentra en la región de aceptación o

rechazo.

6) Concluir y dar respuesta al planteamiento original del problema.

1.-Prueba de media poblacional (Con varianza poblacional conocida).

Área de

Aceptación

1-

2/z 2/z 0

Región de

rechazo

Región de

rechazo

Bilateral

Área de

Aceptación

1-

z 0

Región de

rechazo

Unilateral >

Área de

Aceptación

1-

z 0

Región de

rechazo

Unilateral <

Page 7: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

7

Caso 1 Bilateral:

00 : H

01 : H

0 valor supuesto para la media poblacional.

La hipótesis 0H se rechaza si:

n

xZ

/

0

_

es menor que 2/z o mayor que 2/z y si

_

x es menor que n

z

2/0 ó mayor

que n

z

2/0 .

Caso 2 Unilateral extremo derecho.

00 : H

01 H

La hipótesis 0H se rechaza si: n

xZ

/

0

_

es mayor que z y si

_

x es mayor n

z

0 .

Caso 3 Unilateral extremo izquierdo.

00 : H

01 H

La hipótesis 0H se rechaza si: n

xZ

/

0

_

es menor que z y si

_

x es menor que

nz

0 .

Page 8: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

8

Ejemplos: 1. Una psicóloga desea determinar si el tiempo promedio que tarda un conductor en reaccionar a cierta situación de urgencia es en 0.56 segundos, ella puede suponer que la variabilidad de estas mediciones está dada por una desviación estándar de 0.082 segundos. Asimismo, decide basar la demostración en una muestra aleatoria de n= 35 y utilizar un nivel de significancia del 5%. ¿Qué concluiría ella si sus datos producen un tiempo promedio de reacción de 0.59 segundos? 2. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años. ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.

2.-Prueba de hipótesis para le media poblacional (Con varianza poblacional

desconocida)

Área de

Aceptación

1-

2/t 2/t 0

Región de

rechazo

Región de

rechazo

Bilateral

Área de

Aceptación

1-

t 0

Región de

rechazo

Unilateral >

Área de

Aceptación

1-

t 0

Región de

rechazo

Unilateral <

Page 9: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

9

Caso 1 Bilateral.

00 : H

01 : H

0 Valor supuesto para la media poblacional.

La hipótesis 0H se rechaza si: ns

xt

/

0

_

es menor que 2/t ó mayor que 2/t y si

_

x es

menor que n

st 2/0 ó mayor que

n

st 2/0 .

Caso 2 Unilateral extremo derecho.

00 : H

01 H

La hipótesis 0H se rechaza si: ns

xt

/

0

_

es mayor que t y si

_

x es mayor que n

st 2/0 .

Caso 3 Unilateral extremo izquierdo.

00 : H

01 H

La hipótesis 0H se rechaza si: ns

xt

/

0

_

es menor que t y si

_

x es menor que n

st 0 .

Ejemplos: 1.- Suponga que se desea demostrar, sobre la base de una muestra tomada al azar de tamaño n=5. Si el contenido promedio de grasa de cierto tipo de carne procesada pasa del 30%. ¿Qué se puede concluir en el nivel de 0.01 de significancia, si los valores de la muestra son: 31.9, 30.3, 32.1, 31.7 y 30.9%?

Page 10: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

10

2.-El departamento de seguridad de un almacén desea saber si el tiempo promedio que requiere el velador para hacer su ronda es de 12.0 minutos. Si una muestra aleatoria de 36 rondas, el velador promedió 12.3 minutos con una desviación estándar de 1.2 minutos. ¿Se puede rechazar la hipótesis planteada con un nivel de significancia del 5%. 3. Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la distribución del contenido es normal.

4.-Prueba de hipótesis para la proporción población. Caso 1 Bilateral:

00 : ppH

01 : ppH

0p = Valor supuesto para la proporción poblacional. n

xp

La hipótesis 0H se rechaza si:

n

qp

ppz

00

0

es menor que 2/z ó mayor que 2/z y si

p es menor que n

qpzp 00

2/0

ó mayor que n

qpzp 00

2/0

Caso 2 Unilateral extremo derecho:

00 : ppH

01 : ppH

La hipótesis 0H se rechaza si:

Page 11: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

11

n

qp

ppz

00

0

es mayor que z y si

p es mayor que n

qpzp 00

0

Caso 3 Unilateral extremo izquierdo.

00 : ppH

01 : ppH

La hipótesis 0H se rechaza si:

n

qp

ppz

00

0

es menor que z y si

p es menor que n

qpzp 00

0

Ejemplos: 1.-Se cree que un medicamento en el mercado, que por lo común se prescribe para aliviar la tensión nerviosa es efectivo solo en 60% de los casos. Resultados experimentales con un nuevo medicamento administrado a una muestra aleatoria de 100 adultos que sufrían de tensión nerviosa, mostraron que 75 experimentaron alivio. ¿Es ésta suficiente evidencia para concluir que el nuevo medicamento es mejor que el que se prescribe comúnmente? Utilice un nivel de significancia del 5%. 2.- En un estudio diseñado para investigar ciertos detonadores empleados con explosivos en una mina de carbón cumplen con los requerimientos de que al menos el 90% encenderá el explosivo para al ser detonado, se encontró que 174 de 200 detonadores funcionaron adecuadamente con un 0.05 de nivel de significancia.

REPASO DE EJERCICIOS 1. El vicepresidente a cargo de las ventas de una gran corporación afirma que los vendedores tienen un promedio no mayor de 15 prospectos de ventas por semana. Se seleccionan n = 36 vendedores al azar para verificar su afirmación, y se registra el número de contactos en una sola semana seleccionada en forma aleatoria. La muestra tiene una media de 17 prospectos. ¿Contradicen los hechos la afirmación del vicepresidente? Utilice un nivel de significancia del 5%. Considere que el número de prospectos de ventas por semana tiene una distribución normal con varianza 9.

Page 12: Apuntes_Estadistica_Aplicada_

INSTITUTO TECNOLOGICO DE QUERÉTARO UNIDAD II ESTADÍSTICA APLICADA

M.C. Maribel Ocampo Casados

12

2. Un documental televisivo acerca de comer en exceso afirmaba que los estadounidenses tienen un sobrepeso aproximado de 10 libras en promedio. Para probar esta afirmación, examinaron a 18 individuos elegidos aleatoriamente, y encontraron que su sobrepeso promedio era 12.4 libras, con una desviación estándar de la muestra de 2.7 libras. A un nivel de significancia de 0.01, ¿hay alguna razón para dudar de la validez del valor afirmado de 10 libras?