unidad 5b

25
5.1 Inferencia estadística La estadística se ocupa del conjunto de técnicas que se emplean para recolectar, organizar, analizar e interpretar datos, los cuales pueden ser cuantitativos, o cualitativos. La estadística se usa en los negocios para ayudar a tomar mejores decisiones mediante la comprensión de las fuentes de variación y el descubrimiento de patrones y relaciones en los datos de los negocios. 5.1.1 Concepto La estadística descriptiva comprende las técnicas que se emplean para resumir y describir datos numéricos con objeto de facilitar su interpretación. Estas técnicas pueden ser métodos gráficos o incluir el análisis computacional. La estadística inferencial comprende las técnicas mediante las cuales se toman decisiones acerca de un proceso o de una población estadísticos solo con base en la observación de una muestra. Debido a que estas decisiones se toman en condiciones de incertidumbre, se requiere emplear los conceptos de la probabilidad. Mientras que las características medidas en una muestra se denominan estadísticos de la muestra (o muestrales), las características medidas en una población estadística o universo se denominan parámetros de la población (o poblacionales). El procedimiento mediante el cual se miden las características de todos los miembros de una población determinada se denomina censo. Hay dos tipos de inferencia estadística: la estimación y la verificación o prueba de hipótesis. 5.1.2 Estimación Se presentan muchas situaciones en las que alguna persona (el que toma una decisión, un planificador o un investigador) desea conocer los valores de parámetros tales como la media poblacional, la diferencia entre medias, o la proporción, entre otras; por ejemplo, un criminalista desea conocer que proporción de personas convictas de un crimen sufren de alguna desviación mental, o un funcionario de salud publica, podría estar

Upload: domingo-de-la-cerda

Post on 03-Aug-2015

407 views

Category:

Education


1 download

TRANSCRIPT

5.1 Inferencia estadística

La estadística se ocupa del conjunto de técnicas que se emplean pararecolectar, organizar, analizar e interpretar datos, los cuales pueden sercuantitativos, o cualitativos. La estadística se usa en los negocios paraayudar a tomar mejores decisiones mediante la comprensión de las fuentesde variación y el descubrimiento de patrones y relaciones en los datos delos negocios.

5.1.1 Concepto

La estadística descriptiva comprende las técnicas que se emplean pararesumir y describir datos numéricos con objeto de facilitar su interpretación.Estas técnicas pueden ser métodos gráficos o incluir el análisiscomputacional.

La estadística inferencial comprende las técnicas mediante las cuales setoman decisiones acerca de un proceso o de una población estadísticossolo con base en la observación de una muestra. Debido a que estasdecisiones se toman en condiciones de incertidumbre, se requiere emplearlos conceptos de la probabilidad. Mientras que las características medidasen una muestra se denominan estadísticos de la muestra (o muestrales),las características medidas en una población estadística o universo sedenominan parámetros de la población (o poblacionales). El procedimientomediante el cual se miden las características de todos los miembros de unapoblación determinada se denomina censo.

Hay dos tipos de inferencia estadística: la estimación y la verificación oprueba de hipótesis.

5.1.2 Estimación

Se presentan muchas situaciones en las que alguna persona (el que tomauna decisión, un planificador o un investigador) desea conocer los valoresde parámetros tales como la media poblacional, la diferencia entre medias,o la proporción, entre otras; por ejemplo, un criminalista desea conocer queproporción de personas convictas de un crimen sufren de algunadesviación mental, o un funcionario de salud publica, podría estar

interesado en conocer la edad promedio en que empezó a adquirir el habitode fumar alguna población de fumadores, etc.

La forma de asignar las magnitudes de tales parámetros por medio de unprocedimiento de inferencia estadística denominado estimación.

5.1.3 Prueba de hipótesis

La palabra hipótesis se define como:1.- Una afirmación que esta sujeta a verificación o comprobación,2.- Una suposición que se utiliza como base para una acción.

El punto clave de estas definiciones esta en que una hipótesis es unaafirmación o suposición y no un hecho establecido.

El propósito de las pruebas de hipótesis es determinar si un valorpropuesto (hipotético) para un parámetro poblacional, por ejemplo, lamedia, debe aceptarse con base en la evidencia muestral.

Si el valor de un estadístico muestral, como la media muestral, es cercanoal valor propuesto con parámetro y solo difiere en una cantidad que resultade esperarse debido al muestreo aleatorio, entonces no se rechaza el valorhipotético. Si el estadístico muestral difiere del valor propuesto en unacantidad que no es atribuible a la casualidad, entonces se rechaza lahipótesis por no considerarse plausible.

5.2 Estimaciones puntuales y por intervalos de confianza

ESTIMACION

El objetivo principal de la estadística inferencial es la estimación, esto esque mediante el estudio de una muestra de una población se quieregeneralizar las conclusiones al total de la misma. Como vimos en lasección anterior, los estadísticos varían mucho dentro de sus distribucionesmuestrales, y mientras menor sea el error estándar de un estadístico, máscercanos serán unos de otros sus valores.

Existen dos tipos de estimaciones para parámetros; puntuales y porintervalo.

Una estimación puntual es un único valor estadístico y se usa paraestimar un parámetro. El estadístico usado se denomina estimador.

Una estimación por intervalo es un rango, generalmente de ancho finito,que se espera que contenga el parámetro.

Estimación Puntual

La inferencia estadística está casi siempre concentrada en obtener algúntipo de conclusión acerca de uno o más parámetros (característicaspoblacionales).Para hacerlo, se requiere que un investigador obtenga datos muestrales decada una de las poblaciones en estudio. Entonces, las conclusionespueden estar basadas en los valores calculados de varias cantidadesmuestrales . Po ejemplo, representamos con (parámetro) el verdaderopromedio de resistencia a la ruptura de conexiones de alambres utilizadospara unir obleas de semiconductores. Podría tomarse una muestraaleatoria de 10 conexiones para determinar la resistencia a la ruptura decada una, y la media muestral de la resistencia a la ruptura x se podíaemplear para sacar una conclusión acerca del valor de . De forma similar,si 2 es la varianza de la distribución de resistencia a la ruptura, el valor dela varianza muestral s2 se podría utilizar pra inferir algo acerca de 2.Cuando se analizan conceptos generales y métodos de inferencia esconveniente tener un símbolo genérico para el parámetro de interés. Seutilizará la letra griega para este propósito. El objetivo de la estimaciónpuntual es seleccionar sólo un número, basados en datos de la muestra,que represente el valor más razonable de q.

Una muestra aleatoria de 3 baterías para calculadora podría presentarduraciones observadas en horas de x1=5.0, x2=6.4 y x3=5.9. El valorcalculado de la duración media muestral es x = 5.77, y es razonableconsiderar 5.77 como el valor más adecuado de .

Una estimación puntual de un parámetro es un sólo número que sepuede considerar como el valor más razonable de . La estimación puntualse obtiene al seleccionar una estadística apropiada y calcular su valor apartir de datos de la muestra dada. La estadística seleccionada se llamaestimador puntual de .

El símbolo ˆ (theta sombrero) suele utilizarse para representar elestimador de y la estimación puntual resultante de una muestra dada.Entonces mˆ = x se lee como “el estimador puntual de m es la mediamuestral x ”. El enunciado “la estimación puntual de m es 5.77” se puedeescribir en forma abreviada mˆ = 5.77 .

Ejemplo:En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg debajo costo, para varios procesos de fundición. En consecuencia, esimportante contar con métodos prácticos para determinar variaspropiedades mecánicas de esas aleaciones. Examine la siguiente muestrade mediciones del módulo de elasticidad obtenidos de un proceso defundición a presión:

44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1

Suponga que esas observaciones son el resultado de una muestraaleatoria. Se desea estimar la varianza poblacional s2. Un estimadornatural es la varianza muestral:

En el mejor de los casos, se encontrará un estimador qˆ para el cua l ˆ = siempre. Sin embargo, ˆ es una función de las Xi muestrales, por loque en sí misma una variable aleatoria.

ˆ = + error de estimación

entonces el estimador preciso sería uno que produzca sólo pequeñasdiferencias de estimación, de modo que los valores estimados se acerquenal valor verdadero.

Estimación por Intervalos

Un estimado puntual, por ser un sólo número, no proporciona por sí mismoinformación alguna sobre la precisión y confiabilidad de la estimación. Porejemplo, imagine que se usa el estadístico x para calcular un estimadopuntual de la resistencia real a la ruptura de toallas de papel de cierta

marca, y suponga que x = 9322.7. Debido a la variabilidad de la muestra, nunca setendrá el caso de que x =. El estimado puntual nada dice sobre lo cercanoque esta de . Una alternativa para reportar un solo valor del parámetroque se esté estimando es calcular e informar todo un intervalo de valoresfactibles, un estimado de intervalo o intervalo de confianza (IC). Unintervalo de confianza se calcula siempre seleccionando primero un nivelde confianza, que es una medida de el grado de fiabilidad en el intervalo.Un intervalo de confianza con un nivel de confianza de 95% de laresistencia real promedio a la ruptura podría tener un límite inferior de9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de95%, es posible tener cualquier valor de entre 9162.5 y 9482.9.Un nivel de confianza de 95% implica que 95% de todas las muestras daríalugar a un intervalo que incluye o cualquier otro parámetro que se estéestimando, y sólo 5% de las muestras producirá un intervalo erróneo.Cuanto mayor sea el nivel de confianza podremos creer que el valor delparámetro que se estima está dentro del intervalo.

Estimación para la Media

Es conocido de nosotros durante este curso, que en base a la distribuciónmuestral de medias que se generó en el tema anterior, la formula para elcalculo de probabilidad es la siguiente:

Como en este caso no conocemos el parámetro y lo queremos estimar pormedio de la media de la muestra, sólo se despejará de la formulaanterior, quedando lo siguiente:

De esta formula se puede observar que tanto el tamaño de la muestracomo el valor de z se conocerán. Z se puede obtener de la tabla de ladistribución normal a partir del nivel de confianza establecido. Pero enocasiones se desconoce por lo que en esos casos lo correcto es utilizarotra distribución llamada “t” de student si la población de donde provienenlos datos es normal.

Para el caso de tamaños de muestra grande se puede utilizar unaestimación puntual de la desviación estándar, es decir igualar la desviaciónestándar de la muestra a la de la población (s=).

Ejemplos:1. Se encuentra que la concentración promedio de zinc que se saca delagua a partir de una muestra de mediciones de zinc en 36 sitios diferenteses de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de95% y 99% para la concentración media de zinc en el río. Suponga que ladesviación estándar de la población es 0.3.

Solución:

La estimación puntual de es x = 2.6. El valor de z para un nivel deconfianza del 95% es 1.96, por lo tanto:

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que elintervalo será más amplio:

El intervalo de confianza proporciona una estimación de la presición denuestra estimación puntual. Si es realmente el valor central de intervalo,entonces x estima sin error. La mayor parte de las veces, sin embargo, x

no será exactamente igual a y la estimación puntual es errónea. Lamagnitud de este error será el valor absoluto de la diferencia entre y x , ypodemos tener el nivel de confianza de que esta diferencia no excederá

Como se puede observar en los resultados del ejercicio se tiene un error deestimación mayor cuando el nivel de confianza es del 99% y más pequeñocuando se reduce a un nivel de confianza del 95%.

2. Una empresa eléctrica fabrica focos que tienen una duraciónaproximadamente distribuida de forma normal con una desviación estándarde 40 horas. Si una muestra de 30 focos tiene una duración promedio de780 horas, encuentre un intervalos de confianza de 96% para la media dela población de todos los focos que produce esta empresa.

Con un nivel de confianza del 96% se sabe que la duración media de losfocos que produce la empresa está entre 765 y 765 horas.

3. La prueba de corte sesgado es el procedimiento más aceptado paraevaluar la calidad de una unión entre un material de reparación y susustrato de concreto. El artículo “Testing the Bond Between RepairMaterials and Concrete Substrate” informa que, en cierta investigación, seobtuvo una resistencia promedio muestral de 17.17 N/mm2, con unamuestra de 48 observaciones de resistencia al corte, y la desviaciónestándar muestral fue 3.28 N/mm2. Utilice un nivel de confianza inferior del95% para estimar la media real de la resistencia al corte.

Solución:

En este ejercicio se nos presentan dos situaciones diferentes a losejercicios anteriores. La primera que desconoce la desviación estándar dela población y la segunda que nos piden un intervalo de confianzaunilateral.

El primer caso ya se había comentado y se solucionará utilizando ladesviación estándar de la muestra como estimación puntual de sigma.Para el intervalo de confianza unilateral, se cargará el área bajo la curvahacia un solo lado como sigue:

Esto quiere decir que con un nivel de confianza de 95%, el valor de lamedia está en el intervalo (16.39, ).

Estimación de una Proporción

Un estimador puntual de la proporción P en un experimento binomial estádado por la estadística P=X/N, donde x representa el número de éxitos enn pruebas.

Por tanto, la proporción de la muestra p =x/n se utilizará como estimadorpuntual del parámetro P.

Si no se espera que la proporción P desconocida esté demasiado cerca de0 ó de 1, se puede establecer un intervalo de confianza para P alconsiderar la distribución muestral de proporciones.

Al despejar P de esta ecuación nos queda:

En este despeje podemos observar que se necesita el valor del parámetroP y es precisamente lo que queremos estimar, por lo que lo sustituiremospor la proporción de la muestra p siempre y cuando el tamaño de muestrano sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercanaa 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquíno es confiable, por tanto, no se debe utilizar. Para estar seguro, se deberequerir que np ó nq sea mayor o igual a 5.

El error de estimación será la diferencia absoluta entre p y P, y podemostener el nivel de confianza de que esta diferencia no excederá

Ejemplos:1. Un fabricante de reproductores de discos compactos utiliza un conjuntode pruebas amplias para evaluar la función eléctrica de su producto. Todoslos reproductores de discos compactos deben pasar todas las pruebasantes de venderse. Una muestra aleatoria de 500 reproductores tiene comoresultado 15 que fallan en una o más pruebas. Encuentre un intervalo deconfianza de 90% para la proporción de los reproductores de discoscompactos de la población que no pasan todas las pruebas.

Solución:

n=500p = 15/500 = 0.03z(0.90) = 1.645

Se sabe con un nivel de confianza del 90% que la proporción de discosdefectuosos que no pasan la prueba en esa población esta entre 0.0237 y0.0376.

2. En una muestra de 400 pilas tipo B fabricadas por la Everlast Company,se encontraron 20 defectuosas. Si la proporción p de pilas defectuosas enesa muestra se usa para estimar P, que vendrá a ser la proporciónverdadera de todas las pilas defectuosas tipo B fabricadas por la EverlastCompany, encuentre el máximo error de estimación tal que se puedatener un 95% de confianza en que P dista menos de de p.

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza enque P dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa paraerstimar P, el error máximo de estimación será aproximadamente 0.021con un nivel de confianza del 95%.

Para calcular el intervalo de confianza se tendría:

Esto da por resultado dos valores, (0.029, 0.071). Con un nivel deconfianza del 95% se sabe que la proporción de pulas defectuosas de estacompañía está entre 0.029 y 0.071.

Si se requiere un menor error con un mismo nivel de confianza sólose necesita aumentar el tamaño de la muestra.

3. En un estudio de 300 accidentes de automóvil en una ciudad específica,60 tuvieron consecuencias fatales. Con base en esta muestra, construyaun intervalo del 90% de confianza para aproximar la proporción de todoslos accidentes automovilísticos que en esa ciudad tienen consecuenciasfatales.

5.3 Pruebas de hipótesis

5.3.1 Para la media poblacional

Las secciones anteriores han mostrado cómo puede estimarse unparámetro a partir de los datos contenidos en una muestra. Puedeencontrarse ya sea un sólo número (estimador puntual) o un intervalo devalores posibles (intervalo de confianza). Sin embargo, muchos problemasde ingeniería, ciencia, y administración, requieren que se tome unadecisión entre aceptar o rechazar una proposición sobre algún parámetro.Esta proposición recibe el nombre de hipótesis. Este es uno de losaspectos más útiles de la inferencia estadística, puesto que muchos tiposde problemas de toma de decisiones, pruebas o experimentos en el mundo

de la ingeniería, pueden formularse como problemas de prueba dehipótesis.

Una hipótesis estadística es una proposición o supuesto sobre losparámetros de una o más poblaciones.

Suponga que se tiene interés en la rapidez de combustión de un agentepropulsor sólido utilizado en los sistemas de salida de emergencia para latripulación de aeronaves. El interés se centra sobre la rapidez decombustión promedio. De manera específica, el interés recae en decir si larapidez de combustión promedio es o no 50 cm/s. Esto puede expresarsede manera formal como

Ho; m = 50 cm/sH1; m ¹ 50 cm/s

La proposición Ho; m = 50 cm/s, se conoce como hipótesis nula ,mientras que la proposición H1; m ¹ 50 cm/s, recibe el nombre dehipótesis alternativa.

Puesto que la hipótesis alternativa especifica valores de m que pueden sermayores o menores que 50 cm/s, también se conoce como hipótesisalternativa bilateral. En algunas situaciones, lo que se desea es formularuna hipótesis alternativa unilateral, como en Ho; m = 50 cm/s Ho; m = 50cm/s ó H1; m < 50 cm/s H1; m > 50 cm/s

Es importante recordar que las hipótesis siempre son proposiciones sobrela población o distribución bajo estudio, no proposiciones sobre la muestra.Por lo general, el valor del parámetro de la población especificado en lahipótesis nula se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento delproceso, entonces el objetivo de la prueba de hipótesis usualmente esdeterminar si ha cambiado el valor del parámetro.

2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona conel proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesises verificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas,tales como las especificaciones de diseño o ingeniería, o de obligacionescontractuales. En esta situación, el objetivo usual de la prueba de hipótesises probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis enparticular recibe el nombre de prueba de hipótesis. Los procedimientos deprueba de hipótesis dependen del empleo de la información contenida en lamuestra aleatoria de la población de interés. Si esta información esconsistente con la hipótesis, se concluye que ésta es verdadera; sinembargo si esta información es inconsistente con la hipótesis, se concluyeque esta es falsa. Debe hacerse hincapié en que la verdad o falsedad deuna hipótesis en particular nunca puede conocerse con certidumbre, amenos que pueda examinarse a toda la población.

Usualmente esto es imposible en muchas situaciones prácticas. Por tanto,es necesario desarrollar un procedimiento de prueba de hipótesis teniendoen cuenta la probabilidad de llegar a una conclusión equivocada.

La hipótesis nula, representada por Ho, es la afirmación sobre una o máscaracterísticas de poblaciones que al inicio se supone cierta (es decir, la“creencia a priori”).

La hipótesis alternativa, representada por H1, es la afirmacióncontradictoria a Ho, y ésta es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si laevidencia muestral sugiere que Ho es falsa. Si la muestra no contradicedecididamente a Ho, se continúa creyendo en la validez de la hipótesisnula.

Entonces, las dos conclusiones posibles de un análisis por prueba dehipótesis son rechazar Ho o no rechazar Ho.

Prueba de una Hipótesis Estadística

Para ilustrar los conceptos generales, considere el problema de la rapidezde combustión del agente propulsor presentado con anterioridad. Lahipótesis nula es que la rapidez promedio de combustión es 50 cm/s,mientras que la hipótesis alternativa es que ésta no es igual a 50 cm/s.

Esto es, se desea probar:Ho; m = 50 cm/sH1; m ¹ 50 cm/s

Supóngase que se realiza una prueba sobre una muestra de 10especímenes, y que se observa cual es la rapidez de combustión promediomuestral. La media muestral es un estimador de la media verdadera de lapoblación. Un valor de la media muestral x que este próximo al valorhipotético m = 50 cm/s es una evidencia de que el verdadero valor de lamedia m es realmente 50 cm/s; esto es, tal evidencia apoya la hipótesisnula Ho. Por otra parte, una media muestral muy diferente de 50 cm/sconstituye una evidencia que apoya la hipótesis alternativa H1. Por tanto,en este caso, la media muestral es el estadístico de prueba.

La media muestral puede tomar muchos valores diferentes. Supóngaseque si 48.5£ x £51.5, entonces no se rechaza la hipótesis nula Ho; m = 50cm/s, y que si x <48.5 ó x >51.5, entonces se acepta la hipótesis alternativaH1; m ¹ 50 cm/s.

Los valores de x que son menores que 48.5 o mayores que 51.5constituyen la región crítica de la prueba, mientras que todos los valoresque están en el intervalo 48.5£ x £51.5 forman la región de aceptación.Las fronteras entre las regiones crítica y de aceptación reciben el nombrede valores críticos. La costumbre es establecer conclusiones conrespecto a la hipótesis nula Ho. Por tanto, se rechaza Ho en favor de H1 siel estadístico de prueba cae en la región crítica, de lo contrario, no serechaza Ho.

Este procedimiento de decisión puede conducir a una de dos conclusioneserróneas. Por ejemplo, es posible que el valor verdadero de la rapidezpromedio de combustión del agente propulsor sea igual a 50 cm/s. Sinembargo, para todos los especímenes bajo prueba, bien puede observarseun valor del estadístico de prueba x que cae en la región crítica. En estecaso, la hipótesis nula Ho será rechazada en favor de la alternativaH1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusiónequivocada se conoce como error tipo I.

El error tipo I se define como el rechazo de la hipótesis nula Ho cuandoésta es verdadera. También es conocido como a ó nivel de significancia.

Si tuviéramos un nivel de confianza del 95% entonces el nivel designificancia sería del 5%. Análogamente si se tiene un nivel de confianzadel 90% entonces el nivel de significancia sería del 10%.

Ahora supóngase que la verdadera rapidez promedio de combustión esdiferente de 50 cm/s, aunque la media muestral x caiga dentro de la regiónde aceptación.

En este caso se acepta Ho cuando ésta es falsa. Este tipo de conclusiónrecibe el nombre de error tipo II.

El error tipo II ó error b se define como la aceptación de la hipótesis nulacuando ésta es falsa. Por tanto, al probar cualquier hipótesis estadística,existen cuatro situaciones diferentes que determinan si la decisión final escorrecta o errónea.

1. Los errores tipo I y tipo II están relacionados. Una disminución en laprobabilidad de uno por lo general tiene como resultado un aumento en laprobabilidad del otro.

2. El tamaño de la región crítica, y por tanto la probabilidad de cometer unerror tipo I, siempre se puede reducir al ajustar el o los valores críticos.

3. Un aumento en el tamaño muestral n reducirá a y b de forma simultánea.

4. Si la hipótesis nula es falsa, b es un máximo cuando el valor real delparámetro se aproxima al hipotético. Entre más grande sea la distanciaentre el valor real y el valor hipotético, será menor b.

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESISINDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTETRATANDO

1. Interpretar correctamente hacia que distribución muestral se ajustan losdatos del enunciado.

2. Interpretar correctamente los datos del enunciado diferenciando losparámetros de los estadísticos. Así mismo se debe determinar en estepunto información implícita como el tipo de muestreo y si la población esfinita o infinita.

3. Establecer simultáneamente el ensayo de hipótesis y el planteamientográficodel problema. El ensayo de hipótesis está en función de parámetros yaque se quiere evaluar el universo de donde proviene la muestra. En estepunto se determina el tipo de ensayo (unilateral o bilateral).

4. Establecer la regla de decisión. Esta se puede establecer en función delvalor crítico, el cual se obtiene dependiendo del valor de a (Error tipo I onivel de significancia) o en función del estadístico límite de la distribuciónmuestral.

Cada una de las hipótesis deberá ser argumentada correctamente paratomar la decisión, la cual estará en función de la hipótesis nula o Ho.

5. Calcular el estadístico real, y situarlo para tomar la decisión.

6. Justificar la toma de decisión y concluir.

Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:- Unilateral Derecho- Unilateral Izquierdo- Bilateral

Dependiendo de la evaluación que se quiera hacer se seleccionará el tipode ensayo.

Unilateral Derecho. El investigador desea comprobar la hipótesis de unaumento en el parámetro, en este caso el nivel de significancia se cargatodo hacia el lado derecho, para definir las regiones de aceptación y derechazo.

Unilateral Izquierdo: El investigador desea comprobar la hipótesis de unadisminución en el parámetro, en este caso el nivel de significancia se cargatodo hacia el lado izquierdo, para definir las regiones de aceptación y derechazo.

Bilateral: El investigador desea comprobar la hipótesis de un cambio en elparámetro. El nivel de significancia se divide en dos y existen dos regionesde rechazo.

Para realizar los ejemplos y ejercicios de ensayo de hipótesis serecomienda seguir los pasos mencionados anteriormente. Los ejemplossiguientes se solucionarán por los pasos recomendados, teniéndose unavariedad de problemas en donde se incluirán a todas las distribucionesmuestrales que se han visto hasta aquí.

Ejemplos:

1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos elaño pasado muestra una vida promedio de 71.8 años. Suponga unadesviación estándar poblacional de 8.9 años, ¿esto parece indicar que lavida media hoy en día es mayor que 70 años? Utilice un nivel designificancia de 0.05.

Existe otra manera de resolver este ejercicio, tomando la decisión en baseal estadístico real, en este caso la media de la muestra. De la formula de ladistribución muestral de medias se despeja la media de la muestra:

Como la media de la muestral es de 71.8 años y es mayor al valor de lamedia muestral límite de 71.46 por lo tanto se rechaza Ho y se llega a lamisma conclusión.

2. Una empresa eléctrica fabrica focos que tienen una duración que sedistribuye de forma aproximadamente normal con una media de 800 horasy una desviación estándar de 40 horas. Si una muestra aleatoria de 30focos tiene una duración promedio de 788 horas, ¿muestran los datossuficiente evidencia para decir que la duración media ha cambiado? Utiliceun nivel de significancia del 0.04.

Solución:

1. Se trata de una distribución muestral de medias con desviación estándarconocida.

2. Datos:=800 horas= 40 horasx = 788 horasn = 30= 0.04

3. Ensayo de hipótesisHo; = 800 horasH1; 800 horas

4. Regla de Decisión:Si –2.052ZR2.052 No se rechaza HoSi ZR < -2.052 ó si ZR > 2.052 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Como –2.052-1.6432.052 por lo tanto, no se rechaza Ho y se concluyecon un nivel de significancia del 0.04 que la duración media de los focos noha cambiado.

Solución por el otro método:

Regla de decisión:Si 785.02 R x 814.98 No se rechaza HoSi R x < 785.02 ó R x > 814.98 se rechaza HoComo la R x = 788 horas, entonces no se rechaza Ho y se concluye que la

duración media de los focos no ha cambiado.

3. Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, enpomedio 5.23 onzas con una desviación estándar de 0.24 onzas. Pruebe lahipótesis de que = 5.5 onzas contra al hipótesis alternativa, < 5.5 onzasen el nivel de significamcia de 0.05.

Solución:

1. Se trata de una distribución muestral de medias con desviación estándardesconocida, pero como el tamaño de muestra es mayor a 30 se puedetomar la desviación muestral como un estimador puntual para lapoblacional.

2. Datos:= 5.5 onzass= 0.24 onzasx = 5.23 onzasn = 64= 0.05

3. Ensayo de hipótesisHo; = 5.5 onzasH1; < 5.5 onzas

4. Regla de decisión:Si ZR -1.645 No se rechaza HoSi ZR < -1.645 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel designificancia del 0.05 que las bolsas de palomitas pesan en promediomenos de 5.5 onzas.

4. Un constructor afirma que se instalan bombas de calor en 70% de todaslascasas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría deacuerdo con esta afirmación si una investigación de casas nuevas en estaciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice unnivel de significancia de 0.10.

Solución:

1. Se trata de una distribución muestral de proporciones.2. Datos:P= 0.70p = 8/15 = 0.5333

n = 15= 0.10

Regla de decisión:Si 0.505pR0.894 No se rechaza HoSi pR < 0.505 ó si ZR > 0.894 Se rechaza HoComo el valor del estadístico real es de 0.533 por lo tanto no se rechazaHo y se llega a la misma conclusión.

5. Un fabricante de semiconductores produce controladores que seemplean en aplicaciones de motores automovilísticos. El cliente requiereque la fracción de controladores defectuosos en uno de los pasos de

manufactura críticos no sea mayor que 0.05, y que el fabricante demuestreesta característica del proceso de fabricación con este nivel de calidad,utilizando = 0.05. El fabricante de semiconductores toma una muestraaleatoria de 200 dispositivos y encuentra que cuatro de ellos sondefectuosos. ¿El fabricante puede demostrar al cliente la calidad delproceso?