módulo 20 de estadística y probabilidad
DESCRIPTION
Ude@TRANSCRIPT
187Estadística
20Definiciones básicas
Introducción
En este módulo se presentan las definiciones básicas de intervalos de confianza y
la forma de encontrar un intervalo de confianza para cualquier parámetro; además
se encuentra un intervalo de confianza para la media bajo el supuesto de la
distribución normal y se obtiene el tamaño de muestra basado en el error de
estimación del parámetro, en este caso la media poblacional.
Objetivos del módulo
1. Adquirir los conocimientos básicos de intervalos de confianza.
2. Entender el concepto de coeficiente de confianza a nivel de muestreo.
3. Aprender a obtener intervalos de confianza para cualquier parámetro poblacional.
4. Obtener estimaciones de la media poblacional.
5. Obtener tamaños muestrales a partir del error de estimación.
Preguntas básicas
1. ¿Qué es el coeficiente de confianza?
2. ¿Bajo qué distribución se obtiene una estimación por intervalos de confianza
para la media poblacional?
3. ¿Los límites superior e inferior de los intervalos de confianza son valores fijos
para cualquier muestra aleatoria?
4. ¿Qué pasa con el tamaño de la muestra a medida que el error de estimación au-
menta?
5. ¿Qué pasa con el tamaño de la muestra a medida que el nivel de confianza au-
menta?
Contenidos del módulo
20.1 Intervalos de confianza
20.2 Coeficiente de confianza
20.3 Obtención de un intervalo de confianza
20.4 Intervalo de confianza para la media
20.5 Selección del tamaño de la muestra
Para determinar una estimación por
intervalos es necesario calcular el coeficiente
de confianza que le da al investigador la
probabilidad de que el parámetro que se
va a estimar esté contenido en un intervalo
dado.
Vea el módulo 20 del programa
de televisión Estadística.
188
20.1 Intervalos de confianza
Una estimación puntual, por ser un valor puntual, no proporciona por sí misma
información sobre la confiabilidad y precisión de la estimación. Por ejemplo, imagine
que se usa el estadístico X para calcular la estimación puntual de la elasticidad
promedio de un polímero afectado por la concentración de un reactivo y suponga
que x 55. Debido a la variabilidad de la muestra, en la realidad el valor verdadero
del parámetro, , no será igual al valor del estimador calculado a partir de la
información muestral. Una alternativa muy útil para reportar el valor del parámetro
que se desea averiguar es calcular un intervalo de posibles valores, una estimación
por intervalos de confianza (IC).
Sea el parámetro de interés y ˆ un estimador puntual de . Una estimación de
por intervalo es un intervalo de la forma ( , ), ( ),l u l u donde l y u dependen
de y de la distribución de ˆ . Para cada una de las muestras aleatorias (m.a.) se
obtiene un valor ˆ diferente y por tanto valores diferentes de l y u. En consecuencia,
estos extremos se convierten en variables aleatorias, L y U. El intervalo (L, U) se
llama intervalo de confianza. Utilizando el estimador, ˆ, y la distribución del
estimador se pueden determinar L y U tales que ( ) 1 .P L U Se tiene una
probabilidad de1 de que el intervalo (l, u) contenga el verdadero valor del
parámetro Para una muestra aleatoria el intervalo (l, u) se llama intervalo de
confianza al (1 )100% para . Los extremos l y u son los límites de confianza,
límite inferior y límite superior, respectivamente, y (1 ) se llama coeficiente de
confianza.
20.2 Coeficiente de confianza
El coeficiente de confianza es una medida del grado de fiabilidad del intervalo. De
todas las posibles muestras que se pueden obtener y sus respectivos IC al
(1 )100%, el (1 )100% de éstos contendrá el verdadero valor del parámetro.
Ejemplo 1
Un intervalo con un coeficiente de confianza del 95% para la vida promedio de las
llantas de motocicletas podría tener un límite inferior de trece meses y uno superior
de dieciséis meses. Entonces, con un nivel de confianza del 95%, es posible tener
cualquier valor de entre trece y dieciséis meses. Un nivel de confianza del 95%
implica que 95% de las muestras daría lugar a un intervalo que incluye a o cualquier
otro parámetro que se esté estimando y sólo 5% de las muestras producirá un
intervalo que no contenga el verdadero valor del parámetro.
Una interpretación de un coeficiente de confianza del 95% radica en la interpretación
frecuentista de probabilidad a largo plazo. Suponga que se toman 1000 muestras
Capítulo 9: Intervalos de confianza
Vea en su multimedia de
Estadística la animación Cálculo devalores críticos de t, x 2, f.
Vea en su multimedia de
Estadística la aplicación de
programación Intervalos deconfianza
189Estadística
aleatorias y se calculan intervalos con una confianza del 95% para la vida promedio
útil de las llantas de motocicletas. El 95% de los IC calculados a partir de estas
muestras aleatorias contendrán a y el 5% no lo contendrán. La figura 20.1 muestra
cuáles intervalos calculados para el parámetro contienen su verdadero valor y
cuántos no lo contienen.
Figura 20.1. Construcción repetida de un intervalo de confianza para
El semiintervalo l o u se llama precisión del intervalo de confianza. El
objetivo es obtener intervalos angostos con una alta confianza.
20.3 Obtención de un intervalo de confianza
Suponga que 1 nX ,...,X es una m.a. de una distribución con parámetro
desconocido. Suponga que se puede encontrar un estimador ˆ, el cual es una
función de la muestra aleatoria. Sea 1
ˆ ( ,..., ),ng X X la cual no depende del
parámetro ni de cualquier otro parámetro desconocido.
Se pueden encontrar constantes a y b tales que
1( ( ) ) 1 .nP a g X ,...,X b
Suponga que se puede despejar a de la desigualdad y obtener
1 1( ( ,..., ) ( ,..., )) 1 ,n nP l X X u X X
donde 1( ,..., )nl X X y 1( ,..., )nu X X son los límites de confianza inferior y superior,
respectivamente, y para una muestra especifica se obtiene el IC (l, u) al (1 )100%
de
Módulo 20: Definiciones básicas
190
20.4 Intervalo de confianza para la media
Sea 1 nX ,...,X una m.a. de una población con distribución normal 2( , )NORMAL
con media desconocida y varianza 2 conocida.
Se sabe que (0,1).X
NORMALn
Hallemos L y U, tales que ( ) 1P L U
1 2
2 1
( ) 1 ,
( ) 1 ,
1 ,
( ) 1 ,
( ) ( ) 1 .
P U L
P X U X X L
X U X X LP
n n n
P z Z z
P Z z P Z z
2( ) 1 2P Z z y 1( ) 2.P Z z
lo cual puede observarse en la figura 20.2.
Por tanto
2L X zn
y
2 .U X zn
Entonces, el IC del (1 )100% para es:
2 2, .X z X zn n
Capítulo 9: Intervalos de confianza
Vea en su multimedia de
Estadística la animación Velocidaden las vías
191Estadística
Figura 20.2. Coeficiente de confianza para el intervalo
Ejemplo 2
Suponga que 1 28X ,...,X son las duraciones de 28 focos y que la duración promedio
de todos ellos es de 750 horas. Se sabe además que estas duraciones tienen una
distribución normal con desviación estándar de 60 horas.
a. Encuentre un intervalo de confianza del 95% para la media de la población
de todos los focos que se producen en la empresa fabricante.
b. Encuentre el tamaño de muestra para el que el error de estimación sea inferior
a 3 horas, con una confianza del 95%.
Solución
a. El intervalo de confianza para la duración promedio de los focos fabricados por esta
empresa, basados en una m.a. de tamaño 28, donde 2 2750, (60) ,x es:
2 2,X z X zn n
, donde 1 0.95;
0.05, / 2 0.025, y
0.025 1 0.025 0.975 1.96,z z z
60 60750 1.96 , 750 1.96 ,
28 28
727 7757 772 2243.. , .
Entonces la duración promedio de los focos fabricados por esta empresa se
encuentra entre 727.7757 y 772.2243 horas, con un nivel de confianza del
95%.
Módulo 20: Definiciones básicas
192
b. Para hallar el valor de n se debe cumplir que:
( 3) 0.95,P X
( 3 3) 0.95,P X
3 30.950,
60 60
XP
n n n
( 0.05 0.05 ) 0.95,P n Z n
( 0.05 ) ( 0.05 ) 0.95,P Z n P Z n
( 0.05 ) ( 0.05 ) 0.95,P Z n P Z n
por propiedades de simetría
( 0.05 ) (1 ( 0.05 )) 0.95,P Z n P Z n
( 0.05 ) 1 ( 0.05 ) 0.95,P Z n P Z n
2 ( 0.05 ) 1 0.95,P Z n
1.95( 0.05 ) ,
2P Z n
( 0.05 ) 0.975,P Z n
0.975 1.96.z
Por tanto
( ) 0.975,P Z z
2
0.05 1.96,
1.961536.64.
0.05
z n
n
Capítulo 9: Intervalos de confianza
193Estadística
20.5 Selección del tamaño de la muestra
Se desea saber qué tan grande se requiere que sea una muestra para asegurar que
el error al estimar sea menor que una cantidad específica , es decir, que el error de
estimación de la media sea X con una confianza del (1 )100% :
2
2.
zn
Ejemplo 3
Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una
muestra si se desea tener 95% de confianza de que la media estimada esté dentro de
10 horas de la media real?
Solución
2
/ 2 1.96*4061.46 62.
10
zn
Por tanto se necesita un tamaño de muestra de 62 para asegurar con una probabili-
dad de 95% que la media estimada esté dentro de 10 horas de la media real.
Módulo 20: Definiciones básicas
Resumen
En este módulo se explicaron los conceptos básicos de los intervalos de confianza y se mostró en particular cómo
encontrar un intervalo de confianza para la media poblacional y cómo encontrar el tamaño de una muestra aleatoria para
asegurar con un coeficiente de confianza que el error de estimación sea menor o igual que un valor en particular.