Download - Intervalos de Confianza
Intervalos de ConfianzaIntervalos de Confianza
M. C. José Juan Rincón PasayeM. C. José Juan Rincón Pasaye
UMSNH – FIE Mayo de 2003
ContenidoContenido
Estimación de parámetrosEstimación de parámetrosEstimación de intervalosEstimación de intervalosIntervalo de confianza para la mediaIntervalo de confianza para la mediaIntervalo de confianza para la Intervalo de confianza para la varianzavarianzaOtros Intervalos de ConfianzaOtros Intervalos de ConfianzaIntervalos de toleranciaIntervalos de toleranciaInts. de confianza y regresión linealInts. de confianza y regresión lineal
UMSNH-FIEUMSNH-FIE
Estimación de ParámetrosEstimación de Parámetros
Parámetros poblacionales y Estadísticos MuestralesParámetros poblacionales y Estadísticos Muestrales
UMSNH - FIEUMSNH - FIE
DatosDatos(Población de Interés)(Población de Interés)
MuestrasMuestras
-4 -2 0 2 40
20
40
60
80
100
120
140
160Histograma de la Poblacion
Clases
Fre
cuencia
-4 -2 0 2 40
2
4
6
8
10
12
14
16
Histograma de la Muestra
Clases
Fre
cuen
cia
ParámetrosParámetros::
Media (Media ())
Varianza(Varianza(22))
Desv. Est. (Desv. Est. ())
Etc.Etc.
EstadísticosEstadísticos::
Promedio ( )Promedio ( )
Varianza muestral(Varianza muestral(SS22))
Desv. Est. muestral(Desv. Est. muestral(SS))
Etc.Etc.
InferenciasInferencias
Muestreo
XX
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Estimación de la media de una poblaciónEjemplo: Estimación de la media de una población
UMSNH - FIEUMSNH - FIE
EstimadorEstimador: : La media muestralLa media muestral ( ) que se calcula a partir de una muestra ( ) que se calcula a partir de una muestra de N datos como sigue:de N datos como sigue:
XX
)x...x(xN1
N21
____
X
Parámetro que se pretende estimar Parámetro que se pretende estimar : : La media de la población La media de la población ( ( µµ ) que en ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:
El estimador (en el ejemplo la media muestral) puede tomar diferentes El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, decir, el estimador es una variable aleatoriael estimador es una variable aleatoria
Es natural preguntarse : ¿Es natural preguntarse : ¿Cuál será la distribución de probabilidad del Cuál será la distribución de probabilidad del estimadorestimador? De hecho ¿? De hecho ¿cuáles serán sus parámetroscuáles serán sus parámetros? ¿? ¿tendrán que ver con los tendrán que ver con los de la poblaciónde la población??
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado
UMSNH - FIEUMSNH - FIE
EstimadorEstimador: La media muestral ( ): La media muestral ( )XX )x...x(xN1
N21
____
X
Población de interés Población de interés : El conjunto de datos obtenidos al lanzar un dado legal : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasionesen diversas ocasiones
Parámetro de interés Parámetro de interés : La media (: La media (µµ) de la población) de la población
Experimento aleatorioExperimento aleatorio : Lanzar un dado: Lanzar un dado
Variable aleatoriaVariable aleatoria X= número obtenido en la cara superior X= número obtenido en la cara superior
Espacio muestralEspacio muestral = {1, 2 , 3, 4, 5 , 6} = {1, 2 , 3, 4, 5 , 6}
Distribución de la variable aleatoria XDistribución de la variable aleatoria X: Uniforme: Uniforme
Media teóricaMedia teórica: µ=3.5: µ=3.5
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado
UMSNH - FIEUMSNH - FIE
Distribución de la variable aleatoria (X) del experimentoDistribución de la variable aleatoria (X) del experimento
Función de Probabilidad: Función de Probabilidad: f(x) = P(X=x)f(x) = P(X=x)
xx 11 22 33 44 55 66
f(x)f(x) 1/61/6 1/61/6 1/61/6 1/61/6 1/61/6 1/61/6
1 2 3 4 5 60
0.05
0.1
0.15
0.2
x
f(x)
Función de Probabilidad
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado
UMSNH - FIEUMSNH - FIE
Distribución del estadístico . Distribución del estadístico .
MuestraMuestra xx11 xx22 xx33 xx44 xx55 xx66 xx77 xx88 xx99 xx1010
11 11 33 55 11 11 22 22 44 22 22 2.12.1
22 11 55 33 66 33 33 66 44 22 55 3.83.8
33 66 11 55 33 55 44 55 33 22 22 3.23.2
44 22 55 22 44 11 55 33 66 66 44 3.83.8
55 33 66 55 44 55 44 33 22 33 44 3.73.7
...... ......
XX
XX
XX
Cada muestra puede considerarse como:Cada muestra puede considerarse como:
10 valores de la variable aleatoria X, 10 valores de la variable aleatoria X,
1 sólo valor para 10 variables aleatorias X1 sólo valor para 10 variables aleatorias X11,X,X22,...,X,...,X1010
Diferentes cálculos de para N=10:Diferentes cálculos de para N=10:
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado
UMSNH - FIEUMSNH - FIE
Distribución del estadístico . Distribución del estadístico . XX
XXSi obtenemos 1000 muestras, obtendremos 1000 valores de , para Si obtenemos 1000 muestras, obtendremos 1000 valores de , para estos 1000 valores realizamos el histograma:estos 1000 valores realizamos el histograma:
1 2 3 4 5 60
0.05
0.1
0.15
0.2
0.25
X
frec
uenc
ia r
elat
iva
Distribución de la media muestral
Estimación de ParámetrosEstimación de Parámetros
Ejemplo: Lanzamiento de un dadoEjemplo: Lanzamiento de un dado
UMSNH - FIEUMSNH - FIE
Código en Matlab:Código en Matlab:
%se simula el dado%se simula el dado
x=round(rand(N,n)*6+0.5);x=round(rand(N,n)*6+0.5);
M=sum(x)/N;M=sum(x)/N;
[X,c]=hist(M,15);[X,c]=hist(M,15);
%se grafica el histograma de frecuencia relativa en p.u.%se grafica el histograma de frecuencia relativa en p.u.
X=X/n;X=X/n;
bar(c,X)bar(c,X)
RecordatorioRecordatorio: Cada muestra puede considerarse como:: Cada muestra puede considerarse como:
10 valores de la variable aleatoria X, 10 valores de la variable aleatoria X,
1 sólo valor para 10 variables aleatorias X1 sólo valor para 10 variables aleatorias X11,X,X22,...,X,...,X1010
Estimación de ParámetrosEstimación de Parámetros
En general: un En general: un estadísticoestadístico que pretende estimar un parámetro que pretende estimar un parámetro es una v. a. Que depende de las N variables aleatorias que es una v. a. Que depende de las N variables aleatorias que forman una muestra, es decirforman una muestra, es decir
UMSNH - FIEUMSNH - FIE
= f(X= f(X11,X,X22,...,X,...,XNN))
Así, una Así, una muestramuestra es un conjunto de valores es un conjunto de valores (x(x11,x,x22,...,x,...,xNN)) tomados tomados
por las variables aleatorias por las variables aleatorias (X(X11,X,X22,...,X,...,XNN).).
Es natural suponer que la distribución Es natural suponer que la distribución f(Xf(Xii)=P(X)=P(Xii=x=xii)) de cada de cada
variable de la muestra es igual a la de la poblaciónvariable de la muestra es igual a la de la población
Sin embargo, la distribución Sin embargo, la distribución f( ) = P( = )f( ) = P( = ) del estadístico del estadístico como se vió en el ejemplo del dado es otra cosa. como se vió en el ejemplo del dado es otra cosa.
Estimación de IntervalosEstimación de Intervalos
En la explicación previa, un estimador produce En la explicación previa, un estimador produce un valorun valor que pretende aproximar a un parámetro que pretende aproximar a un parámetro . A este enfoque se le . A este enfoque se le llama llama estimación puntualestimación puntual
UMSNH - FIEUMSNH - FIE
En el enfoque de En el enfoque de estimación de intervalosestimación de intervalos, para un parámetro , para un parámetro no se estima un valor, sino un intervalo de la forma no se estima un valor, sino un intervalo de la forma l l u u, , donde los valores extremos l, u dependen del valor numérico del donde los valores extremos l, u dependen del valor numérico del estadístico para una muestra en particular y de la distribución estadístico para una muestra en particular y de la distribución de muestreo de de muestreo de
Es decir, l,u dependen de la muestra, por lo tanto son valores de Es decir, l,u dependen de la muestra, por lo tanto son valores de variables aleatorias L, Uvariables aleatorias L, U
Estimación de IntervalosEstimación de Intervalos
Partiendo de la distribución de muestreo para , es posible Partiendo de la distribución de muestreo para , es posible determinar valores de L,U tales que se cumpla lo siguiente:determinar valores de L,U tales que se cumpla lo siguiente:
UMSNH - FIEUMSNH - FIE
P(L P(L U) =1 – U) =1 – Donde 0 < Donde 0 < < 1 < 1
Es decir, se puede garantizar con una probabilidad de 1-Es decir, se puede garantizar con una probabilidad de 1- que que la muestra elegida contendrá el valor verdadero de la muestra elegida contendrá el valor verdadero de
Al intervalo resultanteAl intervalo resultante l l u u se le conoce comose le conoce como elel intervalo intervalo de confianza de confianza del 100(1– del 100(1– para el parámetro desconocido para el parámetro desconocido
Estimación de IntervalosEstimación de Intervalos
EjemploEjemplo: Construcción repetida de un intervalo de confianza : Construcción repetida de un intervalo de confianza para la media para la media
UMSNH - FIEUMSNH - FIE
Si los intervalos de confianza mostrados son del 95% significa Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos que si se construye un gran número de ellos, el 95% de ellos contendrá a la mediacontendrá a la media
Estimación de IntervalosEstimación de Intervalos
En la práctica se obtiene En la práctica se obtiene solamente una muestrasolamente una muestra y se calcula con y se calcula con ella un intervalo de confianza dicho intervalo contiene o no ella un intervalo de confianza dicho intervalo contiene o no contiene a contiene a , no es razonable asignar una probabilidad a este , no es razonable asignar una probabilidad a este evento.evento.
UMSNH - FIEUMSNH - FIE
La proposición a decuada es que el intervalo La proposición a decuada es que el intervalo contiene a contiene a “con “con una confianza” del 95%una confianza” del 95%
La longitud del intervalo de confianza (La longitud del intervalo de confianza (u-lu-l) es una medida de la ) es una medida de la calidad de la información obtenida en la muestra, al semi calidad de la información obtenida en la muestra, al semi intervalo intervalo u-u-, o , o -l-l se le llama se le llama Precisión del estimadorPrecisión del estimador..
¿Qué significado tiene un intervalo grande?¿Qué significado tiene un intervalo grande?¿És deseable que sea grande o que sea pequeño?¿És deseable que sea grande o que sea pequeño?
¿Qué relación tiene con el valor de 1-¿Qué relación tiene con el valor de 1-??
Estimación de IntervalosEstimación de Intervalos
Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)
UMSNH - FIEUMSNH - FIE
SituaciónSituación: Se tiene una población con media desconocida : Se tiene una población con media desconocida , pero , pero se supone conocida la varianza se supone conocida la varianza 22..
Se toma una muestra aleatoria Se toma una muestra aleatoria (X(X11,X,X22,...,X,...,XNN)). Con esta muestra se . Con esta muestra se
calcula el estadístico el cual es un estimador puntual calcula el estadístico el cual es un estimador puntual insesgadoinsesgado para la media para la media desconocida. Se puede obtener un desconocida. Se puede obtener un intervalo de confianza del 100(1-intervalo de confianza del 100(1-) % para ) % para si consideramos si consideramos los siguientes hechos acerca de la distribución de :los siguientes hechos acerca de la distribución de :
XX
XX
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)
UMSNH - FIEUMSNH - FIE
1.1. Si la población es Normal, la distribución de es NormalSi la población es Normal, la distribución de es Normal
2.2. Si la población no es Normal, el Si la población no es Normal, el Teorema del límite centralTeorema del límite central nos nos garantiza una distribución de aproximadamente normal garantiza una distribución de aproximadamente normal cuando cuando N N
3.3. La media de es La media de es ( es insesgado) ( es insesgado)
4.4. La varianza de es La varianza de es 22/N/N
Teorema del Límite Central: Teorema del Límite Central:
Afirma que la media muestral tiene una distribución Normal Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30)muestra sea muy grande (de manera práctica N>30)
XX
XX
XX
XX
XX
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)
UMSNH - FIEUMSNH - FIE
De acuerdo a lo anterior, podemos suponer que la variable De acuerdo a lo anterior, podemos suponer que la variable
Tiene una distribución Tiene una distribución N(0,1)N(0,1)
de la figura: P{-zde la figura: P{-z/2 /2 Z Z z z/2/2 }=1- }=1-..
Con lo cual el intervalo de confianza del 100(1-Con lo cual el intervalo de confianza del 100(1-)% para la media )% para la media eses
N/
μX___
Z σ
-z-z/2 /2 zz/2/2 Z Z
/2 /2 /2/2
Nσ/zμNσ/z α/2
__
α/2
__
xx
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)
UMSNH - FIEUMSNH - FIE
EjemploEjemplo: Los siguientes son datos de conductividad térmica de cierto tipo de : Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F):hierro (en BTU/hr-ft-°F):
41.60 41.48 42.34 41.95 41.8641.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.0442.18 41.72 42.26 41.81 42.04
Una estimación puntual para la media, es Una estimación puntual para la media, es = 41.924. = 41.924. Hallar un intervalo de Hallar un intervalo de confianza del 95 % y uno del 99% para la media.confianza del 95 % y uno del 99% para la media.
Se supone que la población tiene una distribución Normal con Se supone que la población tiene una distribución Normal con =0.3=0.3
Usamos la expresión para encontrar el Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Matlab para calcular intervalo de confianza para la media: Usando Matlab para calcular zz/2/2 = = norminv(0.025,0,1)norminv(0.025,0,1)
l = 41.924 - 1.96(0.3)/l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.11010 = 42.110
Entonces el Entonces el intervalo de confianza del 95%intervalo de confianza del 95% es es
41.738 41.738 42.11 42.11
Y la Y la longitudlongitud de este intervalo es 3.92 de este intervalo es 3.92/ / NN
Nσ/zμNσ/z α/2
__
α/2
__
xx
XX
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Varianza conocida)Intervalo para la Media (Varianza conocida)
UMSNH - FIEUMSNH - FIE
Selección del tamaño de la muestra:Selección del tamaño de la muestra:La La precisiónprecisión del intervalo de confianza es del intervalo de confianza es zz/2/2//NN esto significa esto significa que al usar para estimar que al usar para estimar , el , el errorerror de estimación, dado por de estimación, dado porE=| - E=| - || es menor o igual que es menor o igual que zz/2/2//NN, con una confianza de , con una confianza de 100(1-100(1-)%.)%.
El problema inverso consiste en calcular El problema inverso consiste en calcular NN para obtener un error para obtener un error EE con una confianza del 100(1- con una confianza del 100(1-)% previamente especificado:)% previamente especificado:
NN1/21/2= z= z/2/2/E/E
XXXX
EjercicioEjercicio: Calcular el tamaño adecuado de la muestra para lograr : Calcular el tamaño adecuado de la muestra para lograr que el error de estimación de conductividad del hierro sea menor que el error de estimación de conductividad del hierro sea menor de 0.05 Btu/hr-ft-°F con una confianza del 95%de 0.05 Btu/hr-ft-°F con una confianza del 95%
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))
UMSNH - FIEUMSNH - FIE
Si no se conoce la varianza Si no se conoce la varianza 22 de la población, de la población, una posibilidad es una posibilidad es utilizar la varianza muestral Sutilizar la varianza muestral S22 en las ecuaciones obtenidas para en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocidaestimar intervalos en el caso de varianza conocida
Este procedimiento funciona para muestras grandes (Este procedimiento funciona para muestras grandes (N>30N>30), por ), por ello los intervalos de confianza anteriores se les suele llamarello los intervalos de confianza anteriores se les suele llamarintervalos de confianza para muestras grandes.intervalos de confianza para muestras grandes.
Si las muestras son pequeñas el enfoque anterior no funciona y Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido para lograr un procedimiento válido se supondrá que la población se supondrá que la población tiene una distribución Normaltiene una distribución Normal
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))
UMSNH - FIEUMSNH - FIE
Si la población es Normal, la siguiente estadísticaSi la población es Normal, la siguiente estadística
Tiene una Tiene una distribución tdistribución t con N-1 grados de libertad con N-1 grados de libertad
T=X
S/ N
-t-t/2,N-1 /2,N-1 tt/2,N-1/2,N-1 T T
/2 /2 /2/2
Intervalo para la mediaIntervalo para la media
Intervalo para la Media (Intervalo para la Media (VarianzaVarianza desconocidadesconocida))
UMSNH - FIEUMSNH - FIE
de la figura: de la figura: P{-tP{-t/2,N-1 /2,N-1 T T t t/2,N-1/2,N-1 }=1- }=1-.. Con lo cual el Con lo cual el
intervalo de confianza del 100(1-intervalo de confianza del 100(1-)% para la media es)% para la media es
T=X
S/ N
-t-t/2,N-1 /2,N-1 tt/2,N-1/2,N-1 T T
/2 /2 /2/2
x t /2,N 1s/ N x t /2,N 1s/ N
EjercicioEjercicio: Repetir el ejemplo de la conductividad del hierro : Repetir el ejemplo de la conductividad del hierro suponiendo que no se conoce la varianzasuponiendo que no se conoce la varianza
Intervalo para la VarianzaIntervalo para la Varianza
Intervalo para la Varianza de una distribución Intervalo para la Varianza de una distribución NormalNormal
UMSNH - FIEUMSNH - FIE
Si la Población es Normal, la distribución muestral del estadístico Si la Población es Normal, la distribución muestral del estadístico siguientesiguiente
Donde Donde SS22 es la varianza muestral es la varianza muestral usada como estimador puntual de usada como estimador puntual de 22
Es de tipo Es de tipo Ji-cuadradaJi-cuadrada con N-1 grados de libertad con N-1 grados de libertad
X N 1S2
2
00 22/2,N-1/2,N-1 22
/2,N-1/2,N-1 XX
/2 /2 /2/2
Intervalo para la VarianzaIntervalo para la Varianza
Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal
UMSNH - FIEUMSNH - FIE
De acuerdo a la figura, De acuerdo a la figura, P(P(221-1-/2,N-1/2,N-1 X X 22
/2,N-1/2,N-1) = 1-) = 1-
Por lo tanto, el intervalo de confianza del 100(1-Por lo tanto, el intervalo de confianza del 100(1-)% buscado )% buscado para la varianza espara la varianza es
X N 1S2
2
00 22/2,N-1/2,N-1 22
/2,N-1/2,N-1 XX
/2 /2 /2/2
N 1s2
1 /2,N 12 2
N 1s2
/2,N 12
EjercicioEjercicio: Hallar el intervalo de confianza del 95% para la : Hallar el intervalo de confianza del 95% para la varianza en el ejemplo de la conductividad del hierrovarianza en el ejemplo de la conductividad del hierro
Intervalo para la VarianzaIntervalo para la Varianza
Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal
UMSNH - FIEUMSNH - FIE
Intervalos de confianza unilateralesIntervalos de confianza unilaterales.- En el caso de la varianza es .- En el caso de la varianza es más común buscar cotas inferiores o superiores que ambas a la vezmás común buscar cotas inferiores o superiores que ambas a la vez
N 1s2
1 ,N 12 2
Intervalo de confianza inferiorIntervalo de confianza inferior.- Se obtiene reemplazando el .- Se obtiene reemplazando el límite superior por límite superior por y y 22
/2,N-1 por /2,N-1 por 22,N-1,N-1, obteniendo:, obteniendo:
Intervalo de confianza superiorIntervalo de confianza superior.- En forma similar, se reemplaza .- En forma similar, se reemplaza el límite inferior por el límite inferior por 00 y y 22
/2,N-1 por /2,N-1 por 22,N-1,N-1, obteniendo:, obteniendo:
2 N 1s2
,N 12
Intervalo para la VarianzaIntervalo para la Varianza
Intervalo para la Varianza de una distribución NormalIntervalo para la Varianza de una distribución Normal
UMSNH - FIEUMSNH - FIE
Ejercicio: Ejercicio: Un fabricante de detergente líquido está interesado Un fabricante de detergente líquido está interesado en la efectividad de su proceso para llenar envases de en la efectividad de su proceso para llenar envases de detergente. La norma dice que no se debe tener una desviación detergente. La norma dice que no se debe tener una desviación estándar estándar en el proceso mayor de 0.15, ya que de lo contrario en el proceso mayor de 0.15, ya que de lo contrario habrá envases más vacíos de lo permitido.habrá envases más vacíos de lo permitido.
Se toma una muestra aleatoria de 20 envases y se obtiene una Se toma una muestra aleatoria de 20 envases y se obtiene una varianza muestral varianza muestral ss22=0.0153 onzas=0.0153 onzas22. ¿Es esta medición una . ¿Es esta medición una evidencia de que se está cumpliendo la norma con una evidencia de que se está cumpliendo la norma con una confianza del 95% ?confianza del 95% ?
SugerenciaSugerencia: se puede usar la función : se puede usar la función chi2invchi2inv de Matlab de Matlab
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción
UMSNH - FIEUMSNH - FIE
Se toma una muestra de tamaño N de una población muy grande y Se toma una muestra de tamaño N de una población muy grande y resulta que X datos de la muestra pertenecen a alguna clase de resulta que X datos de la muestra pertenecen a alguna clase de interés. Entonces interés. Entonces un estimador puntual de la proporción un estimador puntual de la proporción pp de los de los datos de la población que pertenecen a la clasedatos de la población que pertenecen a la clase en cuestión es: en cuestión es:
Nótese que N y p son los parámetros de una Nótese que N y p son los parámetros de una distribución binomialdistribución binomial
La distribución de muestreo de se puede considerar La distribución de muestreo de se puede considerar aproximadamente aproximadamente Normal con media p y varianza p(1-p)/NNormal con media p y varianza p(1-p)/N, , siempre que p no esté muy cerca de 0 o de 1 y si N es siempre que p no esté muy cerca de 0 o de 1 y si N es relativamente granderelativamente grande
PP
P=X/NP=X/N^
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción
UMSNH - FIEUMSNH - FIE
De lo anterior, la distribución de la variableDe lo anterior, la distribución de la variable
Es aproximadamente N(0,1)Es aproximadamente N(0,1)
Entonces, partiendo de Entonces, partiendo de P{-zP{-z/2 /2 Z Z z z/2/2 }=1- }=1-
Obtenemos el siguiente intervalo de confianza aproximado del Obtenemos el siguiente intervalo de confianza aproximado del 100(1-100(1-)% para la proporción p de la población que pertenece a la )% para la proporción p de la población que pertenece a la clase dada:clase dada:
Z P pp1 p
N
p z /2p1 p
N p p z /2p1 p
N
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para una ProporciónIntervalo de confianza para una Proporción
UMSNH - FIEUMSNH - FIE
EjemploEjemplo: De 1000 casos de cáncer pulmonar seleccionados al : De 1000 casos de cáncer pulmonar seleccionados al azar, 823 son de pacientes que fallecieron. Construya un intervalo azar, 823 son de pacientes que fallecieron. Construya un intervalo de confianza del 95% para la tasa de mortalidad del cáncer de confianza del 95% para la tasa de mortalidad del cáncer pulmonarpulmonar
SoluciónSolución: La tasa de mortalidad es la proporción de los que : La tasa de mortalidad es la proporción de los que mueren a los que contraen el cáncer pulmonar, de la muestra mueren a los que contraen el cáncer pulmonar, de la muestra tenemos que tenemos que = 0.823= 0.823. Por otro lado . Por otro lado zz0.0250.025=1.96=1.96, entonces:, entonces:
Es decir, Es decir, 0.7990.799 pp0.8470.847
0.823 1.960.8231 0.823
1000 p 0.823 1.960.8231 0.823
1000
pp
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales
UMSNH - FIEUMSNH - FIE
SituaciónSituación: Se tienen dos poblaciones normales e independientes : Se tienen dos poblaciones normales e independientes con varianzas desconocidas con varianzas desconocidas 11
22, , 2222 respectivamente. Se tienen respectivamente. Se tienen
disponibles dos muestras aleatorias de tamaños Ndisponibles dos muestras aleatorias de tamaños N11, N, N22 una de cada una de cada
población respectivamente. Sean Spoblación respectivamente. Sean S112 2 SS22
22 las varianzas muestrales las varianzas muestrales
respectivas. Se busca un intervalo de confianza del 100(1-respectivas. Se busca un intervalo de confianza del 100(1-)% del )% del cociente de varianzas cociente de varianzas 11
22/ / 2222
Para hallar el intervalo de confianza se debe recordar que la Para hallar el intervalo de confianza se debe recordar que la distribución de muestreo del estadístico siguientedistribución de muestreo del estadístico siguiente
Es de Es de tipo Ftipo F con N con N22-1 y N-1 y N11-1 grados de libertad en el numerador y -1 grados de libertad en el numerador y
denominador respectivamente. denominador respectivamente. (Ver la figura siguiente)(Ver la figura siguiente)
F S2
2/ 22
S12/ 1
2
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales
UMSNH - FIEUMSNH - FIE
Así, de la figura: Así, de la figura: P{fP{f/2,N2-1,N1-1/2,N2-1,N1-1 FF ff/2,N2-1,N1-1/2,N2-1,N1-1}=1-}=1-
Por lo tanto, el intervalo de confianza buscado es:Por lo tanto, el intervalo de confianza buscado es:
F S2
2/ 22
S12/ 1
2
00 ff/2,N2-1,N1-1/2,N2-1,N1-1 ff/2,N2-1,N1-1/2,N2-1,N1-1 FF
/2 /2 /2/2
S12
S22 f /2,N2 1,N1 1
12
22
S12
S22 f1 /2,N2 1,N1 1
f /2,N2 1,N1 1 1f1 /2,N2 1,N1 1
Otros intervalos de ConfianzaOtros intervalos de Confianza
Intervalo de confianza para el Intervalo de confianza para el cociente de varianzascociente de varianzas de dos de dos distribuciones Normalesdistribuciones Normales
UMSNH - FIEUMSNH - FIE
EjemploEjemplo: Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para : Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma rugosidad promedio. El ingeniero del proceso desea rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor seleccionar el proceso con la menor variabilidad variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas del primer proceso, obteniendo una desviación estándar muestral sdel primer proceso, obteniendo una desviación estándar muestral s11= 5.1 micropulgadas, = 5.1 micropulgadas,
luego toma una muestra de 15 piezas del segundo proceso, obteniendo sluego toma una muestra de 15 piezas del segundo proceso, obteniendo s22= 4.7. ¿Puede = 4.7. ¿Puede
elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la rugosidad?rugosidad?
SoluciónSolución: Suponiendo que los dos procesos son Normales e independientes. : Suponiendo que los dos procesos son Normales e independientes. Usando la función Usando la función finvfinv de Matlab, obtenemos de Matlab, obtenemos ff0.950.95=2.7386=2.7386 y y ff0.050.05=0.3898=0.3898, por lo , por lo
tanto,tanto,
Haciendo operaciones:Haciendo operaciones:
Como el intervalo incluye la unidad, Como el intervalo incluye la unidad, nono se puede concluir que los procesos se puede concluir que los procesos tengan variabilidad sgnificativamente diferente con una confianza del 90%tengan variabilidad sgnificativamente diferente con una confianza del 90%
5.12
4.720.3898 12/ 2
2 5.12
4.722.7386
0.46 12/ 2
2 3.23
Otros intervalos de ConfianzaOtros intervalos de Confianza
Resumen de intervalos de confianzaResumen de intervalos de confianza
UMSNH - FIEUMSNH - FIE
Parámetros de interésParámetros de interés SuposicionesSuposiciones
La media La media Dist. Muestral Normal (o N Dist. Muestral Normal (o N grande)grande)
22 conocida conocida
22 desconocida (Dist. Muestral T) desconocida (Dist. Muestral T)
La varianza La varianza 22 Dist. Normal (Dist. Muestral JiDist. Normal (Dist. Muestral Ji22 ) )
Proporción Proporción pp Dist. Muest. Normal (N grande, p alejado de 0 y de 1)Dist. Muest. Normal (N grande, p alejado de 0 y de 1)
Cociente de varianzas Cociente de varianzas
22//22
Dos poblaciones Normales e independientes (Dist. Dos poblaciones Normales e independientes (Dist. Muestral tipo F)Muestral tipo F)
Diferencia de medias Diferencia de medias
Distribuciones Distribuciones normales, normales,
22 y y
2 2 conocidasconocidas
2 2 = =
2 2 desconocidas (Dist muest T)desconocidas (Dist muest T)
2 2
2 2 desconocidas (Dist muest T)desconocidas (Dist muest T)
Diferencia entre dos Diferencia entre dos proporciones proporciones pp11-p-p22
Dist. Muestral Normal (NDist. Muestral Normal (N11 y N y N22 grandes, p grandes, p11 y p y p22
alejados de 0 y de 1)alejados de 0 y de 1)
Otras... (Ver libros de estadística)Otras... (Ver libros de estadística)
Intervalos de ToleranciaIntervalos de Tolerancia
ConceptoConcepto
UMSNH - FIEUMSNH - FIE
En ocasiones no nos interesa estimar algún parámetro, sino En ocasiones no nos interesa estimar algún parámetro, sino establecer establecer un rango en donde se puede esperar que caigan un rango en donde se puede esperar que caigan observaciones (datos) individualesobservaciones (datos) individuales en un proceso. en un proceso.
La respuesta es muy sencilla si se conoce la distribución y los La respuesta es muy sencilla si se conoce la distribución y los parámetros de la población, por ejemplo, si se obtuvo una muestra parámetros de la población, por ejemplo, si se obtuvo una muestra aleatoria de una población Normal con media aleatoria de una población Normal con media y varianza y varianza 22 conocidas, se esperará que el 95% de los datos caerán entre los conocidas, se esperará que el 95% de los datos caerán entre los límiteslímites
1.961.96
A este intervalo se le llama A este intervalo se le llama intervalo de toleranciaintervalo de tolerancia y si y si y y son son conocidos la cobertura del 95% es exactaconocidos la cobertura del 95% es exacta
Intervalos de ToleranciaIntervalos de Tolerancia
ConceptoConcepto
UMSNH - FIEUMSNH - FIE
Si Si y y son desconocidos a veces se puede determinar una son desconocidos a veces se puede determinar una constante constante kk tal que los límites tal que los límites k k constituyan un intervalo de constituyan un intervalo de tolerancia para una distribución normaltolerancia para una distribución normal
En este caso los límites del intervalo son variables aleatorias y la En este caso los límites del intervalo son variables aleatorias y la proporción de datos cubierta por el intervalo no es exacta. proporción de datos cubierta por el intervalo no es exacta.
Entonces se debe introducir un Entonces se debe introducir un intervalo de confianzaintervalo de confianza para la para la proposición de los límites del proposición de los límites del intervalo de toleranciaintervalo de tolerancia..
En la bibliografía se pueden consultar tablas para elegir estos En la bibliografía se pueden consultar tablas para elegir estos límites dada una confianza deseada para el caso Normal.límites dada una confianza deseada para el caso Normal.
xx
Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal
Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media
UMSNH - FIEUMSNH - FIE
En la regresión lineal se supone un modelo de la formaEn la regresión lineal se supone un modelo de la forma
yy = m = mxx + b + b
Para describir la “respuesta” Para describir la “respuesta” yy del proceso bajo la entrada del proceso bajo la entrada xx
Para una muestra de N puntos (valores de x, y) se calculan valores Para una muestra de N puntos (valores de x, y) se calculan valores estimados estimados mm, , bb de de mm, , bb resolviendo las ecuaciones normales, de resolviendo las ecuaciones normales, de manera que se obtiene un modelo estimado y = manera que se obtiene un modelo estimado y = mmx + x + bb
Se puede encontrar un intervalo de confianza para la respuesta Se puede encontrar un intervalo de confianza para la respuesta media media y/xoy/xo dado un valor xdado un valor x0 0 como se explica a continuacióncomo se explica a continuación
Así, para un dato xAsí, para un dato x00, se puede estimar una predicción puntual para , se puede estimar una predicción puntual para
y/xoy/xo (respuesta media) mediante: (respuesta media) mediante: y/xoy/xo = = mmxx00+ + bb
^^^ ^
^ ^ ^
^
Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal
Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media
UMSNH - FIEUMSNH - FIE
Un intervalo de confianza alrededor de la respuesta media Un intervalo de confianza alrededor de la respuesta media y/xoy/xo del del
100(1-100(1-)% para el valor de x=x)% para el valor de x=x00 está dado por: está dado por:
Donde Donde y/xo y/xo se calcula a partir del modelo de regresión estimadose calcula a partir del modelo de regresión estimado
Además, Además, 22= = (y(yi i - (m x- (m xii+b) )+b) )22/(N-2)/(N-2) y y SSxxxx = = (x(xii-x)-x)22 . .
Obsérvese que el ancho de este intervalo de confianza es mínimo Obsérvese que el ancho de este intervalo de confianza es mínimo para para xx00= x= x y crece a medida que y crece a medida que |x|x0 0 - x|- x| aumenta. En la siguiente aumenta. En la siguiente
gráfica se muestra un comportamiento típico de este intervalográfica se muestra un comportamiento típico de este intervalo
^
__
__
Y x0 t /2 2 1
N x0 x2
Sxx Y x0 Y x0 t /2 2 1
N x0 x2
Sxx
__
^^
Intervalos de Confianza y Regresión LinealIntervalos de Confianza y Regresión Lineal
Intervalo de Confianza para la Respuesta MediaIntervalo de Confianza para la Respuesta Media
UMSNH - FIEUMSNH - FIE
Recta de regresiónRecta de regresión
Puntos experimentalesPuntos experimentales
Límites del intervalo de confianza Límites del intervalo de confianza para la respuesta mediapara la respuesta media
Observación: Estos límites de intervalo están basados en los puntos experimentales dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los límites para nuevos datos se les llama límites de predicción y son más amplios que los límites para la respuesta media