estimacion
TRANSCRIPT
UNIVERSIDAD NACIONAL EXPERIMENTAL “FRANCISCO DE MIRANDA”
DPTO. DE FÍSICA Y MATEMÁTICA CÁTEDRA: ESTADÍSTICA
TEMA Nº 6. ESTIMACIÓN
PARÁMETRO: Es cualquier característica de una población que sea medible. Un parámetro es una medida que se calcula para describir una característica de una población completa. Se denota “θ ”. ESTADÍSTICO: Es una medida que se calcula para describir una característica a partir de solo
una muestra. Se denota “ ˆ ”.
X2s
ρ̂
μ
2σ
ρ
Parámetros osEstadístic
θ ˆ
PoblaciónMuestra
ESTIMACIÓN: Consiste en la búsqueda de uno o varios parámetros de una población entre la que se ha efectuado un muestreo. Por ejemplo, Un candidato para un puesto público desea estimar la proporción real de votantes que lo apoyan mediante la obtención de las opiniones de una muestra aleatoria de n votantes. La fracción de ellos que lo apoyan puede usarse como una estimación de la Proporción real de la población total de votantes. Este problema pertenece, entonces al área de Estimación. CARACTERÍSTICAS DESEABLES DE UN ESTIMADOR:
Es posible definir muchas estadísticas para estimar un Parámetro desconocido
θ . Por ejemplo, puede elegirse la Mediana muestral para estimar el valor de la
media Poblacional, o también la Media muestral. Entonces, ¿Cómo seleccionar un buen estimador de θ? , ¿Cuáles son los criterios para juzgar cuando un
estimador de θ es “bueno” o “malo”?. Si se piensa en términos de estimadores humanos como se encuentran en las grandes compañías, entonces, quizá un buen estimador es aquella persona cuyas estimaciones siempre se encuentran muy cercanas a la realidad. De aquí surgen dos propiedades deseables de un estimador:
1. La distribución muestral de ˆ debe tener una media igual al parámetro θ estimado
2. La varianza del estimador debe ser la menor posible 1. ESTIMADOR INSESGADO: Un estimador debe estar próximo en algún
sentido al valor verdadero del parámetro desconocido. Se dice que ˆ es un
estimador insesgado de θ si el valor esperado de ˆ es igual a θ . Esto
equivale a afirmar que la media de la distribución de probabilidad de ˆ (o la
media de la distribución de muestreo de ˆ ) es igual a θ .
Si E( ˆ ) = θ , entonces el estimador es insesgado
Si el estimador no es insesgado, entonces: E( ˆ ) - θ= sesgo En ocasiones existen varios estimadores insesgados del parámetro (θ ) de la población.
2. VARIANZA DE UN ESTIMADOR: La varianza de un estimador insesgado
es la cantidad más importante para decidir qué tan bueno es el estimador
para estimar un parámetro θ . Por ejemplo, sean 1ˆ y 2
ˆ dos estimadores
insesgados del mismo parámetro poblacional. Se dice que 1ˆ es un
estimador más eficiente de θ que 2ˆ si Var( 1
ˆ ) Var( 2ˆ ). Es muy común
utilizar el cociente Var( 1ˆ ) / Var( 2
ˆ ) para determinar la eficiencia relativa de
2ˆ con respecto a 1
ˆ .“Si se consideran todos los estimadores
insesgados posibles de θ , aquel con la varianza más pequeña recibe
el nombre de estimador más eficiente de θ .
2ˆ
1ˆ
3ˆ
θ
Para la figura anterior, se observa claramente que solo 1ˆ y 2
ˆ son
insesgados, dado que sus distribuciones se centran en θ . El estimador 1ˆ
tiene varianza más pequeña que 2ˆ , por tanto es más eficiente. En
consecuencia el estimador de θ que se seleccionaría es 1ˆ .
TIPOS DE ESTIMACIÓN:
1. ESTIMACIÓN PUNTUAL: Una estimación puntual de algún parámetro θ de
la población es un valor numérico θ̂ de la estadística ˆ . Los estimadores más frecuentes de los siguientes parámetros son:
Parámetro Estimador más probable μ x , la media muestral
2σ o σ s2 o s, la varianza muestral o desviación estándar muestral
ρ ρ̂ =X/n, la proporción muestral, donde x es el número de objetos
en una muestra aleatoria de tamaño n que pertenece a la clase de interés
21 μμ 21 xx , la diferencia de medias muestrales de dos muestras
aleatoria independientes
21 ρρ 21 ρρ ˆˆ , la diferencia entre las proporciones de dos muestras
aleatorias independientes
2. ESTIMACIÓN POR INTERVALOS: En muchas situaciones, una estimación
puntual no proporciona información suficiente sobre un parámetro θ . Por
ejemplo, si se tiene interés en estimar la resistencia promedio a la tensión de cierto elemento estructural, es probable que un solo número no sea tan significativo como un intervalo, dentro del cual se espera encontrar el valor
de este parámetro. El intervalo estimado recibe el nombre de Intervalo de Confianza.
Una estimación por intervalos de un parámetro desconocido θ es un
intervalo de la forma uθl , donde los puntos extremo l y u dependen del
valor numérico de la estadística ˆ para una muestra en particular y de la
distribución de muestreo de ˆ .
De la distribución de muestreo de ˆ es posible determinar los valores de l y
u tales que la siguiente proposición sea verdadera:
P( uθl ) = 1 - ; 0 < < 1
Por tanto se tiene una probabilidad de 1- de seleccionar una muestra que produzca un intervalo que contiene el valor verdadero de θ . El intervalo
resultante:
uθl
Se conoce como Intervalo de Confianza del 100 (1- ) por ciento. Las cantidades l y u se denominan límites de confianza inferior y superior y
1- es el coeficiente de confianza. De tal forma, cuando =0,05, se tiene un
Intervalo de confianza del 95% y cuando =0,01 se tiene uno del 99%. Entre mayor es el intervalo de confianza se tiene más seguridad de que el mismo contenga el parámetro desconocido. Un intervalo del tipo uθl , recibe el nombre más apropiado de Intervalo
de Confianza Bilateral. También existen intervalos de confianza Unilaterales: lθ y uθ , donde los límites de confianza se eligen de modo que:
P( lθ ) = 1- y P( uθ ) = 1- A continuación se presentan métodos para encontrar Intervalos de Confianza para Medias, Varianzas y Proporciones: INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN
CON VARIANZA CONOCIDA: Si x es la media de una muestra
aleatoria de tamaño n de una población con varianza conocida 2σ , un
intervalo de confianza para μ del 100(1- ) por ciento esta dado por:
n
σZ Xμ
n
σZ - X 2α-12α-1
Donde 2αZ es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
POBLACIONALES CON VARIANZAS CONOCIDAS: Si 21 xyx son las
medias de dos muestras aleatorias independientes de tamaño n1 y n2
tomadas de poblaciones con varianzas conocidas 2
2
2
1 σyσ
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para 21 μμ esta dado por:
2
2
2
1
2
12α2121
2
2
2
1
2
12α21
n
σ
n
σZx-xμμ
n
σ
n
σZx-x 11
Donde 2αZ es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN CON VARIANZA DESCONOCIDA: Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n de una población con
varianza desconocida 2σ , un intervalo de confianza para μ del 100(1- )
por ciento esta dado por:
n
St Xμ
n
St - X 1n,2α-11n,2α-1
Donde 2αT es el punto crítico superior que corresponde al % /2 en la
Distribución T con n-1 G.L.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON VARIANZAS DESCONOCIDAS PERO
IGUALES: Si 21 x,x y 2
2
2
1 s,s son las medias y las varianzas de dos
muestras aleatorias independientes de tamaño n1 y n2 tomadas de
poblaciones con varianzas desconocidas pero iguales 2
2
2
1 σσ
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para 21 μμ esta dado por:
21
2nn2,α2121
21
2nn,2α21n
1
n
1Sptx-xμμ
n
1
n
1Sptx-x
2121 11
Donde Sp se denomina Estimador combinado de la desviación estándar común de la población:
2nn
s1ns1nSp
21
2
22
2
11
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON VARIANZAS DESCONOCIDAS Y
DIFERENTES: Si 21 x,x y 2
2
2
1 s,s son las medias y las varianzas de dos
muestras aleatorias independientes de tamaño n1 y n2 tomadas de
poblaciones con varianzas desconocidas y diferentes 2
2
2
1 σσ
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para 21 μμ esta dado por:
2
2
2
1
2
1ν2,α2121
2
2
2
1
2
1ν,2α21
n
s
n
stx-xμμ
n
s
n
stx-x 11
Donde “v” son los grados de libertad, y están dados por:
1n
ns
1n
ns
nsnsv
2
2
2
2
2
1
2
1
2
1
2
2
2
21
2
1
INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN: Si s2 es la Varianza de una muestra aleatoria de tamaño
n, tomada de una distribución normal con varianza desconocida 2σ ,
entonces un intervalo de confianza del 100(1- ) por ciento para 2σ esta dado por:
2
1n,2α
22
2
1n,2α1
2
χ
S1)(nσ
χ
S1)(n
Donde 2
2αχ y 2
2α-1χ son valores en la Distribución Chi-Cuadrado de v=n-1
grados de libertad
INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS
VARIANZAS POBLACIONALES: Si 2
2
2
1 sys son las Varianzas de dos
muestras aleatorias e independientes de tamaño n1 y n2 respectivamente, tomadas de poblaciones normales, entonces un
intervalo de confianza del 100(1- ) por ciento para 2
2
2
1 σσ esta dado por:
1n1,n,2α1
2
2
2
1
2
2
2
1
1n1,n,2α
2
2
2
1
1221f
1
s
s
σ
σ
f
1
s
s
Donde:
1n1,n,2α1
1n1,n,2α
12
21 ff
1
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA
POBLACIÓN: Si ρ̂ es la proporción de éxitos en una muestra aleatoria
de tamaño n que pertenece a una clase de interés, entonces un intervalo
de confianza del 100(1- ) por ciento para la proporción ρ de la
población esta dado por:
n
)p(1pZpp
n
)p(1pZp 2α12α1
ˆˆˆ
ˆˆˆ
Donde 2αZ es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2 INTERVALO DE CONFIANZA PARA DIFERENCIA DE
PROPORCIONES POBLACIONALES: Si 21 ρyρ ˆˆ son las proporciones
de éxitos en dos muestras aleatorias de tamaños n1 y n2 respectivamente, que pertenecen a una clase de interés, entonces un
intervalo de confianza del 100(1- ) por ciento para 21 ρρ esta dado por:
2
22
1
112α-12121
2
22
1
112α-121
n
qρ
n
qρZρρρρ
n
qρ
n
qρZρρ
ˆˆˆˆˆˆ
ˆˆˆˆˆˆ
Donde:
11 ρq ˆ1ˆ y 22 ρq ˆ1ˆ