estimacion

UNIVERSIDAD NACIONAL EXPERIMENTAL “FRANCISCO DE MIRANDA”

DPTO. DE FÍSICA Y MATEMÁTICA CÁTEDRA: ESTADÍSTICA

TEMA Nº 6. ESTIMACIÓN

PARÁMETRO: Es cualquier característica de una población que sea medible. Un parámetro es una medida que se calcula para describir una característica de una población completa. Se denota “θ ”. ESTADÍSTICO: Es una medida que se calcula para describir una característica a partir de solo

una muestra. Se denota “ ˆ ”.

X2s

ρ̂

μ

2σ

ρ

Parámetros osEstadístic

θ ˆ

PoblaciónMuestra

ESTIMACIÓN: Consiste en la búsqueda de uno o varios parámetros de una población entre la que se ha efectuado un muestreo. Por ejemplo, Un candidato para un puesto público desea estimar la proporción real de votantes que lo apoyan mediante la obtención de las opiniones de una muestra aleatoria de n votantes. La fracción de ellos que lo apoyan puede usarse como una estimación de la Proporción real de la población total de votantes. Este problema pertenece, entonces al área de Estimación. CARACTERÍSTICAS DESEABLES DE UN ESTIMADOR:

Es posible definir muchas estadísticas para estimar un Parámetro desconocido

θ . Por ejemplo, puede elegirse la Mediana muestral para estimar el valor de la

media Poblacional, o también la Media muestral. Entonces, ¿Cómo seleccionar un buen estimador de θ? , ¿Cuáles son los criterios para juzgar cuando un

estimador de θ es “bueno” o “malo”?. Si se piensa en términos de estimadores humanos como se encuentran en las grandes compañías, entonces, quizá un buen estimador es aquella persona cuyas estimaciones siempre se encuentran muy cercanas a la realidad. De aquí surgen dos propiedades deseables de un estimador:

1. La distribución muestral de ˆ debe tener una media igual al parámetro θ estimado

2. La varianza del estimador debe ser la menor posible 1. ESTIMADOR INSESGADO: Un estimador debe estar próximo en algún

sentido al valor verdadero del parámetro desconocido. Se dice que ˆ es un

estimador insesgado de θ si el valor esperado de ˆ es igual a θ . Esto

equivale a afirmar que la media de la distribución de probabilidad de ˆ (o la

media de la distribución de muestreo de ˆ ) es igual a θ .

Si E( ˆ ) = θ , entonces el estimador es insesgado

Si el estimador no es insesgado, entonces: E( ˆ ) - θ= sesgo En ocasiones existen varios estimadores insesgados del parámetro (θ ) de la población.

2. VARIANZA DE UN ESTIMADOR: La varianza de un estimador insesgado

es la cantidad más importante para decidir qué tan bueno es el estimador

para estimar un parámetro θ . Por ejemplo, sean 1ˆ y 2

ˆ dos estimadores

insesgados del mismo parámetro poblacional. Se dice que 1ˆ es un

estimador más eficiente de θ que 2ˆ si Var( 1

ˆ ) Var( 2ˆ ). Es muy común

utilizar el cociente Var( 1ˆ ) / Var( 2

ˆ ) para determinar la eficiencia relativa de

2ˆ con respecto a 1

ˆ .“Si se consideran todos los estimadores

insesgados posibles de θ , aquel con la varianza más pequeña recibe

el nombre de estimador más eficiente de θ .

2ˆ

1ˆ

3ˆ

θ

Para la figura anterior, se observa claramente que solo 1ˆ y 2

ˆ son

insesgados, dado que sus distribuciones se centran en θ . El estimador 1ˆ

tiene varianza más pequeña que 2ˆ , por tanto es más eficiente. En

consecuencia el estimador de θ que se seleccionaría es 1ˆ .

TIPOS DE ESTIMACIÓN:

1. ESTIMACIÓN PUNTUAL: Una estimación puntual de algún parámetro θ de

la población es un valor numérico θ̂ de la estadística ˆ . Los estimadores más frecuentes de los siguientes parámetros son:

Parámetro Estimador más probable μ x , la media muestral

2σ o σ s2 o s, la varianza muestral o desviación estándar muestral

ρ ρ̂ =X/n, la proporción muestral, donde x es el número de objetos

en una muestra aleatoria de tamaño n que pertenece a la clase de interés

21 μμ 21 xx , la diferencia de medias muestrales de dos muestras

aleatoria independientes

21 ρρ 21 ρρ ˆˆ , la diferencia entre las proporciones de dos muestras

aleatorias independientes

2. ESTIMACIÓN POR INTERVALOS: En muchas situaciones, una estimación

puntual no proporciona información suficiente sobre un parámetro θ . Por

ejemplo, si se tiene interés en estimar la resistencia promedio a la tensión de cierto elemento estructural, es probable que un solo número no sea tan significativo como un intervalo, dentro del cual se espera encontrar el valor

de este parámetro. El intervalo estimado recibe el nombre de Intervalo de Confianza.

Una estimación por intervalos de un parámetro desconocido θ es un

intervalo de la forma uθl , donde los puntos extremo l y u dependen del

valor numérico de la estadística ˆ para una muestra en particular y de la

distribución de muestreo de ˆ .

De la distribución de muestreo de ˆ es posible determinar los valores de l y

u tales que la siguiente proposición sea verdadera:

P( uθl ) = 1 - ; 0 < < 1

Por tanto se tiene una probabilidad de 1- de seleccionar una muestra que produzca un intervalo que contiene el valor verdadero de θ . El intervalo

resultante:

uθl

Se conoce como Intervalo de Confianza del 100 (1- ) por ciento. Las cantidades l y u se denominan límites de confianza inferior y superior y

1- es el coeficiente de confianza. De tal forma, cuando =0,05, se tiene un

Intervalo de confianza del 95% y cuando =0,01 se tiene uno del 99%. Entre mayor es el intervalo de confianza se tiene más seguridad de que el mismo contenga el parámetro desconocido. Un intervalo del tipo uθl , recibe el nombre más apropiado de Intervalo

de Confianza Bilateral. También existen intervalos de confianza Unilaterales: lθ y uθ , donde los límites de confianza se eligen de modo que:

P( lθ ) = 1- y P( uθ ) = 1- A continuación se presentan métodos para encontrar Intervalos de Confianza para Medias, Varianzas y Proporciones: INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN

CON VARIANZA CONOCIDA: Si x es la media de una muestra

aleatoria de tamaño n de una población con varianza conocida 2σ , un

intervalo de confianza para μ del 100(1- ) por ciento esta dado por:

n

σZ Xμ

n

σZ - X 2α-12α-1

Donde 2αZ es el punto en la Distribución Normal Estándar que

corresponde al porcentaje /2

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

POBLACIONALES CON VARIANZAS CONOCIDAS: Si 21 xyx son las

medias de dos muestras aleatorias independientes de tamaño n1 y n2

tomadas de poblaciones con varianzas conocidas 2

2

2

1 σyσ

respectivamente, entonces un intervalo de confianza del 100(1- ) por

ciento para 21 μμ esta dado por:

2

2

2

1

2

12α2121

2

2

2

1

2

12α21

n

σ

n

σZx-xμμ

n

σ

n

σZx-x 11


corresponde al porcentaje /2

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN CON VARIANZA DESCONOCIDA: Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n de una población con

varianza desconocida 2σ , un intervalo de confianza para μ del 100(1- )

por ciento esta dado por:

n

St Xμ

n

St - X 1n,2α-11n,2α-1

Donde 2αT es el punto crítico superior que corresponde al % /2 en la

Distribución T con n-1 G.L.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON VARIANZAS DESCONOCIDAS PERO

IGUALES: Si 21 x,x y 2

2

2

1 s,s son las medias y las varianzas de dos

muestras aleatorias independientes de tamaño n1 y n2 tomadas de

poblaciones con varianzas desconocidas pero iguales 2

2

2

1 σσ



21

2nn2,α2121

21

2nn,2α21n

1

n

1Sptx-xμμ

n

1

n

1Sptx-x

2121 11

Donde Sp se denomina Estimador combinado de la desviación estándar común de la población:

2nn

s1ns1nSp

21

2

22

2

11

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES CON VARIANZAS DESCONOCIDAS Y

DIFERENTES: Si 21 x,x y 2

2

2

1 s,s son las medias y las varianzas de dos

muestras aleatorias independientes de tamaño n1 y n2 tomadas de

poblaciones con varianzas desconocidas y diferentes 2

2

2

1 σσ



2

2

2

1

2

1ν2,α2121

2

2

2

1

2

1ν,2α21

n

s

n

stx-xμμ

n

s

n

stx-x 11

Donde “v” son los grados de libertad, y están dados por:

1n

ns

1n

ns

nsnsv

2

2

2

2

2

1

2

1

2

1

2

2

2

21

2

1

INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN: Si s2 es la Varianza de una muestra aleatoria de tamaño

n, tomada de una distribución normal con varianza desconocida 2σ ,

entonces un intervalo de confianza del 100(1- ) por ciento para 2σ esta dado por:

2

1n,2α

22

2

1n,2α1

2

χ

S1)(nσ

χ

S1)(n

Donde 2

2αχ y 2

2α-1χ son valores en la Distribución Chi-Cuadrado de v=n-1

grados de libertad

INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS

VARIANZAS POBLACIONALES: Si 2

2

2

1 sys son las Varianzas de dos

muestras aleatorias e independientes de tamaño n1 y n2 respectivamente, tomadas de poblaciones normales, entonces un

intervalo de confianza del 100(1- ) por ciento para 2

2

2

1 σσ esta dado por:

1n1,n,2α1

2

2

2

1

2

2

2

1

1n1,n,2α

2

2

2

1

1221f

1

s

s

σ

σ

f

1

s

s

Donde:

1n1,n,2α1

1n1,n,2α

12

21 ff

1

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA

POBLACIÓN: Si ρ̂ es la proporción de éxitos en una muestra aleatoria

de tamaño n que pertenece a una clase de interés, entonces un intervalo

de confianza del 100(1- ) por ciento para la proporción ρ de la

población esta dado por:

n

)p(1pZpp

n

)p(1pZp 2α12α1

ˆˆˆ

ˆˆˆ


corresponde al porcentaje /2 INTERVALO DE CONFIANZA PARA DIFERENCIA DE

PROPORCIONES POBLACIONALES: Si 21 ρyρ ˆˆ son las proporciones

de éxitos en dos muestras aleatorias de tamaños n1 y n2 respectivamente, que pertenecen a una clase de interés, entonces un

intervalo de confianza del 100(1- ) por ciento para 21 ρρ esta dado por:

2

22

1

112α-12121

2

22

1

112α-121

n

qρ

n

qρZρρρρ

n

qρ

n

qρZρρ

ˆˆˆˆˆˆ

ˆˆˆˆˆˆ

Donde:

11 ρq ˆ1ˆ y 22 ρq ˆ1ˆ

estimacion

Documents