estimaciÓn.docx

Upload: leydi-estrada-saldarriaga

Post on 10-Jan-2016

3 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDAD NACIONAL DE FRONTERA - SULLANAIngeniera Econmica - III Ciclo

Estadstica I

Estimacin

Jorge Meja Silup

ALUMNA: Leydi Estrada Saldarriaga AO DE LA DIVERSIFICACIN PRODUCTIVA Y DEL FORTALECIMIENTO DE LA EDUCACIN

NDICE

ESTIMACIN

Eninferencia estadsticase llamaestimacinal conjunto de tcnicas que permiten dar un valor aproximado de unparmetrode una poblacin a partir de los datos proporcionados por unamuestra. Por ejemplo, una estimacin de lamediade una determinada caracterstica de unapoblacinde tamao N podra ser la media de esa misma caracterstica para unamuestrade tamao n.La estimacin estadstica se divide en dos grandes grupos: la estimacin puntual y la estimacin por intervalos.

I. ESTIMACIN PUNTUAL

Consiste en obtener un nico nmero calculado a partir de las observaciones muestrales, y que es utilizado como estimacin del valor del parmetro . Se le llama estimacin puntual porque a ese nmero, que se utiliza como estimacin del parmetro , se le puede asignar un punto sobre la recta real. En la estimacin por intervalos se obtienen dos puntos (un extremo inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendr con cierta seguridad el valor del parmetro .El estimador del parmetro poblacional es una funcin de las variables aleatorias u observaciones muestrales y se representa por

=g ()

Para una realizacin particular de la muestra () se obtiene un valor especfico del estimador que recibe el nombre de estimacin del parmetro poblacional y lo notaremos por

= g ()

Vemos pues que existe diferencia entre estimador y estimacin. El estimador es un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta () ser la estimacin puntual. El estimador tendr su distribucin muestral.

En la tabla expresamos diferentes parmetros poblacionales, sus estimadores y sus estimaciones.

ParmetropoblacionalEstimadorEstimacin

Media

Varianza

Proporcin

Para la eleccin de estos estimadores puntuales nos hemos basado, principalmente en la intuicin y en la posible analoga de los parmetros poblacionales con sus correspondientes valores muestrales, pero ste no ser el mtodo ms adecuado para la obtencin de estimadores puntuales, aunque en este caso se obtienen estimadores satisfactorios para los parmetros poblacionales. En general, el problema de obtener estimadores puntuales no ser tan sencillo, por ello tenemos que dar propiedades que seran deseables que se cumplieran por los diferentes estimadores puntuales obtenidos, aunque no existe un mecanismo o mtodo nico que nos permita obtener el mejor estimador puntual en todas las circunstancias.Nuestro objetivo ahora ser dar algunas propiedades deseables de los estimadores puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas ms propiedades verifiquen los estimadores puntuales mejores sern.

1. PROPIEDADES DE LOS ESTIMADOS

1.1. InsegadezSe dice que un estimador T(X1,. . ., Xn) de es insesgado (o centrado) si: E [T(X1,. . ., Xn)] =

Es decir, si tomamos repetidas muestras, EN MEDIA, el valor del estadstico estar cerca del verdadero valor del parmetro.Y por lo tanto, su sesgo es:

E [ ]- = Var [ ]

Para elegir entre diferentes estimadores para estimar un mismo parmetro nos basaremos en una medida, el ERROR CUADRTICO MEDIO (ECM):

ECM [] = Var [] +

*El criterio: elegir el estimador que tenga el menor ECM.

*Donde T(X1,. . ., Xn) es

En la tabla expresamos diferentes parmetros poblacionales, sus estimadores y si es insesgado o no

ParmetropoblacionalEstimadorEs insesgado?

Media

Si

Varianza

Si

Desviacintpica = No

Proporcin

Si

1.2. Estimador asintticamente insesgadoSignifica que al aumentar el tamao de la muestra, su media tiende a coincidir con el parmetro , y por lo tanto, su sesgo tiende a cero.Se dice que un estimador T(X1,. . ., Xn) de es asintticamente insesgado si:

=

Esta propiedad es interesante si tenemos una muestra de tamao grande.

1.3. Eficiencia

Sean T1(X1,. . ., Xn) y T2(X1,. . ., Xn) dos estimadores insesgado de . Se dice que T1 es ms eficiente que T2 si se verifica que:

Var [T1(X1,. . ., Xn)] < Var [T2(X1,. . ., Xn)]

Es decir, un estimador ms eficiente que otro tiene menor dispersinSean T1(X1,. . ., Xn) y T2(X1,. . ., Xn) dos estimadores insesgado de . Se define la eficiencia relativa de T1 respecto a T2 como:

E.R. [T1, T2] =

Algunos autores la definen al revs, es decir:

E.R. [T1, T2] =

Da igual que definicin se use, lo importante es interpretar correctamente el resultado

1.4. Suficiencia

Un estimador es suficiente cuando no depende del parmetro a estimar .En trminos ms simples, cuando se aprovecha toda la informacin muestral.

1.5. Consistencia

Se dice que un estimador T(X1,. . ., Xn) de es consistente si, adems de carecer de sesgo, se aproxima cada vez ms al valor del parmetro a medida que aumenta el tamao de muestra. Si el tamao n se hace indefinidamente grande, los valores de T(X1,. . ., Xn) se concentran cada vez ms en torno al valor del parmetro, hasta que con un tamao muestral infinito obtenemos una varianza del estimador nula. Por lo tanto, un estimador es consistente si cuando n tiende a infinito se cumple

] = 0

2. MTODOS DE ESTIMACIN

2.1. Mtodo de los momentos

La idea bsica consiste en igualar ciertas caractersticas muestrales con las correspondientes caractersticas poblacionales. Recordemos la siguiente definicin:Sea X una v.a. con funcin de probabilidad puntual (x) en el caso discreto o funcin de densidad (x) en el caso continuo. Se denomina momento de orden k (k N) o momento poblacional de orden k a E (), es decirEen caso continuo M. poblacionales

E () = Een caso discreto M. muestrales

Si esas esperanzas existen. Como ya hemos visto cuando estudiamos funcin generadora de momentos de una variable aleatoria, los momentos estn relacionados con los parmetros de la distribucin asociada. Dada una muestra aleatoria, el momento muestral de orden k es:

2.2. Funcin generatriz

Si X es una variable aleatoria, el momento de orden k de X se define como

Siempre que la esperanza exista. Notemos que: E(X) = 1er momento: posicin E () = + 2do momento: dispersin E () 3er momento: relacionado con una medida de asimetra E () 4to momento: relacionado con la kurtosis

La funcin generadora de momentos de una v.a. X es una funcin a valores reales definida como:

= E ( =

Siempre que el valor esperado exista para todo t (h, h), h > 0. Esta ltima es una condicin tcnica necesaria para que sea diferenciable en 0. Se denomina funcin generadora de momentos porque los momentos de X (E ( pueden ser obtenidos derivando esta funcin y evaluando la derivada en t = 0, tal como lo establece el siguiente teorema. Teorema: Sea X una v.a. para la cual existe la funcin generadora de momentos , entonces:

E (=

2.3. Estimacin de mxima verosimilitud

El mtodo de mxima verosimilitud es una tcnica para estimar los valores de dada una muestra finita de datos. Supongamos n medidas de . Puesto que las medidas son independientes, la probabilidad de que est en , en es: *probabilidad de que est en para todo

i =

Si la funcin de probabilidad y el (los) parmetro(s) describen realmente los datos, esperamos alta probabilidad para los datos que hemos medido. Anlogamente un parmetro cuyo valor se desve mucho del autntico resultar en baja probabilidad para las medidas observadas.

Funcin de verosimilitud L () =

Ser mxima para la funcin de probabilidad y parmetros correctos. En estadstica clsica L () no es la funcin de probabilidad de sino la funcin de probabilidad conjunta de los x.

En estadstica Bayesiana, podemos tratar L ()= L como la funcin de probabilidad de x dado y a usar el teorema de Bayes para calcular la probabilidad posterior p). Para optimizar la funcin debemos: a. Aplicar Ln a esta funcin con objeto de transformar la expresin de productos a sumas o restas.

=

b. Derivar con respecto a los parmetros, igualando la derivada a 0

2.4. Estimacin por mnimos cuadrados

II. ESTIMACIN INTERVLICA.

La estimacin por intervalo consiste en determinar un par de valores a y b, tales que constituidos en el intervalo [a, b]; y para una probabilidad 1- prefijada (nivel de confianza) se verifique en relacin al parmetro a estimar se cumpla:

P ( [a, b]) = 1-

O en otros trminos:P (a b) = 1- Podemos considerar el nivel de confianza (1- ) que hemos prefijado para la expresin anterior como la probabilidad que existe (antes de tomar la nuestra) de que el intervalo a construir a partir de la muestra incluya el verdadero valor del parmetro a estimar. Refleja la confianza en la construccin del intervalo y de que ste tras concretar la muestra contendr el valor a estimar. De ah que en trminos numricos dicho nivel o probabilidad haya de tomar un valor alto (0.9, 0.95, 0.99).Evidentemente el complementario al nivel de confianza; es decir , nivel de significacin supondr las probabilidades de cometer un error de no dar por incluido el verdadero valor del parmetro a estimar en un intervalo en el que realmente si est. De ah y dado que se trata de un error posible a cometer, su cuantificacin en trminos de probabilidad sera muy pequea (0.1, 0.005,0.005,..) En relacin a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza prefijado la amplitud del intervalo de estimacin ser tambin mayor y por lo tanto la estimacin ser menos precisa.Existen para cualquier distribucin una infinidad de intervalos a los cuales les corresponde la misma probabilidad y por tanto habr una infinidad de intervalos, , que verifiquen que: P ( ) = 1- lgicamente nosotros buscamos una estimacin lo ms precisa posible; es decir, de todos los intervalos que verifican la anterior expresin P ( ) = 1- el de menor amplitud. En este sentido, es sencillo ver que si la distribucin es simtrica y unimodal, de todos los intervalos isoprobables, el de menor amplitud (que coincidir con el de mayor densidad media de probabilidad) es el intervalo centrado con la media. De acuerdo con esto, si la distribucin que consideramos es simtrica la determinacin del intervalo de estimacin es relativamente sencilla.

1. ESTIMACIN DE LA DIFERENCIA DE MEDIAS POBLACIONALES

1.1. Asumiendo igualdad de varianzasSis12y s22son las medias y las varianzas de dos muestras aleatorias de tamao n1y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100() por ciento para la diferencia entre medias es:

1.2. Caso general

2. ESTIMACIN DE LA DIFERENCIA DE PROPORCIONESUn estimador puntual de la proporcin P en un experimento binomial est dado por la estadstica P=X/N, donde x representa el nmero de xitos ennpruebas. Por tanto, la proporcin de la muestra p =x/n se utilizar como estimador puntual del parmetro P.Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de 1, se puede establecer un intervalo de confianza para P al considerar la distribucin muestral de proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del parmetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la muestrapsiempre y cuando el tamao de muestra no sea pequeo.

Cuandones pequea y la proporcin desconocida P se considera cercana a 0 a 1, el procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que sea mayor o igual a 5.El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no exceder.

III. EJERCICIOS

Ejercicio 1: Suponga que de una poblacin se saca una muestra de tamao 3: Se conoce E(x) = y VAR (x) = Decida si los estimadores son insesgado y cul de estos estimadores es mejor: 1 = 2 =

RESOLUCIN

1 = E(x) =

E (1) = E

E (1) = E

E (1) =

E (1) =

1 es insesgado

2 = , n=3 E(x) =

E () = E ( )

E () = E ( )

E () =

2 es insesgado

E () =

E () = (+ + )

E () = (3) = E () =

Cul de los dos es ms eficiente?

1 =

VAR (1) = VAR

VAR (1) = VAR

VAR (1) =

VAR (1) =

VAR (1) =

2 = , n=3

VAR () = E ( )

VAR () = E ( )

VAR () =

VAR () =

VAR () =

E () = (+ + )

E () = (3) =

*Como no se cumple la desigualdad decimos que 2 es ms eficiente que 1

VAR (1) VAR (2)

Ejercicio 2: Sea ,

Ff(x) =

0 en otro caso

Sea . Determine si es consistente

= = )

= )

=

E () =

E () =

E () =

E () =

E () =

E () =

E ()=

E ()=

E () =

E () =

E () =

E () =

Reemplazando

=

= = 0

Var () = Var ( )

Var () = Var ()

Var () =

Var () =

Var () =

Var (x) =- =- =

E ( ) = = 2

Var () =

Var () =

Var () =

Var () =

*Como se cumple = y = 0, entonces es eficiente

Ejercicio 3: Un artculo publicado dio a conocer los resultados de un anlisis del peso de calcio en cemento estndar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratacin del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estndar, se encontr que el peso promedio de calcio es de 90 con una desviacin estndar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviacin estndar de 4. Supngase que el porcentaje de peso de calcio est distribuido de manera normal. Encuntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supngase que las dos poblaciones normales tienen la misma desviacin estndar.RESOLUCIN:El estimador combinado de la desviacin estndar es:

Al calcularle raz cuadrada a este valor nos queda que sp= 4.41

Expresin que se reduce a 0.721-26.72

Ejercicio 4: Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los reproductores de discos compactos de la poblacin que no pasan todas las pruebas.RESOLUCIN:n=500p = 15/500 = 0.03Z(0.90) = 1.645

0.0237