estimacion por intervalos métodos cuantitativos métodos cuantitativos 2014 - ing. gonzalo flores...

ESTIMACION POR INTERVALOS

Métodos cuantitativos

Métodos Cuantitativos 2014 - Ing. Gonzalo Flores Muñoz

La tarea fundamental de la estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.

De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:

• Elección de la muestra (muestreo)• Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).

Las ventajas de estudiar una población a partir de sus muestras son principalmente:

Costo reducido: Los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas previas a una elección, es más barato preguntar a 4,000 personas su intención de voto, que a 6,000,000

Mayor rapidez: Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

Más posibilidades: Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de ampolletas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.

Se denomina estimador de un parámetro ,a cualquier v.a. que se exprese en función de la muestra aleatoria y que tenga por objetivo aproximar el valor de ,

Las características que son deseables para esta nueva v.a. (que usaremos para estimar el parámetro desconocido) son: Eficiencia Insesgamiento Consistencia Suficiencia

Estimación de Parámetros

Parámetros poblacionales y Estadísticos Muestrales

Datos(Población de Interés)

Muestras

Parámetros:

Media ()

Varianza(2)

Desv. Est. ()

Etc.

Estadísticos:

Promedio ( )

Varianza muestral(S2)

Desv. Est. muestral(S)

Etc.

Inferencias

Muestreo

X


Ejemplo: Estimación de la media de una población

Estimador: La media muestral ( ) que se calcula a partir de una muestra de N datos como sigue:

X

)x...x(xN1

N21

____

X

Parámetro que se pretende estimar : La media de la población ( µ ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:

El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, el estimador es una variable aleatoria

Es natural preguntarse : ¿Cuál será la distribución de probabilidad del estimador? De hecho ¿cuáles serán sus parámetros? ¿tendrán que ver con los de la población?


Ejemplo: Lanzamiento de un dado

Estimador: La media muestral ( )X )x...x(xN1

N21

____

X

Población de interés : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasiones

Parámetro de interés : La media (µ) de la población

Experimento aleatorio : Lanzar un dado

Variable aleatoria X= número obtenido en la cara superior

Espacio muestral = {1, 2 , 3, 4, 5 , 6}

Distribución de la variable aleatoria X: Uniforme

Media teórica: µ=3.5



Distribución de la variable aleatoria (X) del experimento

Función de Probabilidad: f(x) = P(X=x)

x 1 2 3 4 5 6

f(x) 1/6 1/6 1/6 1/6 1/6 1/6

11 22 33 44 55 6600

0.050.05

0.10.1

0.150.15

0.20.2

xx

f(x)

f(x)

Función de ProbabilidadFunción de Probabilidad



Distribución del estadístico .

Muestra x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

1 1 3 5 1 1 2 2 4 2 2 2.1

2 1 5 3 6 3 3 6 4 2 5 3.8

3 6 1 5 3 5 4 5 3 2 2 3.2

4 2 5 2 4 1 5 3 6 6 4 3.8

5 3 6 5 4 5 4 3 2 3 4 3.7

... ...

X

X

X

Cada muestra puede considerarse como:

10 valores de la variable aleatoria X,

1 sólo valor para 10 variables aleatorias X1,X2,...,X10

Diferentes cálculos de para N=10:



Distribución del estadístico . X

XSi obtenemos 1000 muestras, obtendremos 1000 valores de , para estos 1000 valores realizamos el histograma:

1 2 3 4 5 60

0.05

0.1

0.15

0.2

0.25

X

frec

uenc

ia r

elat

iva

Distribución de la media muestral

Estimación de Intervalos

l, u dependen de la muestra, por lo tanto son valores de variables aleatorias L, U

Existen multitud de circunstancias en las que el interés de un estudio no es obtener una estimación puntual para un parámetro, sino, determinar un posible “rango” de valores en el que pueda precisarse, con una determinada probabilidad, que el verdadero valor del parámetro se encuentra dentro de esos límites, es decir, l θ u, donde los valores extremos l, u dependen del valor numérico del estimador, para una muestra en particular y de su distribución de muestreo.

Uno de los instrumentos más comunes, son los intervalos de confianza para estimar el valor de un parámetro de la población.

Un intervalo de confianza del C% para un parámetro , es un intervalo de valores calculado a partir de los datos de la muestra utilizando un método que tiene un probabilidad C% que dicho intervalo contenga el verdadero valor del parámetro.


Ejemplo: Construcción repetida de un intervalo de confianza para la media m:

Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos contendrá a la media

En la práctica se obtiene solamente una muestra y se calcula con ella un intervalo de confianza.

La proposición adecuada es que el intervalo contiene a θ “con una confianza” del 95%


Intervalo para la Media (Varianza conocida)

Situación: Se tiene una población con media desconocida , pero se supone conocida la varianza 2.

Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra se calcula el estadístico el cual es un estimador puntual insesgado para la media desconocida. Se puede obtener un intervalo de confianza del 100(1-) % para si consideramos los siguientes hechos acerca de la distribución de:

X

X


1. Si la población es Normal, la distribución de es Normal

2. Si la población no es Normal, el Teorema del límite central nos garantiza una distribución de aproximadamente normal cuando N

3. La media de es (es insesgado)

4. La varianza de es 2/N

Teorema del Límite Central:

Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30)

X

X

X

X


De acuerdo a lo anterior, podemos suponer que la variable

Tiene una distribución N(0,1)

de la figura: P{-z/2 Z z/2 }=1-.

Con lo cual el intervalo de confianza del 100(1-)% para la media es

N/

μX___

Z σ

-z/2 z/2 Z

/2 /2

Nσ/zμNσ/z α/2

__

α/2

__

xx


Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F):

41.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.04

Una estimación puntual para la media, es = 41.924. Hallar un intervalo de confianza del 95 % y uno del 99% para la media.

Se supone que la población tiene una distribución Normal con =0.3

Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Statgraphics para calcular z/2 = 1.96

l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.110

Entonces el intervalo de confianza del 95% es

41.738 42.11

Y la longitud de este intervalo es 3.92/ N

Nσ/zμNσ/z α/2

__

α/2

__

xx

X

Intervalo para la Media (Varianza desconocida)

Si no se conoce la varianza 2 de la población, una posibilidad es utilizar la varianza muestral S2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes.

Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una

distribución Normal

estimacion por intervalos métodos cuantitativos métodos cuantitativos 2014 - ing. gonzalo flores...

Documents