estimacion por intervalos métodos cuantitativos métodos cuantitativos 2014 - ing. gonzalo flores...
TRANSCRIPT
ESTIMACION POR INTERVALOS
Métodos cuantitativos
Métodos Cuantitativos 2014 - Ing. Gonzalo Flores Muñoz
La tarea fundamental de la estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:
• Elección de la muestra (muestreo)• Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).
Las ventajas de estudiar una población a partir de sus muestras son principalmente:
Costo reducido: Los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas previas a una elección, es más barato preguntar a 4,000 personas su intención de voto, que a 6,000,000
Mayor rapidez: Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más posibilidades: Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de ampolletas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.
Se denomina estimador de un parámetro ,a cualquier v.a. que se exprese en función de la muestra aleatoria y que tenga por objetivo aproximar el valor de ,
Las características que son deseables para esta nueva v.a. (que usaremos para estimar el parámetro desconocido) son: Eficiencia Insesgamiento Consistencia Suficiencia
Estimación de Parámetros
Parámetros poblacionales y Estadísticos Muestrales
Datos(Población de Interés)
Muestras
Parámetros:
Media ()
Varianza(2)
Desv. Est. ()
Etc.
Estadísticos:
Promedio ( )
Varianza muestral(S2)
Desv. Est. muestral(S)
Etc.
Inferencias
Muestreo
X
Estimación de Parámetros
Ejemplo: Estimación de la media de una población
Estimador: La media muestral ( ) que se calcula a partir de una muestra de N datos como sigue:
X
)x...x(xN1
N21
____
X
Parámetro que se pretende estimar : La media de la población ( µ ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:
El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, el estimador es una variable aleatoria
Es natural preguntarse : ¿Cuál será la distribución de probabilidad del estimador? De hecho ¿cuáles serán sus parámetros? ¿tendrán que ver con los de la población?
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Estimador: La media muestral ( )X )x...x(xN1
N21
____
X
Población de interés : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasiones
Parámetro de interés : La media (µ) de la población
Experimento aleatorio : Lanzar un dado
Variable aleatoria X= número obtenido en la cara superior
Espacio muestral = {1, 2 , 3, 4, 5 , 6}
Distribución de la variable aleatoria X: Uniforme
Media teórica: µ=3.5
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Distribución de la variable aleatoria (X) del experimento
Función de Probabilidad: f(x) = P(X=x)
x 1 2 3 4 5 6
f(x) 1/6 1/6 1/6 1/6 1/6 1/6
11 22 33 44 55 6600
0.050.05
0.10.1
0.150.15
0.20.2
xx
f(x)
f(x)
Función de ProbabilidadFunción de Probabilidad
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Distribución del estadístico .
Muestra x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1 1 3 5 1 1 2 2 4 2 2 2.1
2 1 5 3 6 3 3 6 4 2 5 3.8
3 6 1 5 3 5 4 5 3 2 2 3.2
4 2 5 2 4 1 5 3 6 6 4 3.8
5 3 6 5 4 5 4 3 2 3 4 3.7
... ...
X
X
X
Cada muestra puede considerarse como:
10 valores de la variable aleatoria X,
1 sólo valor para 10 variables aleatorias X1,X2,...,X10
Diferentes cálculos de para N=10:
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Distribución del estadístico . X
XSi obtenemos 1000 muestras, obtendremos 1000 valores de , para estos 1000 valores realizamos el histograma:
1 2 3 4 5 60
0.05
0.1
0.15
0.2
0.25
X
frec
uenc
ia r
elat
iva
Distribución de la media muestral
Estimación de Intervalos
l, u dependen de la muestra, por lo tanto son valores de variables aleatorias L, U
Existen multitud de circunstancias en las que el interés de un estudio no es obtener una estimación puntual para un parámetro, sino, determinar un posible “rango” de valores en el que pueda precisarse, con una determinada probabilidad, que el verdadero valor del parámetro se encuentra dentro de esos límites, es decir, l θ u, donde los valores extremos l, u dependen del valor numérico del estimador, para una muestra en particular y de su distribución de muestreo.
Uno de los instrumentos más comunes, son los intervalos de confianza para estimar el valor de un parámetro de la población.
Un intervalo de confianza del C% para un parámetro , es un intervalo de valores calculado a partir de los datos de la muestra utilizando un método que tiene un probabilidad C% que dicho intervalo contenga el verdadero valor del parámetro.
Estimación de Intervalos
Ejemplo: Construcción repetida de un intervalo de confianza para la media m:
Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos contendrá a la media
En la práctica se obtiene solamente una muestra y se calcula con ella un intervalo de confianza.
La proposición adecuada es que el intervalo contiene a θ “con una confianza” del 95%
Estimación de Intervalos
Intervalo para la Media (Varianza conocida)
Situación: Se tiene una población con media desconocida , pero se supone conocida la varianza 2.
Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra se calcula el estadístico el cual es un estimador puntual insesgado para la media desconocida. Se puede obtener un intervalo de confianza del 100(1-) % para si consideramos los siguientes hechos acerca de la distribución de:
X
X
Intervalo para la Media (Varianza conocida)
1. Si la población es Normal, la distribución de es Normal
2. Si la población no es Normal, el Teorema del límite central nos garantiza una distribución de aproximadamente normal cuando N
3. La media de es (es insesgado)
4. La varianza de es 2/N
Teorema del Límite Central:
Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30)
X
X
X
X
Intervalo para la Media (Varianza conocida)
De acuerdo a lo anterior, podemos suponer que la variable
Tiene una distribución N(0,1)
de la figura: P{-z/2 Z z/2 }=1-.
Con lo cual el intervalo de confianza del 100(1-)% para la media es
N/
μX___
Z σ
-z/2 z/2 Z
/2 /2
Nσ/zμNσ/z α/2
__
α/2
__
xx
Intervalo para la Media (Varianza conocida)
Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F):
41.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.04
Una estimación puntual para la media, es = 41.924. Hallar un intervalo de confianza del 95 % y uno del 99% para la media.
Se supone que la población tiene una distribución Normal con =0.3
Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Statgraphics para calcular z/2 = 1.96
l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.110
Entonces el intervalo de confianza del 95% es
41.738 42.11
Y la longitud de este intervalo es 3.92/ N
Nσ/zμNσ/z α/2
__
α/2
__
xx
X
Intervalo para la Media (Varianza desconocida)
Si no se conoce la varianza 2 de la población, una posibilidad es utilizar la varianza muestral S2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocida
Este procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes.
Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una
distribución Normal