unidad 4b

49
UNIDAD 4 Distribuciones muestrales Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido. Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. 4.1 Función de probabilidad.

Upload: domingo-de-la-cerda

Post on 02-Aug-2015

1.296 views

Category:

Education


0 download

TRANSCRIPT

UNIDAD 4 Distribuciones muestrales

Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribuciónde todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido. Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias.

En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño.

4.1 Función de probabilidad.

Se l lama función de probabi l idad de una var iable aleator ia discreta

X a la apl icación que asocia a cada valor de x i de la var iable su

probabi l idad p i .

0 ≤ p i ≤ 1

p 1 + p 2 + p 3 + · · · + p n = Σ p i = 1

Ejemplo. Calcular la distribución de probabil idad de las puntuaciones obtenidas al lanzar un dado.

x pi

1 1/62 1/63 1/64 1/65 1/66 1/6

1

4.2 Distribución binomial.

Experimentos en los cuales cada prueba tiene dos posibles resultados (éxito y fracaso), cada resultado con probabilidad constante a lo largo del experimento, en el que cada prueba es independiente. Se dice que son experimentos binomiales en los en los que la distribución de probabilidad de la variable al azar asociada es una distribución de Probabilidad Binomial.

Un experimento binomial es el que posee las siguientes propiedades.

1. El experimento consiste en “n” ensayos repetidos.2. Cada ensayo proporciona un resultado que puede clasificarse en éxito o fracaso.3. La probabilidad de éxitos designada por “p” permanece constante de un ensayo a otro.4. Los ensayos son independientes.

Si un ensayo Binomial puede resultar en un éxito con probabilidad “p” y en un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria binomial x, y el número de éxitos en “n” ensayos independientes es:

Donde: x = 0, 1, 2,.....n

n = No. de eventos.

X = Numero de éxitos.

La media y la varianza de la distribución binomial b(x;n.p) son:

Ejemplo.

La probabilidad de que un automóvil que recorre la longitud completa de un camino tenga un accidente es de 0.05. Encontrar la probabilidad de que entre 17 automóviles que recorren este mismo camino tenga accidentes:

a) Exactamente 4.b) Cuando mucho 4.c) Al menos cuatro.

En el caso del inciso “a” que es una respuesta puntual se aplica la formula en forma simple.

Donde: n = 17x = 4p = 0.05q = 1 – p = 1 – 0.05 = 0.95Por lo tanto al sustituir

b) Cuando mucho 4, este puede expresarse también: máximo 4, a lo más 4, esto es de cero a 4, lo cual implica desde cero hasta cuatro.

Por lo que el resultado sería la sumatoria de probabilidades de cero a cuatro.

d) Al menos 4, esto se puede expresar también como; por lo menos 4, mínimo 4, esto es de cuatro en adelante.

Por la ley de los complementos.La P(x ≥ 4) = 1 – P (x < 4) = 1 – P ( x ≤ 3 )

Esto es la probabilidad de 100 % menos la sumatoria de probabilidades de 0 a 3.

4.3 Propiedades de la curva binomial.

La distribución normal proporciona una aproximación para la distribución

binomial cuando n, el numero de intentos, es alto y p, la probabilidad de un

éxito en un intento individual, se arpoxima a ½.

Se considera una práctica acertada el uso de la aproximación normal para

la distribución normal solo cuando np y n(1-p) son mayores que 5;

simbólicamente, cuando

np> 5 y n(1-p) > 5

4.4 Distribución Hipergeometrica.

Aquellos experimentos en los cuales la variable al azar que define los resultados del experimento es discreta y la probabilidad cambia a lo largo del experimento, se dice que sigue una distribución hipergeométrica.

El modelo de probabilidad hipergeométrica se aplica al muestreo sin reemplazo.

Un experimento hipergeométrico es aquel que pose las dos siguientes propiedades.

1. Una muestra aleatoria de tamaño “n” se selecciona sin reemplazo de un total de “N” resultados o artículos totales.

2. k resultados o artículos del total de “N” pueden clasificarse como éxitos y N – k como fracasos.Una variable aleatoria x tiene una distribución hipergeométrica y se conoce como variable aleatoria hipergeométrica, si y solo si su distribución de probabilidad está dada por:

Donde:

N = No. total de la población.n = Tamaño de la muestra.k = No. de elementos que cumplen la característica deseada.x = 0, 1, 2, .... n

Los valores de la media y la varianza se calculan según las ecuaciones:

En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad k de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, .cual es la probabilidad de obtener x objetos defectuosos?

Solución:

Luego;

Donde:p(x,n,N,k) = probabilidad de obtener x objetos defectuosos de entre nseleccionados

muestras de n objetos en donde hay x que son defectuosos y n-x buenos

todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si se seleccionan 4 objetos al azar, .cual es la probabilidad de que 2 sean defectuosos?

Solución:

N = 10 objetos en totalk = 3 objetos defectuososn = 4 objetos seleccionados en muestrax = 2 objetos defectuosos deseados en la muestra

Donde,

Probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes

Formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos

Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes.

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar seria:

Ejemplo 4En una prisión federal para mujeres, 100 de las 250 internas tienen puntos de vistas políticas radicales. Si se elige a 5 de ellas al azar para comparecer ante un comité legislativo; determinar la probabilidad de que solo una de ellas tendrá ideas políticas radicales.

Mediante el uso de:

a) La formula de la distribución hipergeometrica.

Respuesta.

a) En este caso.N = 250 mujeresk = 100 tienen políticas radicalesn = 5 se eligen al azarx = 1 tenga políticas radicales de las 5

Sustituyendo en la formula

Que se lee.

Probabilidad de que una mujer tenga políticas radicales, toma de una

muestra aleatoria de cinco, tomada de una población de 250, de las cuales

100 tienen políticas radicales.

4.5 Distribución de Poisson.

Existen experimentos de los cuales la probabilidad del evento es muy

pequeña, pero el número de pruebas es muy grande en tal forma que al

producto del número de intentos (prueba n) y la probabilidad del evento es

del orden 0.1 a 10 (np). La distribución recibe su nombre en honor de

Simeon Poisson, quien la estudió y dio a conocer en 1837. Con frecuencia

se denomina ley de eventos improbables, Lo cual

significa que la probabilidad p que suceda en un evento específico es

bastante pequeña.

El experimento de Poisson posee las siguientes propiedades:

1. Los eventos ocurren en forma independiente.

2. La probabilidad de que un resultado sencillo ocurra en un intervalo de

tiempo muy corto o en una región pequeña es proporcional a la longitud del

intervalo del tiempo.

3. La probabilidad de que más de un resultado ocurra en ese intervalo de

tiempo tan corto o en ésta región tan pequeña es despreciable.

Si X es el número de ocurrencia de un evento aleatorio en un intervalo de

tiempo o espacio, la probabilidad de que x ocurra, está dada por la función

de probabilidad de Poisson.

Donde: x es el número de ocurrencias.

e = es la constante 2.71828 (base del logaritmo neperiano).

µ= la media aritmética del numero de ocurrencias (éxitos) en un intervalo

de tiempo dado.

µ= λ= np

La distribución tiene muchas aplicaciones. Se utiliza como modelos para

describir fenómenos como la distribución de errores sobre captura de

datos. En número de ralladuras y otra imperfecciones en piezas

recientemente pintadas, el numero de partes defectuosas en embarques de

salidas, el número de clientes en espera de servicio en

un restaurante.

Ejemplo 5.

Al inspeccionar la aplicación de estaño por un proceso electrolítico

continuo, se descubre en promedio 0.2 imperfecciones por minuto. Calcule

las probabilidades de descubrir:

a) Una imperfección en tres minutos.

b) Al menos dos imperfecciones en 5 minutos.

c) A lo sumo una imperfección en 15 minutos.

Respuestas:

a) Si λ = μ = np = 0.2 en este caso nos está dando el promedio por minuto, como el tiempo es 3 minutos.

λ = 0.2 x 3 minutos = 0.6 imperfecciones por tres minutos.X = 1 imperfeccion.

b) Al menos 2 imperfecciones en 5 minutos. Esto puede expresarse

también como: por lo menos 2, cuando menos 2, mínimo 2, esto es de 2 en

adelante hasta infinito.

Por lo tanto la forma de resolverlo es por áreas complementarias. Si la probabilidad total es 1, la probabilidad de que sean mínimo 2 imperfecciones es igual a la unidad menos la probabilidad de que ocurran cero y una imperfección.

En este caso λ = (0.2) (5 minutos) = 1.0

c) A lo sumo una imperfección en 15 minutos, pudiendo expresarse esto como: a lo más 1, cuando mucho 1, máximo 1, este es la acumulable desde cero hasta uno.

Con λ = (0.2) (15 minutos) = 3

4.6 Esperanza matemática.

La esperanza matemática o valor esperado de una

variable aleatoria discreta es la suma del producto de

la probabil idad de cada suceso por el valor de dicho

suceso.

Los nombre de esperanza matemática y valor esperado

t ienen su origen en los juegos de azar y hacen

referencia a la ganancia promedio esperada por un

jugador cuando hace un gran número de apuestas.

Si la esperanza matemática es cero, E(x) = 0, el juego

es equitativo, es decir, no existe ventaja ni para el

jugador ni para la banca.

4.7 Distribución de probabilidad continua.

Una de las principales características de las variables aleatorias continuas

consiste en que, al estudiar su probabilidad, esta no puede estimarse para

valores únicos, sino que se calcula por intervalos. Para estas variables

aleatorias, la probabilidad en un intervalo está representado por el área

bajo la curva, que representa a su función

de densidad entre los límites del intervalo.

La función f(x) es una función de densidad de probabilidad para la variable

aleatoria X, definida sobre el conjunto de los números reales R si satisface

las condiciones siguientes:

4.7.1 Distribución normal.

Gran número de distribuciones tienen la forma de una campana; es decir, alejándonos de la media, a derecha e izquierda, el número de observaciones decrece de forma similar. Esto genera una curva simétrica.

Características: 

a)      Es generada por una variable de tipo continuo, denominada x; -¥< x < ¥

b)      La función que nos define esta distribución es: 

22 22

2

1

/)x(),,x(f -¥< x < ¥

  Al dar a la función los valores de , 2 y valores a x, obtendremos la distribución en cuestión, la que tiene forma de campana, por lo que también se le conoce como campana de Gauss. Hay un número infinito de funciones de densidad Normal, una para cada combinación de y . La media mide la ubicación de la distribución y la desviación estándar mide su dispersión.

c) Es simétrica con respecto a su eje vertical.

d) Es asintótica con respecto a su eje horizontal; esto quiere decir que jamás va a tocar el eje de las equis.

e) El área total bajo la curva es 1.

f) Sí sumamos a ± , se observará que aproximadamente el 68.26% de los datos se encuentran bajo la curva, si sumamos a ± 2, el 95.44% de los datos estará entre esos límites y si sumamos a ±3, entonces el 99.74% de los datos caerá dentro de esos límites. Esta característica es a la vez una forma empírica y rápida de demostrar si los datos que se analizan tienen una distribución Normal; ya que para trabajar los datos con esta distribución, debe verificarse que efectivamente así se distribuyen, ya que de no

hacerlo, las decisiones que en un momento dado se tomarán de un análisis de los datos con la distribución Normal, serían erróneas.

4.7.2 Ecuación de la normal.

La función f(x, , 2), se integra entre los límites de la variable x; esto es, 

<b

a

dx),,x(f)bxa(p 2

 La integral anterior nos daría el área bajo la curva de la función, desde a hasta b, que corresponde o es igual a la probabilidad buscada.

Debido a la dificultad que se presenta para integrar esta función cada vez que sea necesario, lo que se hace es tipificar el valor de la variable x, esto es, x se transforma en un valor de z, de la siguiente manera:  

valorx

z

4.7.3 Graficas.

Suelen utilizarse dos tipos de tablas :

a) Proporcionan el área a la izquierda de un valor. b) Ofrecen el área comprendida entre la media (0) y un valor.

En los dos casos, la tabla fija en la primera columna el valor de z con una cifra decimal y, la segunda cifra decimal de z condiciona la columna que ha de seleccionarse. En el cruce encontramos el área buscada.

Ejemplo 1. Una maquina que expende bebidas está regulada de modo que

descargue un promedio de 200 ml por vaso. Si la cantidad de liquido está

distribuida normalmente con una desviación estándar igual a 15 ml.

a) ¿Que porcentaje de vasos contendrá mas de 224 ml?

b) ¿Cual es la probabilidad de que un vaso contenga entre 191 y 209 ml ?

a) Primeramente marcamos en una grafica la referencia del área bajo la curva buscada.

Si el área buscada son los vasos que contengan más de 224 ml. Que es a la derecha en la curva.

Existen dos caminos para el cálculo de esta área dado que se busca el

extremo derecho. Primero dado que las tablas de la normal nos da el área

de izquierda a derecha hasta el valor de “z”. Con valor z = 1.6 en la tabla

positiva encontramos el área 0.9452 que corresponde a la parte izquierda

de 224 ml.

Por lo tanto la unidad que representa el área total bajo la curva le restamos el valor encontrado.

P ( x > 224 ) = 1 – 0.9452 = 0.0548 = 5.48 %

Que es el área buscada y se lee 5.48 % de los vasos de 224 ml o mas

2.- El otro camino es por simetría si z = 1.6

en el extremo izquierdo tenemos un área igual dado que la curva normal representa el área en dos partes iguales a la derecha e izquierda de la media.Buscamos en la tabla negativa o que corresponda al lado izquierdo y tenemos el valor de esta área en forma directa z = -1.6, P ( x 224 ) = 0.0548 lease 5.48 % de vasos con 224 ml o más.

b) Encontrar la probabilidad de que un vaso contenga entre 191 y 209 ml. representándolo en la curva norma tenemos.

Lo que debemos encontrar es el área bajo la curva normal entre los puntos 191 y 209, considerando que la tabla nos da el área de izquierda a derecha el camino es calcular el área mayor y restarle el área menor.

Lease que el 45.14 % de los vasos reciben entre 191 y 209 ml.

Ejemplo 2. Una compañía paga a sus empleados un salario promedio de $ 15.00 pesos por hora, con una desviación estándar de $ 2.00 pesos. Si los salarios tienen aproximadamente una distribución normal. ¿Qué porcentaje de los trabajadores recibe un salario entre $12.00 y $18.00 pesos por hora?

Representando en la curva normal esta incógnita tendríamos: El área buscada está entre 12 y 18 pesos por hora por lo cual se calculara el área mayor y se le restara el área menor.

Lease que el 86.64 % de los trabajadores ganan entre 12 y 18 pesos por hora.

4.8 Otras distribuciones muestrales.

4.8.1 Distribución T- student.

Al hacer uso de muestras de tamaño N > 30, llamadas grandes muestras, las distribuciones de muestreo de muchos estadísticos son aproximadamente normales, siendo la aproximación tanto mejor cuanto mayor sea N. Para muestras de tamaño menor que 30, llamadas pequeñas muestras, esa aproximación no es buena y empeora al decrecer N, de modo que son precisas ciertas modificaciones.

El estudio de la distribución de muestreo de estadísticos para pequeñas muestras se llama teoría de pequeñas muestras. Sin embargo, un nombre más apropiado seria teoría exacta del muestreo, pues sus resultados son validos tanto para pequeñas muestras como para grandes.

Definamos el estadistico

Donde:X = Media muestralμ = Media poblacionals = sˆ = desviación típicaque es análogo al estadístico z dado por

Si consideramos muestras de tamaño N tomadas de una población normal (o casi normal) con media μ y si para cada una calculamos t, usando la media muestral X y la desviación muestral s o sˆ , puede obtenerse la distribución de muestreo para t. Esta distribución viene dada por

Donde Y0 es una constante que depende de N tal que el área bajo la curva es 1, y donde la constante v = (N – 1) se llama grados de libertad ( v es la letra griega nu)

GRADOS DE LIBERTAD

Para el cálculo de un estadístico, es necesario emplear tanto las observaciones de muestras como propiedades de ciertos parámetros de la población. Si estos parámetros son desconocidos, hay que estimarlos a partir de la muestra.

El numero de grados de libertad de un estadístico, generalmente denotado por v, se define como el numero de N observaciones independientes en la muestra ( o sea, el tamaño de la muestra) menos el numero k de parámetros de la población, que debe ser estimado a partir de observaciones muestrales. En símbolos, v = N – k.El numero de observaciones independientes en la muestra es N, de donde podemos calcular X y s. Sin embargo, como debemos estimar μ, k = 1 y v = N – 1

Ejemplo

La figura 11.4 recoge el grafico de la distribución de Student con 9 grados de libertad. Hallar el valor de t1 para el que:

a) El área sombreada de la derecha es 0.05.b) El área total sombreada es 0.05.c) El área total sin sombrear es 0.99.d) El área en sombra de la izquierda es 0.01.e) El área de la izquierda de t1 es 0.90.

4.8.2 Distribución Chi-cuadrada

Si se extraen muestras aleatorias de una población normal, la varianza de las muestras, s2 sigue una distribución que es independiente de la media de la población. Para cada tamaño de la muestra la forma de la ley cambia.

El estadístico

en donde

sigue una distribución de probabilidad llamada chi-cuadrada (x2), con n-1 grados de libertad.

La forma de la distribución chi-cuadrada, lo mismo que la distribución t, depende del número de grados de libertad asociados a s2. La tabla anexa tiene tabulada dicha distribución y su manejo es similar al de la distribución t de student.

La columna de la izquierda da los grados de libertad, los encabezados de las columnas dan las áreas a la derecha de los valores de chi-cuadrada que se presentan en el cuerpo de la tabla.

La distribución chi-cuadrada no es simétrica y, por ello, los valores que se encuentran en las tablas tienen que ser consultados al determinar áreas por los lados de la curva. Por ejemplo, con 10 grados de libertad el 99.5% del área se encuentra a la izquierda de x2 = 25.1558 y el 5% a la izquierda del valor x2 = 2.1558. El intervalo 2.1558 a 25.1558 contiene el 99% de los casos en estudio.

Ejemplo:Un fabricante de relojes de cocina anuncia que su producto funciona, en promedio, 5 años, con una desviación muestral de 1.2 años (σ). Se toma una muestra aleatoria de 6 relojes, siendo su vida de 6, 5.5, 4, 5.2, 5 y 4.3 años. Determinar el valor de x2 de tales datos.

Solución:

La media de la muestra es:

y la varianza de la muestra:

luego

que es valor de chi-cuadrada con 5 grados de libertad.

4.8.3 Distribución F.

En 1924, Ronald A. Fisher, presento una distribución que facilita llevar a cabo procedimientos inferenciales útiles usando la razón entre dos varianzas muestrales. Podemos resumir la naturaleza de esta distribución, denominada distribución F, de la siguiente manera:

Dadas s12 y s2

2 , o varianzas calculadas a partir de muestras aleatorias independientes de tamaño n1 y n2 sacadas de poblaciones distribuidas normalmente con varianzas σ1

2 y σ22 respectivamente, la variable aleatoria

sigue la distribución F con n1 – 1 y n2 – 1 grados de libertad.

Para especificar una distribución F se toman dos valores de grados de libertad, uno asociado con el numerador y otro con el denominador.

Supongamos que se sacan muestras aleatorias independientes de tamaño n1 y n2 de una población 1 y de una población 2 respectivamente y supongamos que dichas poblaciones están normalmente distribuidas con varianzas iguales ( esto es, σ1

2 = σ22 ). Podemos entonces volver a escribir

la ecuación de F como:

Ejemplo: Se presume que la variabilidad en el consumo diario de proteínas es la misma para muchachos y muchachas de 15 años (σ1

2 = σ22). Una

muestra aleatoria de 16 muchachas y una muestra aleatoria independiente de 20 muchachos arrojan varianzas (s2) de 608 gramos al cuadrado y de 320 gramos al cuadrado respectivamente. Suponer que los valores de

consumo diario de proteínas en las dos poblaciones esta normalmente distribuidos. Encontrar el valor de F, para estos datos.

En la tabla correspondiente a F0.90 encontramos registrado, en la intersección de 15 grados de libertad en el numerador y 19 en el denominador, un valor de F= 1.86. En la intersección de 15 y 19 bajo F0.95

encontramos F = 2.23.

Así pues, la probabilidad de observar una F 1.90 esta entre el 90% y 95%. (area a la izquierda de F)

y la probabilidad de observar una F 1.90 esta entre el 5% y 10%. (area a la derecha de F).