métodos y distribuciones de muestreo. en este capítulo comenzamos ei estudio del muestreo. el...

Post on 11-Apr-2015

149 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Métodos y Distribuciones de Muestreo

En este capítulo comenzamos eI estudio del muestreo.

El muestreo es una herramienta estadística utilizada para inferir algo respecto de una población mediante Ia selección de una muestra de esa población.

La estadística inferencial incluye los métodos usados para determinar algo acerca de la población basándose en una muestra

La estadística descriptiva incluye los métodos para organizar, resumir y presentar datos de manera informativa.

Repasemos…

Selección de muestras de la población

En muchos casos, el muestreo es Ia única manera de determinar algo respecto de Ia población.

Algunas razones por las que eI muestreo es necesario son:

El costo de estudiar a todos los integrantes de una población con frecuencia es prohibitivo.

La idoneidad de los resultados de Ia muestra.

Con frecuencia, ponerse en contacto con toda Ia población supondría mucho tiempo.

La naturaleza destructiva de ciertas pruebas.

La imposibilidad física de verificar todos los articulos de Ia población.

Métodos de muestreo probabilístico

En general, existen dos tipos de muestras:

- probabilísticas - no probabilísticas.

En el muestreo probabilístico, cada uno de los artículos de Ia población tiene Ia misma oportunidad de ser elegido para la muestra.

Si se utilizan métodos no probabilisticos, no todos los artículos o personas en Ia población tienen Ia misma posibilidad de ser incluídos en la muestra.

En tal caso, quizá los resultados estén sesgados, Io que significa que es posible que los resultados de Ia muestna no sean representativos de Ia población.

El muestreo por paneles y el muestreo de conveniencia son dos métodos no probabilísticos.

La selección de los miembros se basa en eI criterio de quien dirige Ia investigación, y por Io tanto, tal vez no sea representativa del total de Ia población.

Los procedimientos estadísticos que se usarán en esta unidad se basan en el muestreo probabilístico.

No existe un “mejor” método para seleccionar una muestra probabilística de una población de interés.

Todos los métodos de muestreo probabilístico tienen similar finalidad:

- permitir que el azar determine los artículos o personas que

incluye Ia muestra.

Tipos de muestreo probabilístico

El tipo de muestreo que más se utiliza es el muestreo aleatorio simple.

En el muestreo aleatorio simple se selecciona la muestra de tal forma que cada uno de los elementos o personas en la población tenga las mismas probabilidades de ser incluído.

Ejemplos:

utilizando una tabla de números aleatorios

(apéndice E) página 524

Por sorteo

Extracto de la tabla de números aleatorios

0271194873549217764061545

0818290935786809763600835

Autoevaluación 7-1

(página 224)

El segundo tipo de muestreo es el muestreo aleatorio sistemático.

En el muestreo aleatorio sistemático se acomodan los los elementos o personas de la población utilizando algún patrón o razón.

Se selecciona un punto de partida aleatorio (al azar) y luego se toma cada k-ésimo miembro para formar parte de la muestra.

En ciertas circunstancias una muestra sistemática podría producir resultados sesgados.

El tercer tipo de muestreo es el muestreo aleatorio estratificado.

En el muestreo aleatorio estratificado:

1) se divide la población en subgrupos llamados estratos,

2) y se selecciona una muestra de cada uno de ellos.

Una muestra estratificada garantiza la representación de cada subgrupo.

El cuarto tipo de muestreo es el muestreo por conglomerados.

Muchas veces se le emplea para reducir el costo de realizar un muestreo de una población dispersa en una gran área geográfica.

Se emplea el muestreo por conglomerados subdividiendo el área en unidades pequeñas, ya fueran municipios o regiones. Muchas veces, éstas se conocen como unidades primarias.

Se trata de una combinación del muestreo por conglomerados y el muestreo aleatorio simple.

Autoevaluación 7-2

(página 228)

“Error” en el muestreo

Es posible que existan ciertas diferencias entre las estadísticas de Ia muestra, como Ia media o Ia desviación estándar de Ia muestra, y los parámetros de la población correspondientes.

La diferencia entre un estadístico de Ia muestra y un parámetro de Ia población se conoce como error de muestreo.

Distribución muestral de las mediasde las muestras

Si se organizaran las medias de todas las muestras posibles de un tamaño de muestra dado, en una distribución de probabilidad, se obtendrá una distribución muestral de las medias de las muestras.

Ejemplo:

Tartus Industries tiene siete empleados de producción (tamaño de Ia población).

Los salarios por hora de cada uno de ellos se enlistan a continuación:

Empleado Salario Por hora

Joe 7

Sam 7

Sue 8

Bob 8

Jan 7

Art

Ted 9

8

¿Cuál es la media de la población?

La media de Ia población es:

7 + 7 + 8 + 8 + 7 + 8 + 9 u = ------------------------------------ 7

u = 7.71

¿Cuál es Ia distribución muestral de las medias del muestreo para muestras tamaño 2?

Para construir Ia distribución muestral de las medias de las muestras, se seleccionan todas las muestras de tamaño dos sin reemplazo de Ia población.

Donde: N = 7 es el número de elementos en Ia población y n = 2 es el número de elementos en Ia muestra.

Se encuentran utilizando esta fórmula:

Existen 21 muestras posibles.

y se calculan las medias.

Muestra Empleados Salario por hora Suma Media

1 Joe, Sam $7, $7 $14 $7.00

2 Joe, Sue 7, 8 15 7.50

3 Joe, Bob 7, 8 15 7.50

4 Joe, Jan 7, 7 14 7.00

5 Joe, Art 7, 8 15 7.50

6 Joe, Ted 7, 9 16 8.00

7 Sam, Sue 7, 8 15 7.50

8 Sam, Bob 7, 8 15 7.50

9 Sam, Jan 7, 7 14 7.00

10 Sam, Art 7, 8 15 7.50

11 Sam, Ted 7, 9 16 8.00

¿Cuál es Ia media de Ia distribución muestral?

suma de todas las medias de las muestras

ux = ------------------------------------------------ número de medias de las muestras

162ux = -------- = 7.71 21

Esta distribución de probabilidad es Ia distribución muestral de las medias de muestras.

Mediade muestra

Númerode medias

Probabilidad

7.00 3 .1429

7.50 9 .4285

8.00 6 .2857

8.50 3 .1429

21 1.000

¿Qué se puede decir de Ia población y de Ia distribución muestral?

Pueden hacerse las siguientes observaciones:a) La media de las medias de Ia muestra es igual a Ia media de Ia población 7.71 ux = u

b) La dispersión de Ia distribución de las medias de Ia muestra es menor a Iadispersion en los valores de Ia población.

Las medias de Ia muestra van de7.00 a 8.50, en tanto que los valores de Ia población varían de 7.00 a 9.00.

c) La gráfica de Ia distribución muestral de las medias de muestras y Ia gráfica de Ia distribución de frecuencia de los valores de Ia población es diferente.

La distribución de las medias de Ia muestra tiende a tener una forma de campana y a aproximarse a Ia distribución de probabilidad normal.

En resumen:

se calcularon y presentaron todas las muestras aleatorias posibles de una población

para cada muestra se calculó su media.

se preparó una distribución de las medias de las muestras

Debido a que cada muestra posible tiene Ia misma posibilidad de ser seleccionada, se puede determinar Ia probabilidad asociada.

La distribución muestral de las medias de muestras se utiliza para medir lo probable que podría ser obtener un resultado específico.

Autoevaluación 7-3

(página 233)

Ejercicios 3 y 5

(página 233)

El teorema del límite central

El teorema del límite central afirma que, para grandes muestras aleatorias, Ia distribución muestral de las medias de las muestras está más próxima a una distribución de probabilidad normal.

La aproximación es más precisa para muestras grandes.

Esta es una de las conclusiones más útiles en estadística.

Es posible razonar sobre Ia distribución muestral de las medias de las muestras sin contar con información alguna sobre Ia forma de Ia distribución original de Ia que se toma Ia muestra.

En otras palabras, el teorema del límite central es válido para todas las distribuciones.

Si Ia población tiene una distribución de probabilidad normal, entonces, para cualquier tamaño de muestra Ia distribución del muestreo de Ia media también tendrá una distribución normal.

Si Ia distribuciôn de Ia población es simétrica (pero no normal), se veáa que surge Ia forma normal como lo establece el teorema del lImite central aún con muestras tan pequeñas como de tamaño 10.

Por otra parte, si se toma una distribución que esté sesgada o que tenga extremos muy gruesos, quizá requiera muestras de al menos 30 para observar Ia característica de normalidad.

La mayorIa de los estadísticos consideran que una muestra de 30 es lo bastante grande para poder emplear el teorema del límite central.

Ejemplo:

Ed Spence comenzó su empresa de engranes hace 20 años. Con el paso del tiempo, Ia empresa creció y hoy en día emplea a 40 personas.

Spence Sprockets Inc., enfrenta algunas importantes decisiones respecto a Ia salud de estos empleados. Antes de tomar una decisión final sobre el plan de salud que debería adquirir, Ed decide formar un comité de cinco representantes de los empleados.

Se pedirá al comité que estudie con cuidado Ia cuestión del plan de salud y haga una recomendación sobre el plan que mejor se ajuste a las necesidades de los empleados.

Ed siente que las opiniones de los empleados más jóvenes hacia el cuidado de su salud pueden diferir de las de los empleados de mayor edad.

Si Ed selecciona al azar a su comité,

¿qué puede esperar en cuanto a Ia media de años de servicio en Spence Sprockets para los integrantes del comité?

¿De qué manera Ia forma de Ia distribución de los años de antiguedad de todos los empleados se compara con Ia forma de Ia distribución de muestreo de las medias?

Los años de servicio (redondeados a años completos) de los 40 empleados que hoy en día están en Ia nómina de Spence Sprockets, Inc., son como sigue:

Vamos a considerar el primero de los problemas de Ed Spence. Quiere formar un comité de cinco miembros para analizar Ia cuestión del cuidado de Ia salud y sugerir el tipo de seguro que sería el más apropiado para Ia mayoría de los trabajadores.

¿Cómo debería seleccionar el comité? Si Spence elige al comité al azar, ¿qué podría esperar, en cuanto a los años de antiguedad de los integrantes del comité?

Para comenzar, Ed anota los años de servicio de cada uno de los 40 empleados en un papel y los pone en una vieja gorra de béisbol. revuelve los papeles y toma al azar cinco de ellos. Los años de servicio de estos cinco empleados son: 4, 1, 0, 14 y 9.

Así, la antigüedad media de servicio para estos cinco empleados es 5.60 años.

¿se compara con Ia media de Ia población?

En este momento, Ed no conoce Ia media de Ia población, pero el número de empleados en Ia población es de solo 40, de modo que decide calcular Ia antiguedad media de servicio para todos los empleados.

Es 4.80 años, que se encuentra sumando los años de servicio para todos los empleados y dividiendo el total entre 40. La diferencia entre Ia media de Ia muestra y Ia media de Ia población es el error de muestreo.

En otras palabras, Ia diferencia de 0.80 años entre Ia media de Ia población 4.80 y Ia media de Ia muestra de 5.60, es el error de muestreo.

Esto se debe al azar. AsI, si Ed hubiera seleccionado a estos cinco empleados para crear el comité, Ia antigüedad media del servicio sería un poco mayor a Ia media de Ia población.

¿Qué ocurriría si Ed devolviera los cinco trozos de papel a Ia gorra de béisbol y seleccionara otra muestra? ¿Esperarías que Ia media de esta segunda muestra fuera exactamente Ia misma que Ia anterior?

Supongamos que Ed selecciona otra muestra de cinco empleados y descubre que las antigüedades de servicio en esta muestra son 8, 3, 1, 1 y 14. La media de esta muestra es de 5.40 años.

La ilustración 7-5 muestra el resultado de seleccionar 30 muestras de más de 5 empleados cada una, y calcular las medias de estas muestras.

Estas medias de muestra se organizan entonces en un histograma (diagrama 7-4).

La forma de Ia distribución de 30 medias de muestra es diferente de Ia de Ia población. En el diagrama 7-2, Ia distribución de todos los empleados tiene un sesgo positivo.

Sin embargo, Ia distribución muestral de las medias de muestras, (diagrama 7-4), está más próxima a una distribución normal.

Esto ilustra el teorema del límite central.

Existe menos dispersión en Ia distribución muestral de las medias de muestras que en Ia distribución de Ia población. En Ia población, Ia antigüedad de servido iba de 0 a 19 años. En Ia distribución muestral de las medias de muestras, estas últimas iban de 2.2 a sólo 9.2 años.

También es posible comparar Ia media de las medias de muestras con Ia media de Ia población. La media de las 30 muestras es 4.7133 años, es muy próxima a Ia media de población de 4.80 años.

¿Qué se puede concluir de este ejemplo?

El teorema del Iímite central indica que, independientemente de Ia forma de Ia población, Ia distribución muestral de las medias de muestras se aproximará a Ia distribución normal. Mientras mayores sean las muestras, mayor será Ia convergencia.

Spence Sprockets, Inc. , es una evidencia empírica del funcionamiento del teorema del límite central.

Este ejemplo comienza con una población con sesgo positivo (diagrama 7-2).

Se eligió un pequeño número de muestras y se observó una distribución de medias de muestra.

Se observó un cambio en Ia forma de Ia poblaciôn para Ia distribución de medias de muestra (al comparar diagramas 7-3 y 7-4).

Cuando se aumenta el número de muestras de 10 a 30, se comienza a ver Ia característica de normalidad.

La forma de Ia distribución de 30 medias de muestra que se reportaron en el diagrama 7-4 claramente tiende hacia una distribución normal a medida que aumenta el tamaño de Ia muestra.

El teorema del Ilmite central no dice nada de Ia dispersión de Ia distribución de medias de muestras o respecto de una comparación de Ia media de las medias de muestras, con Ia media de Ia población.

Sin embargo, en el ejemplo se observó que hay menos dispersion en la distribución de medias de muestra que en Ia población al comparar el rango de Ia población y el de las medias de las muestras.

A medida que aumenta el tamaño de Ia muestra disminuye Ia dispersión de las medias de las muestras.

La media de Ia población es exactamente igual a Ia media de todas las medias de las muestras.

Estimadores puntuales

En Ia mayoría de los casos es necesario, por su tamaño, estimar Ia media de Ia población. Por lo general no se conoce este parámetro de Ia población.

Se llama estimador puntual al número único que se usa para estimar un parámetro de Ia población.

El estimador puntual es un valor que se calcula a partir de la información de la muestra, y que se usa para estimar el parámetro de Ia población.

Sin embargo, un estimador puntual sólo se refiere una parte de Ia historia.

Si bien se espera que el estimador puntual esté próximo al parámetro de Ia población, es importante expresar qué tan cerca está.

Un intervalo de confianza sirve a este propósito.

Intervalos de confianza

Un intervalo de confianza es un rango de valores que se construye a partir de datos de la muestra de modo que el parámetro ocurre dentro de dicho rango con una probabilidad específica.

La probabilidad específica se conoce como nivel de confianza.

La información de Ia distribución muestral de las medias de muestras, permite localizar un intervalo con una probabilidad específica de contener Ia media de Ia población.

Para muestras razonablemente grandes, es posible utilizar el teorema del Iímite central para afirmar que el:

95% de las medias de muestra seleccionadas de una población estarán dentro de 1.96 desviaciones estándar de Ia media de

Ia población.

99% de las medias de muestra seleccionadas estarán dentro de

2.58 desviaclones estáridar de Ia media de la población.

En este caso, Ia desviación estándar a utilizarse es Ia de Ia distribución muestral de las medias de muestras.

Los intervalos que se calculan de esta forma son el intervalo del 95% de confianza, y el intervalo del 99% de confianza.

El teorema del límite central afirma que Ia distribución muestral de las medias de las muestras es aproximadamente normal.

.4750 .4750

||||||||||

95%

-1.96 1.96

.0250.0250

Por lo tanto, se puede usar el apéndice D(página 523) para encontrar los valores z apropiados.

Para el 95% se busca 0.4750 en el cuerpo de Ia tabla, luego se lee los valores correspondientes de fila y columna. Es 1.96.

Por tanto, Ia probabilidad de encontrar un valor z entre 0 y 1.96 es 0.4750. Asimismo, Ia probabilidad de encontrarse en el intervalo entre -1.96 y 0 es también de 0.4750.

Cómo se calcula el intervalo de confianza de 95%?

Veamos un ejemplo, supongamos que se realiza una investigación sobre el salario inicial de los graduados de Ia facultad de administración.

Se calculó la media de la muestra en $27,000 y Ia desviación estándar de las medias de Ia muestra en $200.

El intervalo de confianza de 95 por ciento se encuentra entre 26,608 y 27,392 dólares, que se encuentra mediante

$27,000 ± 1 .96($200).

Si se seleccionaran 100 muestras del mismo tamaño de Ia población de interés y se determinaran los 100 intervalos correspondientes de confianza, se podría esperar encontrar Ia media de Ia población en 95 de los 100 intervalos de confianza.

El error estándar de la media de la muestra

A Ia desviación estándar de Ia distribución muestral de las medias demuestras se le llama error estándar de Ia media de la muestra.

Muchas veces se abrevia a error estándar.

Fórmula:

es el error estándar de la media, llamado también desviación estándar de la distribución muestral de medias.

es la desviación estándar de la población.

n es el tamaño de la muestra.

donde:

Pero, como en Ia mayoría de las situaciones no se conoce Ia desviación estándar de Ia población. se le estima por la desviación estándar de la muestra: es decir, se remplaza con s.

El tamaño del error estándar se ve afectado por dos valores.

El primero es Ia desviación estándar.

Si ésta es grande, entonces el error estándar también se ve afectado por el tamaño de Ia muestra.

A medida que éste aumenta, se reduce el error estándar, indicando que hay menos variabilidad en la distribución muestral de las medias de las muestras.

Esto es lógico, porque una estimación con base en una muestra grande es más precisa que otra que se hace con una muestra más pequeña.

Cuando el tamaño de Ia muestra, n, es por lo menos de 30, generalmente se acepta que el teorema del Iímite central asegurará una distribución normal de las medias de las muestras.

Como ya sabemos, esta consideración es importante.

Si las medias de las muestras tienen una distribución normal, es posible usar Ia distribución normal estándar, es decir, z, en nuestros cálculos.

Los intervalos de confianza de 95 y 99 por ciento se calculan de Ia manera siguiente, cuando n ≥ 30.

INTERVALO DE CONFIANZA DE 95%

INTERVALO DE CONFIANZA DE 99%

INTERVALO DE CONFIANZA

Así, para un intervalo de confianza de 92 % Ia fórmula se convierte en:

El valor de 1.75 se determina con base en el apéndice D. La tabla se basa en Ia mitad deIa distribución normal, de modo que 0.92/2 = 0.4600.

El valor más próximo en Ia tabla es 0.4599, y el valor z correspondiente es 1 .75.

Con frecuencia, también se usa el nivel de confianza de 90 %. En este caso, el área entre 0 y z es 0.4500, que se encuentra dividiendo 0.90/2.

El area que corresponde a un valor z de 1.64 es 0.4495 y para 1.65 es 0.4505.

Se utiliza 1.65. (valor mayor)

Un estudio abarca Ia selección de una muestra aleatoria de 256 representantes de ventas menores de 35 años de edad.

La media de Ia muestra de sus ingresos anuales es $55,420, con una desviación estándar de $2,050.

Ejemplo:

1.¿Cuál es el ingreso media estimado de todos los gerentes (Ia población)?

Es decir, ¿cuál es Ia estimación puntual?

La estimación puntual de Ia media de Ia población es $55,420. En otras palabras, no se conoce Ia media de Ia población.

El valor $55,420 es Ia mejor estimación que hay de un valor desconocido.

2. ¿Cuál es el intervalo de confianza del 95 % para Ia media (redondeada a Ia decena de dólares más próxima)?

El intervalo de confianza está entre $55,170 y $55,670, que se encuentra mediante:

Al redondear a Ia decena de dólares más próxima: $55,170 y $55,670.

Los puntos finales del intervalo de confianza son los límites de conflanza.

En este ejemplo, $55,170 y $55,670 son los Iímites de confianza.

3. ¿Cuáles son los Iímites del 95 % del nivel de confianza para Ia media de Ia población?

4. ¿Qué grado de confianza se utiliza?

La medición de confianza que tiene una persona se refiere al grado de confianza o nivel de confianza. En este caso, es 0.95.

5. Interpretemos los resultados.

Si se pudieran seleccionar muchas muestras que incluyeran a la población de los256 representantes de ventas menores de 35 años de edad, y calcular las medias e intervalos de confianza de Ia muestra, el ingreso medio anual de Ia población estaría en aproximadamente 95 de cada 100 intervalos de confianza. Más o menos 5 de los 100 intervalos de confianza no incluiría el ingreso medio anual de Ia población., p Esto se ilustra en el diagrama siguiente. Observe que el quinto intervalo de confianza no incluye a Ia media de Ia poblaciOn.

Autoevaluación 7-5

(página 249)

Ejercicios 9 y 10

(página 249)

Intervalo de confianza para una proporción de la población

La determinación de un estimador puntual y uno de intervalo para una proporción de población es similar a los métodos que se describieron en Ia sección anterior.

Un estimador puntual para Ia proporción de Ia población se encuentra al dividir el número de éxitos en Ia muestra entre el número que se muestreó.

Suponga que 100 personas de las 400 que se muestrearon dijeron que les gustaba más un nuevo refresco de cola que el refresco normal.

La mejor estimación de Ia proporción de la población que favorece el nuevo refresco es 0.25, o 25 %, que se encuentra al dividir 100/400.

Recordemos que Ia proporción es Ia fracción del número de “éxitos” con relación al número muestreado.

¿Cómo se calcula el intervalo de confianza para una proporción de población?

INTERVALO DE CONFIANZA PARA UNA PROPORCION DE POBLACION

donde:

P es Ia proporción de Ia muestra.

z es el valor normal estándar para el grado de confianza seleccionado.

n es el tamaño de Ia muestra.

Luego de una larga carrera como miembro del Consejo de Ia ciudad de Chicago, Scott lsenberg decidió postularse para alcalde.

La campaña contra su oponente, el alcalde Arthur Smith, ha sido enconada, y ambos candidatos han gastado varios millones de dólares en anuncios por televisión.

En las semanas finales, lsenberg se encuentra adelante de acuerdo con las encuestas publicadas en el “Chicago Tribune”.

Ejemplo:

Para comprobar los resultados, el personal de campaña de Isenberg realiza una encuesta propia durante el fin de semana previo a Ia elección.

Los resultados demuestran que, para una muestra aleatoria de 500 votantes, 290 votarán por Isenberg.

Desarrolle un intervalo de confianza de 95 % para Ia proporción de Ia población que votará por Isenberg. ¿Puede éste Ilegar a Ia conclusión de que ganará Ia elección?

Se comienza estimando Ia proporción de votantes que votarán por Isenberg.

La muestra incluyó a 500 votantes y 290 apoyaron a Isenberg, de modo que Ia proporción de Ia muestra es 0.58, que se encuentra al dividir 290/500.

El valor 0.58 es una estimación puntual de Ia proporción de Ia población desconocida (P).

Se utiliza Ia fórmula para determinar el intervalo de confianza.

Los puntos finales del intervalo de confianza son 0.537 y 0.623. El punto mínimo del intervalo de confianza es mayor a 0.50. Por lo tanto, se concluye que Ia proporción de votantes en Ia población que apoya a lsenberg es mayor al 50 %. Con base en los resultados de Ia encuesta, ganará Ia elección.

Autoevaluación 7-6

(página 252)

Ejercicios 17 y 18

(página 252)

Factor de corrección de una población finita

Las poblaciones que se han muestreado hasta ahora han sido muy grandes o se ha supuesto que son infinitas.

¿Qué ocurre si Ia población que se muestrea no es infinita, o ni siquiera muy grande?

En tales casos, se harán ciertos ajustes en Ia forma en que se calcula el error estándar de las medias de Ia muestra y el error estándar de las proporciones de Ia muestra.

Para una población finita, en Ia que el número total de objetos es N y el tamaño de Ia muestra n, se hace el siguiente ajuste a los errores estándar de las medias de Ia muestra y Ia proporción:

ERROR ESTANDAR DE LAS MEDIAS DE LA MUESTRA, UTILIZANDO UN FACTOR DE CORRECCION

ERROR ESTANDAR DE LAS PROPORCIONES DE LA MUESTRA,UTILIZANDO UN FACTOR DE CORRECCION

En el pequeño pueblo de Scandia viven 250 familias.

Una encuesta con 40 familias reveló que Ia contribución anual promedio a Ia iglesia es de 450 dólares, con una desviación estándar de 75 dólares.

Construya un intervalo de confianza de 95 por ciento para Ia contribución media anual.

Ejemplo:

Primero, observemos que Ia población es finita. Es decir, hay un límite para el número de personas en Scandia.

Segundo, Ia muestra constituye más del 5 por ciento de Ia po blación;

es decir, n/N = 40/250 = 0.16.

Por lo tanto, se utiliza el factor de corrección de Ia población finita.

El intervalo de confianza de 95 por ciento se construye de Ia manera siguiente, utilizando las fOrmulas.

Autoevaluación 7-7

(página 254)

Ejercicios 21 y 22

(página 254)

Elección de un tamaño apropiado de muestra

Una cuestión que por lo general surge cuando se diseña un estudio estadístico es: “¿cuántos artículos debería haber en Ia muestra?”.

Si una muestra es demasiado grande, se desperdicia dinero recolectando datos.

lgualmente, Si es demasiado pequeña, las conclusiones resultantes serán inciertas.

El tamaño de Ia muestra depende de tres factores:

1. El nivel de confianza que se desea.

2. El margen de error que puede tolerar el investigador.

3. La variabilidad en Ia población que se estudia.

Mientras más alto sea el nivel de confian za, mayor será el tamaño de Ia muestra.

Un error permisible pequeño requerirá una muestra grande, y un error permisible grande permitirá una muestra menor.

Si Ia población tiene una dispersión amplia, se requiere una muestra grande. Por otra parte, si Ia población está concentrada (es homogénea), el tamaño requerido de Ia muestra será pequeño.

Al resolver esta ecuación para n, se obtiene el tamaño de muestra requerido.

TAMANO DE MUESTRA PARA ESTIMAR UNA MEDIA

El resultado de este cálculo debe ser un número entero.

Un estudiante de administración pública desea determinar Ia cantidad media que ganan los miembros de los concejos de ciudades. El error para estimar Ia media es menor de 100 dólares, con un nivel de confianza de 95 por ciento. El estudiante encontró un informe del Departamento del Trabajo de Estados Unidos que estimó que Ia desviación estándar es de 1,000 dólares.

¿Cuál es el tamaño requerido de Ia muestra?

Ejemplo:

El error máximo permisible, E, es 100 dólares. El valor de z para un nivel de confianza de 95 por ciento es 1.96, y el estimado de Ia desviación estándar son 1,000 dólares.

Al sustituir estos valores en Ia fórmula, el tamaño requerido de Ia muestra es:

El valor calculado de 384.16 se redondea hacia arriba a 385.

Se requiere una muestra de 385 para cumplir con las especificaciones.

Si se desea un nivel mayor de confianza, por ejemplo de 99 por ciento, entonces también se requiere una muestra mayor.

Se recomiendaría una muestra de 666.

El resultado de un aumento en el nivel de confianza de 95 a 99 % fue un aumento de 281 observaciones.

Esto podría elevar en gran medida el costo del estudio, en cuanto a dinero y tiempo. Por lo tanto, es preciso considerar con todo cuidado el nivel de confianza.

top related