capítulo 2 : población, muestra y contexto

44
UNIVERSIDAD DE GUAYAQUIL DIRECCIÓN DE INVESTIGACIÓN Y PROYECTOS ACADÉMICOS Curso de fortalecimiento de la investigación para personal docente MODULO ESTADÍSTICA Capitulo 2: Población, muestra y contexto. GRUPO : D Profesor : PhD Félix Olivero

Upload: ug-dipa

Post on 16-Apr-2017

556 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Capítulo 2 : Población, muestra y contexto

UNIVERSIDAD DE GUAYAQUILDIRECCIÓN DE INVESTIGACIÓN Y PROYECTOS ACADÉMICOS

Curso de fortalecimiento de la investigación para personal docente

MODULO ESTADÍSTICACapitulo 2: Población, muestra y contexto.

GRUPO : DProfesor : PhD Félix Olivero

Page 2: Capítulo 2 : Población, muestra y contexto

ÍNDICESubunidad 1: Muestreos probabilísticos y no probabilísticos. Formulas.Subunidad 2: Formulas para muestras grandesSub unidad 3: Formula para muestras pequeñas.

Page 3: Capítulo 2 : Población, muestra y contexto

Poblaciones y muestras

• Los objetos de los que uno toma medidas para generar datos son los sujetos del estudio:

•pueden ser individuos y familias•Países y ciudades•empresas, instituciones, universidades, etc.

• La población: conjunto de sujetos sobre el cual se realiza el estudio.

• Una muestra: es un subconjunto de la población sobre el que se toma datos.

Page 4: Capítulo 2 : Población, muestra y contexto

Términos estadísticos Términos estadísticos importantesimportantes

Población:Población: Un grupo que incluye todas las mediciones Un grupo que incluye todas las mediciones de interés para el investigadorde interés para el investigador(La colección de (La colección de todastodas las respuestas, las respuestas, mediciones o conteos que mediciones o conteos que son de interés)son de interés)

Muestra:Muestra:Un subgrupo de la poblaciónUn subgrupo de la población

Page 5: Capítulo 2 : Población, muestra y contexto

¿¿Por qué muestrearPor qué muestrear??

Tener información de grandes poblacionesTener información de grandes poblaciones Menor costo Menos tiempo en el campo Mayor seguridad en la colección de datos Cuando es imposible estudiar a toda la

población

Page 6: Capítulo 2 : Población, muestra y contexto

Población objetivo:Población objetivo: La población a ser estudiada/a la cual el La población a ser estudiada/a la cual el

investigador quiere generalizar los resultadosinvestigador quiere generalizar los resultadosUnidad de muestreo:Unidad de muestreo:La unidad más pequeña de la cual la muestra La unidad más pequeña de la cual la muestra

puede ser seleccionadapuede ser seleccionadaEsquema de muestreoEsquema de muestreo Lista de todas las unidades de muestreo de la Lista de todas las unidades de muestreo de la

cual se extrae la muestracual se extrae la muestraFormas de muestreoFormas de muestreoMétodo de seleccionar las unidades de muestreo Método de seleccionar las unidades de muestreo

del esquema de muestreodel esquema de muestreo

Page 7: Capítulo 2 : Población, muestra y contexto

Tipos de muestreoTipos de muestreo

Muestras no probabilísticas

Muestras probabilísticas

Page 8: Capítulo 2 : Población, muestra y contexto

Muestras no probabilísticasMuestras no probabilísticas

Muestras por conveniencia (fácil acceso)Muestras por conveniencia (fácil acceso)La muestra es seleccionada de elementos de la

población que son fácilmente accesibles Muestreo bola de nieve (amigos de Muestreo bola de nieve (amigos de

amigos….etc.)amigos….etc.) Muestreo propositivo (juicio)Muestreo propositivo (juicio)

Usted elige quien piensa que debe estar en el estudio

Muestra contingenteMuestra contingente

Page 9: Capítulo 2 : Población, muestra y contexto

Muestras no probabilísticasMuestras no probabilísticas

La probabilidad de ser elegido se desconoceMenos costos – pero no es de utilidad para generalizar resultados por potenciales sesgos.

Page 10: Capítulo 2 : Población, muestra y contexto

Muestras probabilísticasMuestras probabilísticas

Muestreo aleatorio Cada sujeto tiene una probabilidad

conocida de ser seleccionado Permite la aplicación de la teoría de

estadística a los resultados para: Generalizar Probar hipótesis

Page 11: Capítulo 2 : Población, muestra y contexto

ConclusionesConclusiones

Muestras probabilísticas son las mejores

Asegura Representatividad Precisión

Page 12: Capítulo 2 : Población, muestra y contexto

Métodos usados en muestras Métodos usados en muestras probabilísticasprobabilísticas

Muestreo aleatorio simpleMuestreo aleatorio simple Muestreo sistemáticoMuestreo sistemático Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasos Muestreo de múltiples pasos Muestreo por conglomerados (cluster)Muestreo por conglomerados (cluster)

Page 13: Capítulo 2 : Población, muestra y contexto

Muestreo simple aleatorio

Page 14: Capítulo 2 : Población, muestra y contexto

Tabla de números aleatoriosTabla de números aleatorios

6 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 06 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 05 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4 5 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4 3 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 53 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 59 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 69 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 6

Page 15: Capítulo 2 : Población, muestra y contexto

Fracción de muestreoFracción de muestreoRazón entre el tamaño de muestra y el Razón entre el tamaño de muestra y el

tamaño de la poblacióntamaño de la población

Muestreo sistemático

Page 16: Capítulo 2 : Población, muestra y contexto

Muestreo sistemático

Page 17: Capítulo 2 : Población, muestra y contexto

Muestreo por conglomerado Muestreo por conglomerado (clúster)(clúster)

Clúster: un grupo de unidades de muestreo cercanas entre ellas, por ejemplo, viviendo en la misma área o vecindario.

Page 18: Capítulo 2 : Población, muestra y contexto

Muestreo por clústerMuestreo por clúster

Sección 4

Sección 5

Sección 3

Sección 2Sección 1

Page 19: Capítulo 2 : Población, muestra y contexto

Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasosMuestreo de múltiples pasos

Page 20: Capítulo 2 : Población, muestra y contexto

Error sistemático (o sesgo) Respuesta inapropiada (sesgo de información)

Sesgo de selección

Error de muestreo (error aleatorio)

Errores en muestras

Page 21: Capítulo 2 : Población, muestra y contexto

Error tipo 2Error tipo 2 La probabilidad de encontrar una La probabilidad de encontrar una

diferencia con nuestra muestra diferencia con nuestra muestra comparada con la población, y no hay una comparada con la población, y no hay una diferencia en realidad….diferencia en realidad….

Conocido como el α (o “error tipo 1”)Conocido como el α (o “error tipo 1”)

Usualmente situado al 5% (o 0.05)Usualmente situado al 5% (o 0.05)

Page 22: Capítulo 2 : Población, muestra y contexto

Error tipo 2Error tipo 2

La probabilidad de no encontrar una diferencia La probabilidad de no encontrar una diferencia que actualmente existe entre nuestra muestra que actualmente existe entre nuestra muestra comparada con la población…comparada con la población…

Conocido como β (o “error tipo 2”)Conocido como β (o “error tipo 2”)

Poder es (1- β) y es comúnmente del 80%Poder es (1- β) y es comúnmente del 80%

Page 23: Capítulo 2 : Población, muestra y contexto

Tamaño de muestra

Cuantitativa Cualitativa

2D

2σ2Zn

2

22

21

D)xFσ(σn

2

2

Dπ)π(1Zn

2DF )P-(1 P 2n

Page 24: Capítulo 2 : Población, muestra y contexto

Problema 1Problema 1Un estudio a realizarse para determinar un Un estudio a realizarse para determinar un

cierto parámetro en un a comunidad. De cierto parámetro en un a comunidad. De un estudio previo se obtuvo una un estudio previo se obtuvo una desviación estándar de 46.desviación estándar de 46.

Si un error de muestreo de hasta 4 es Si un error de muestreo de hasta 4 es aceptable, ¿cuantos sujetos deberán ser aceptable, ¿cuantos sujetos deberán ser incluidos en este estudio con un nivel de incluidos en este estudio con un nivel de confianza del 99%?confianza del 99%?

Page 25: Capítulo 2 : Población, muestra y contexto

RespuestaRespuesta

881~3.88024

246 x 22.58n

2D

2σ2Zn

Page 26: Capítulo 2 : Población, muestra y contexto

Problema 2Problema 2 Un estudio será realizado para determinar el Un estudio será realizado para determinar el

efecto de dos medicamentos (A y B) sobre el efecto de dos medicamentos (A y B) sobre el nivel de glicemia. De estudios previos usando nivel de glicemia. De estudios previos usando esos medicamentos, la desviación estándar del esos medicamentos, la desviación estándar del nivel de glicemia fueron de 8 y 12 g/dl, nivel de glicemia fueron de 8 y 12 g/dl, respectivamente.respectivamente.

Un nivel de significancia del 95% y un poder del Un nivel de significancia del 95% y un poder del 90% se requiere para detectar una diferencia de 90% se requiere para detectar una diferencia de medias de 3 gr/dl entre los dos grupos. medias de 3 gr/dl entre los dos grupos. ¿Cuantos sujetos deberán ser incluidos en cada ¿Cuantos sujetos deberán ser incluidos en cada grupo?grupo?

Page 27: Capítulo 2 : Población, muestra y contexto

RespuestaRespuesta

groupeachin

243~6.2423

)x10.512(8n 2

22

2

22

21

D)xFσ(σn

En cada grupo

Page 28: Capítulo 2 : Población, muestra y contexto

Problema 3Problema 3Se busca estimar la proporción de niños Se busca estimar la proporción de niños

anémicos en una escuela preparatoria. En anémicos en una escuela preparatoria. En un estudio similar en otra escuela se un estudio similar en otra escuela se detectó una proporción del 30%.detectó una proporción del 30%.

Calcule el tamaño de muestra requerido a Calcule el tamaño de muestra requerido a un límite de confianza del 95% y un límite de confianza del 95% y aceptando una diferencia de hasta 4% en aceptando una diferencia de hasta 4% en la población.la población.

Page 29: Capítulo 2 : Población, muestra y contexto

RespuestaRespuesta

505~21.504(0.04)

0.3)0.3(1 x 1.96n 2

2

2

2

Dπ)π(1Zn

Page 30: Capítulo 2 : Población, muestra y contexto

Problema 4Problema 4En estudios previos, el porcentaje de En estudios previos, el porcentaje de

hipertensos entre diabéticos fue de 70% y hipertensos entre diabéticos fue de 70% y entre no diabéticos fue de 40% en una entre no diabéticos fue de 40% en una cierta comunidad. cierta comunidad.

Un investigador quiere realizar un estudio Un investigador quiere realizar un estudio comparativo para hipertensos entre comparativo para hipertensos entre diabéticos y no diabéticos e un intervalo diabéticos y no diabéticos e un intervalo de confianza del 95% y poder del 80%. de confianza del 95% y poder del 80%. ¿Cual es el tamaño mínimo de muestra a ¿Cual es el tamaño mínimo de muestra a ser tomada de cada grupo con 4% de ser tomada de cada grupo con 4% de diferencia del verdadero valor?diferencia del verdadero valor?

Page 31: Capítulo 2 : Población, muestra y contexto

RespuestaRespuesta

2.24130.04

x7.80.55) -(1 0.55 x 2n 2

2DF )P-(1 P 2n

Page 32: Capítulo 2 : Población, muestra y contexto

PrecisiónCosto

Page 33: Capítulo 2 : Población, muestra y contexto

..

Población y muestra

Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder

abarcarlo.

Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debería ser “representativo” Esta formado por miembros “seleccionados” de la

población (individuos, unidades experimentales).

Page 34: Capítulo 2 : Población, muestra y contexto

Muestreo aleatorio simple

Mecanismo ideal para elegir la mejor muestra posible; debe cumplir las condiciones:

Cada elemento de la población tiene la misma probabilidad de ser escogido.

Todas las posibles muestras del tamaño muestral (n) tienen la misma probabilidad de ser seleccionadas.

Page 35: Capítulo 2 : Población, muestra y contexto

Muestreo aleatorio simple

Ejemplo:¿Cómo seleccionar una muestra?

1. Elaborar una lista con todos los nombres de la población.

2. Elaborar una “papeleta” o “bolilla” con cada nombre.

3. Mezclar y extraer las n papeletas o bolillas.

Este procedimiento cumple las dos condiciones antes planteadas.

Page 36: Capítulo 2 : Población, muestra y contexto

Muestreo aleatorio simple

En la práctica. ¿Cómo seleccionar una muestra?

Numerar todos los sujetos de la población. Obtener lista de números aleatorios (mediante

el uso de Microsoft EXCEL).

Ejemplo. Elegir una muestra de 20 alumnos de una lista de 100 estudiantes de primer año de secundaria.

20 celdas ←→=ENTERO(ALEATORIO()*100)

Page 37: Capítulo 2 : Población, muestra y contexto

Muestreo aleatorio simple

Este es el mecanismo ideal.

La estadística inferencial: se basa en este modelo ideal de muestreo aleatorio simple.

Casi todos los métodos de inferencia: suponen que la muestra se ha obtenido por este método.

En la vida real: pocas veces aplicamos este método estrictamente.

Aplicamos más habitualmente otros métodos de muestreo probabilística.

Page 38: Capítulo 2 : Población, muestra y contexto

Otros muestreos probabilísticos

Métodos de muestreo probabilístico: aquellos en los que es posible calcular la probabilidad de aparición de cada una de las muestras posibles.

El muestreo aleatorio simple es un muestreo probabilístico

Otros métodos probabilísticos:

Todos los sujetos tienen igual probabilidad de formar parte de la muestra.

No todas las muestras posibles (combinaciones de n sujetos) tienen la misma probabilidad.

Page 39: Capítulo 2 : Población, muestra y contexto

ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

1). Cuando la varianza (S2) es conocida:

a) Para poblaciones infinitas o tamaños de población desconocida:

b) Para poblaciones finitas o conocidas:

2

22

dSZn

222

22

)1( SZNdSNZn

Page 40: Capítulo 2 : Población, muestra y contexto

ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

2). Cuando la varianza (S2) es desconocida:

a) Tamaño de la población N es desconocida.

b) Tamaño de la población N es conocida:

2

2

dPQZn

PQZNdPQNZn 22

2

)1(

Page 41: Capítulo 2 : Población, muestra y contexto

ESTIMACIÓN DEL TAMAÑO DE LA MUESTRADonde: n: Es el tamaño de la muestra.

N: Tamaño de la población.

Z: Factor de confiabilidad. Es 1,96 cuando es un 95% de confianza y es 2,57 cuando se establece un 99% de confianza (valor de distribución normal estandarizada correspondiente al nivel de confianza escogida).

P = 0,5

Q = 1-P = 0,5

d: Es el margen de error permisible. Establecido por el investigador.

_

X

Page 42: Capítulo 2 : Población, muestra y contexto

ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

Ejemplo: Estimar el tamaño de la muestra de estudio para una población de 120 estudiantes de primer año de educación en la universidad.

N= 120Z=1,96 (para un nivel de confianza al 95%).P= 0,5Q= 1-P = 0,5d = 0,1

PQZNdPQNZn 22

2

)1(

)5,0)(5,0()96,1()1120()1,0()5,0)(5,0()96,1(120

22

2

n 59,53

1504,2248,115

n

53n

Page 43: Capítulo 2 : Población, muestra y contexto

EJERCICIOS DE ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

1. Estimar el tamaño de la muestra de estudio para una población de 80 estudiantes del 1er semestre carrera de CPA.

2. Se quiere estudiar el desempeño profesional de los docente de la especialidad de Matemática de la UG facultad de ciencias Administrativas, el total de docentes nombrados y contratados en la especialidad antes mencionado son 460. ¿Cuál es el tamaño de la muestra representativa que debemos elegir?

Page 44: Capítulo 2 : Población, muestra y contexto