poblaciÓn y muestra segunda unidad · muestra m media s desviación p proporción n tamaño x...
TRANSCRIPT
Segu
nd
a U
nid
ad POBLACIÓN Y MUESTRAOsiris Carranza © 2012.Diplomado de
Investigación Científica. UNAH
En toda investigación se define las unidades a ser Medidas, sí es una población finita o infinita o una parte de esta población a la que se llama muestra.
2
3
¿Cómo se ¿Cómo se ¿Cómo se ¿Cómo se
mide la mide la mide la mide la
cantidad de cantidad de cantidad de cantidad de
personas que personas que personas que personas que
vieron el vieron el vieron el vieron el
debate debate debate debate
presidencial?presidencial?presidencial?presidencial?
¿Qué es una población?
En investigación se
utiliza para referirse
al conjunto de
elementos
diferenciados,
susceptibles de
investigarse y tienen
un característica en
común, son parte
de un universo.
4
¿Qué es una muestra?
Los elementos de la muestra han sido
seleccionados a través de un estudio
sistemático.
5
POBLACIÓN
Muestra
m media
s desviación
p proporción
N tamaño
x media
s desviación
p proporción
n tamaño
UNIVERSO
Característica de una muestra
7
1. Es un conjunto de la población;2. Es representativa y proporcional
de la población (cuantitativa);3. Debe tener saturación y riqueza
de información (cualitativa).
Ventajas del muestreo
�Estudia grandes poblaciones;�Proporciona ahorro y mayor
rapidez en la ejecución de la investigación;
�Se logra resultados másprecisos que estudiando la población total y se presta más atención a los detalles.
8
¿Qué tipo de muestreo existen?
• Aleatorio o probabilística• No aleatoria o no probabilística
9
El tipo de muestreo depende de:1. Los objetivos del estudio
2. El diseño de investigación
¿Qué es una muestra aleatoria?
•Son esenciales en investigaciones donde se pretende generalizar los resultados;
•Todos los elementos de la población tienen la misma posibilidad de ser elegidos.
10
Requísitos de una muestra probabilística
Seleccionar los elementos muestrales en forma aleatoria
11
Selección sistemática
Tómbola
Tabla de números
aleatorios
Marco muestral
Listados completos de los elementos que conforman la población: Es la fuente de donde obtener información de la población.
12
Nómina telefónica
Listado de escuelas
Marco conceptual
Listados completos de los elementos que conforman la población: Es la fuente de donde obtener información de la población.
13
Mapas Fotos geográficas
¿Qué modalidadesde muestreo aleatorio existen?
14
15
Mu
est
reo
Probabilístico
Aleatorio simple
Aleatorio estratificado
Sistemático
Por conglomerados
Por conglomerados en dos etapas
Determinístico
De juicio
Diseño de la bola de nieve
Por conveniencia
De entrevista de grupo
De intercepción de centros comerciales
De panales cortosPor cuotas
1.Aleatorio simple: se seleccionan n unidades de las N en la población, de forma que cualquier posible muestra del mismo tamaño tiene la misma probabilidad de ser elegidas. números aleatorios o un programa de ordenador que proporcione números aleatorios.
16
2.Al azar sistemático: Se escoge sumando un número constante. Se ordenan los individuos de la población y se enumeran, la población se divide en tantos grupos se quiera tomar la muestra. Se seleccionan al azar los grupos. Encuestas telefónicas.
17
3.Estratificado al azar: Se divide la población en grupos homogéneos (estratos) de acuerdo con las características a estudiar. Por ejemplo, en un estudio de las características socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen presentar características diferenciales.
18
4.Muestreo por racimos: En este tipo de muestreo se seleccionan racimos o conglomerados (escuelas, organizaciones, salones de clase, etc.). Se divide la población en grupos de acuerdo con su proximidad geográfica o de otro tipo. (conglomerados). Cada grupo ha de ser heterogéneo y tener representados todos las características de la población.
19
20
a)Aleatorio simpleb)Aleatorio estratificadoc)Aleatorio sistemáticod)Aleatorio sistematizo rejilla polar
¿Qué es una muestra no aleatoria?¿Qué es una muestra no aleatoria?
• No se cumple la condición de que todos loselementos de la población tienen igualesprobabilidades de ser elegidos.
• Pueden llamarse muestras dirigidas, pues laelección depende del criterio del investigador
• Son validas cuando un determinado diseño asílo requiere.
21
¿Qué modalidad de muestras no aleatorias existen?
• Muestras de sujetos
voluntarios
• Muestras de expertos
• Muestras de sujetos
tipos o estudios de caso
• Muestra por cuotas
22
23
FORMULAS PARA CALCULAR TAMAÑO DE LA MUESTRA
24
(N.C.)2 p*q
n = --------------------
E2
(N.C.)2 *N * p*q
n = -----------------------------------
E2 (N-1) + p*q (N.C.) 2
(N.C.)2 σ
n = --------------------
E2
(N.C.)2 * N * σ
n = -----------------------------------
E2 (N-1) + σ (N.C)
¿De que factoresdepende el tamaño
de la muestra?
25
Amplitud de la poblaciónNivel de confianza adoptado
Variabilidad de la población
EError del muestreo
¿Qué es el error muestral?
• Todo error lo es en relación a algún patrón opunto de referencia. En el caso del errormuestral, el punto de referencia es la poblaciónde la que se obtiene.
• Precisamente en esta divergencia entre losvalores medios obtenidos y las muestras y losvalores medios de la población consiste el errormuestral.
26
• Ejemplo, el resultado de la muestra de unainvestigación es del 20% de la población queindica que tiene estudios superiores y el errormuestral es del 2%. El error indica que lamedia de la población de los que tienenestudios superiores debe hallarse entre elintervalo de 20+ 2, o sea, entre el 18 y 22%.
27
¿Qué es el nivel de confianza?
El nivel de confianza indica la seguridad que tiene en la población se encuentre en el intervalo calculado.
28
Los valores usuales aplicados en investigación social son 95.44% y 99.74% (que corresponde a +2 y +3 desviaciones estándar respectivamente).
El nivel de confianza indica qué el grado de seguridad que se tiene sobre la población en el intervalo calculado. A mayor es el nivel de confianza utilizado en una investigación, mayor es el tamaño mínimo de la muestra correspondiente.
29
¿Qué es el nivel de confianza?
¿Qué representa la varianza en la formula del tamaño de la muestra?
30
Variables cuantitativas = S2
Variables cualitativas = P(1-P)
1.Aleatorio simple:
31
Z2α/2 S2
ε2n =
Un margen de confianza del 95% (1-α), corresponde a Z = 1.96,
No se conoce la población, N=infinita
1.Aleatorio simple:
32
Z2α/2 S2
ε2n =n = Tamaño necesario de la muestra
Z2α/2
Margen de confianza o número de unidades de
desviación estándar en la distribución normal que
producirá el nivel deseado de confianza (para una
confianza de 95% o un α = 0.05, Z = 1.96; para una
confianza de 99% o un α = 0.01, Z = 2.58)
S
Desviación estándar de la población (conocida o
estimada a partir de anteriores estudios o de una prueba
piloto).
ε2
Error o diferencia máxima entre la media muestreal y la
media de la población que ese está dispuesto a aceptar
con el nivel de confianza que se ha definido
1.Aleatorio simple:
33
La alcaldía municipal de Santa Lucía tiene el interés de conocer los hábitos de los visitantes con el
propósito de ofrecer en los negocios de atención turística un mejor
servicio. Se realizó un cuestionario dirigido a los turistas nacionales que
visitan a la comunidad en temporada alta. El alcalde se entera
que necesita encuestar una muestra de turistas calculada de un sistema
de muestro simple
1.Aleatorio simple:
34
El alcalde decidir tomar un margen de confianza del 95%(1-α), que corresponde a Z = 1.96, con desviaciónestándar S = 0.4, un error de estimación ε = 5%, y sesupone que no se conoce el tamaño de la población (N=infinito).
Z2α/2 S2
ε2n = =
(1.96)2 (0.4)2
(0.05)2= 246 turistas
1.Aleatorio simple:
35
Se conoce la población, N=finita
S2
n =ε2 S2
+NZ2
1.Aleatorio simple:
36
Nuevamente, el alcalde de Santa Lucía supone una
población de 2 mil turistas que visitan a la ciudad, población
que se obtuvo de otros análisis estadísticos, por tanto el tamaño
de la muestra sería:
S2
n =ε2 S2
+
NZ2
(0.4)2
(0.05)2 (0.4)2
+2000(1.96)2
= = 219 turistas
1.Aleatorio simple:
37
¿De cuántos cuestionarios sería la muestra si la población es de 1,000 y 500 turistas?
¿Cómo son estos resultados si la S2 es 0.10 y 5.00?
1.Aleatorio simple:
38
N n
6000 236
3000 227
1000 197
500 165
250 124
N S2 n
6000 0.1 15.32
3000 0.1 15.28
1000 0.1 15.13
500 0.1 14.90
250 0.1 14.47
N S2 n
6000 5.00 5189
3000 5.00 2782
1000 5.00 974
500 5.00 493
250 5.00 248
¿Qué concluye?
1.Aleatorio simple:
39
S2
n´ =V2
Tamaño provisional de la muestra = varianza/varianza de la población
n´n =
1+n´/N
Otra manera de
calcular la muestra
1.Aleatorio simple:
40
N Tamaño de la población
seError estándar, es determinado por el investigador
V2Varianza de la población al cuadrado. Es el error
estándar al cuadrado.
S2Varianza de la muestra expresada como la
probabilidad de ocurrencia
p0.9
n´ Tamaño de la muestra sin ajustar
n Tamaño de la muestra
1.Aleatorio simple:
41
¿
1,176
0.015 0.90?
S2 = p(1-p) = 0.9(1-0.9)=0.09
V2 = (0.015)2 =0.000225
1.Aleatorio simple:
42
0.09n´ =
0.000225
n´n =
1+n´/N
= 400
400
1+(400/1176)= 298.5 casos =
1.Aleatorio simple:
43
Para encontrar el estado de salud de los neonatos de tortugas, la CVC-Golf necesita calcular el tamaño de la muestra a partir de una población de 734 neonatos, usando un error estándar del 5%, y una confianza del 90%
1.Aleatorio simple:
44
S2 = p(1-p) = 0.90(1-0.90)=0.09
V2 = (0.05)2 =0.0025
1.Aleatorio simple:
45
0.0475n´ =
0.0025
n´n =
1+n´/N
= 36
36
1+(36/734)= 34.3 tortugas =
46
Cuando la población es muy pequeña y el error tolerado muy pequeño, prácticamente hayque tomar a toda o casi toda la población.
2. Muestreo Proporcional
47
Z2α/2 PQN
ε2(N-1) + Z2PQn =
Este tipo de muestreo tiene la limitación que la probabilidad de ocurrencia (P) el valor mínimo que puede alcanzar es del 50% (0.5), lo mismo que a Q. En el error, este no debe ser mayor 6%.
2. Muestreo Proporcional
48
n = Tamaño necesario de la muestra
Z2α/2
Margen de confianza o número de unidades de desviación
estándar en la distribución normal que producirá el nivel deseado
de confianza (para una confianza de 95% o un α = 0.05, Z = 1.96;
para una confianza de 99% o un α = 0.01, Z = 2.58)
P Probabilidad de que el evento ocurra: 0.73 ó 73%
QProbabilidad de que el evento no ocurra: 1- P = 1-0.73 = 0.27 =
27%
ε2
Error o diferencia máxima entre la media muestreal y la media de
la población que ese está dispuesto a aceptar con el nivel de
confianza que se ha definido: 0.05 = 5%
N Tamaño de la población: 200,000 clientes
2. Muestreo Proporcional
49
Una compañía telefónica en Honduras cuenta con 200 mil clientes. Por una investigación piloto se supo que el 73% de los clientes declaran una excelente aceptación de los servicios de la empresa. Ésta desea conocer el grado de aceptación de un nuevo producto con un margen de confianza del 95% y un error de estimación de 5%, para lo que necesita encuestar a una muestra de sus clientes.
2. Muestreo Proporcional
50
(1.96)2 (0.73)(0.27)(200,000)
(0.05)2(200,000-1) + (1.96)2(0.73)(0.27)n =
= 302.4 ≈ 302 personas
2. Muestreo Proporcional
51
Una empresa empacadora de camarón pretende lanzar un nuevo producto de camarón cocinado, desconoce la probabilidad de ser aceptado el producto en el mercado nacional. El margen de confianza es del 95% y el de error de estimación del 5%, la empresa cuenta con
2. Muestreo Proporcional
52
1,450 clientes en Centroamérica que son cadenas de supermercados, estaciones de servicio y restaurantes. El departamento de mercadeo de la empresa sabe que debe aplicar un cuestionario para conocer de parte de los clientes las bondades del producto y su aceptación, pero desconoce el número de empresas a entrevistar.
2. Muestreo Proporcional
53
(1.96)2 (0.50)(0.50)(1,450)
(0.05)2(1,450-1) + (1.96)2(0.50)(0.50)n =
= 303.8 ≈ 304 empresas
3. Muestreo estratificado
54
(n)(NA)(SA)
(NA)(SA)+(NB)(SB)+(NC)(SC)+(ND)(SD)n =
3. Muestreo estratificado
55
nA Tamaño óptimo de la muestra que se extrae del estrato A
n Tamaño total de la muestra
NA Número de elementos del estrato A
SA Desviación estándar de los elementos en el estrato A
NB Número de elementos del estrato B
SB Desviación estándar de los elementos en el estrato B
NC Número de elementos del estrato C
SC Desviación estándar de los elementos en el estrato C
ND Número de elementos del estrato D
SD Desviación estándar de los elementos en el estrato D
3. Muestreo estratificado
56
En un estudio realizado en barrios y colonias de la ciudad de Choluteca sobre la producción de desechos sólidos y reciclaje de la basura, se aplicó un muestreo estratificado para determinar el número de familias a ser evaluadas y así encontrar el volumen de desechos sólidos producidos a la semana por estrato social según los ingresos mensuales de estas familias.
3. Muestreo estratificado
57
La alcaldía municipal proporcionó el número de viviendas habitadas de estos barrios y colonias de la ciudad. Estudios anteriores en estos barrios y colonias generaron información por estrato social de la cantidad de desechos que producen por familia en promedio y su desviación estándar.
3. Muestreo estratificado
58
Estrato social por ingresos
mensuales en lempirasViviendas habitadas
Desviación estándar de
los desechos producidos
por familia a la semana
(Kg)
Alta (más de 100 mil) 1,500 5.6
Media alta (entre 30 y
100 mil)4,000 4.8
Media (entre 10 y 30
mil)6,500 4.4
Baja (menos de 10 mil) 9,000 3.6* La cantidad de desechos es calculada en base a familias de cinco miembros
Para encontrar el tamaño de la muestra por estrato por cada uno de los estratos sociales sí se quiere tener una muestra total de 500 viviendas
3. Muestreo estratificado
59
(500)(1,500)(5.6)
(1,500)(5.6)+(4,000)(4.8)+(6,500)(4.4)+(9,000)(3.6)nA =
= 47.4 ≈ 47 viviendas
Número de viviendas del estrato social alto que debe entrevistarse
3. Muestreo estratificado
60
Número de viviendas del estrato social medio alto que debe entrevistarse
(500)(4,000)(4.8)
(1,500)(5.6)+(4,000)(4.8)+(6,500)(4.4)+(9,000)(3.6)nB =
= 108.3 ≈ 108 viviendas
3. Muestreo estratificado
61
Número de viviendas del estrato medio que debe entrevistarse
(500)(6,500)(4.4)
(1,500)(5.6)+(4,000)(4.8)+(6,500)(4.4)+(9,000)(3.6)nC =
= 161.4 ≈ 161 viviendas
3. Muestreo estratificado
62
Número de viviendas del estrato social bajo que debe entrevistarse
(500)(9,000)(3.6)
(1,500)(5.6)+(4,000)(4.8)+(6,500)(4.4)+(9,000)(3.6)nD =
= 182.8 ≈ 183 viviendas
3. Muestreo estratificado
63
Los resultados anteriores revelan que para aplicar un cuestionario que indique la cantidad de desechos que produce una familia a la semana por estrato social, para una muestra total de 500 viviendas, se tiene que se debe aplicar 47 cuestionarios al estrato social alto, 108 al estrato medio alto, 161 al estrato medio y 183 al estrato bajo respectivamente.
64
Según diferentes seguridades, el coeficiente de Z varía así: • Si la seguridad Zα fuese del 90% el coeficiente sería 1.645 • Si la seguridad Zα fuese del 95% el coeficiente sería 1.96 • Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24 • Si la seguridad Zα fuese del 99% el coeficiente sería 2.576
Si los recursos del investigador son limitados, debe recordar que a medida que se disminuya el nivel de seguridad, se permitirá un mayor error en el estudio de investigación, lo cual a su vez permitirá al investigador trabajar con un número de muestra más reducido, sacrificando la confiabilidad de los resultados.
65