tema 5 muestreo la selección de las unidades

14

Click here to load reader

Upload: californiadreaming

Post on 05-Jul-2015

199 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TEMA 5 Muestreo La selección de las unidades

TEMA 5: MUESTREO: LA SELECCIÓN DE LAS UNIDADES DE OBSERVACIÓN

Lectura recomendada:CATALÀ. L. Tècniques quantitatives d' investigació social, Ed. Universitat d'Alacant, Secretariat de Promoció del Valencià. Pág. 45-57CEA, M.A., (1998), Metodología cuantitativa, Madrid, Síntesis Sociología. Pág.160-213

Para aproximarse al conocimiento de la realidad social se utilizan las muestras de población. Para aplicar esta estrategia debemos conocer los principios en los que se basa.

Hay que distinguir entre Censos y Muestras:

Estrategia de selección mediante censo:

- Se estudia a todos los elementos de la población.- Se utiliza para estudiar los elementos estructurales y más estáticos de la población.- Realización periódica tras largos intervalos de tiempo.- Alto coste por la necesidad de emplear muchos recursos, tanto humanos como económicos.- La recogida de información y tratamiento de la misma lleva mucho tiempo.

Estrategia de selección mediante muestras - Se utilizan modelos reducidos de la población o subgrupos de población.- Los resultados son extrapolables a la población de la que ha sido extraída la muestra (en el

muestreo probabilístico: extrapolación lógica)- Menor coste, por utilización de menos recursos, tanto humanos como económicos.- Ahorro de tiempo.

Tipos de muestreo

Se pueden distinguir dos tipos estrategia muestral bien diferenciadas: el muestreo probabilístico y el no probabilística, ambos poseen cualidades y características diferentes:

MUESREO PROBABILÍSTICO MUESTREO NO PROBABILÍSTICO Útil cuando el objetivo es

cuantificar

Todos los casos presentes en el marco muestral tienen la misma probabilidad o al menos una probabilidad conocida de aparecer en la muestra final

La selección de elementos muestrales finales se debe al azar.

Para la selección previa no se requiere un conocimiento elevado de la población. Sólo determinadas variables socio-demográficas.

Permite hacer inferencias estadísticas

Útil cuando el objetivo es cualificar

Todos los casos no tienen la misma probabilidad de aparecer en la muestra final.

La selección de los elementos muestrales finales se debe a la intencionalidad del investigador.

Para la selección previa se requiere un conocimiento elevado de la población que se va a estudiar.

Permite hacer inferencias lógicas

Page 2: TEMA 5 Muestreo La selección de las unidades

Método cuantitativo Método cualitativo Teorías: Positivismo,

funcionalismo

Objetivo: Generalizaciones o explicaciones basadas en procedimientos estandarizados de recogida de información

Búsqueda de conocimiento a partir de la existencia previa de regularidades, leyes.

Técnicas cuantitativas (sondeos, encuestas...)

Conocimiento sistemático, comprobable, comparable, medible y replicable

Teorías: Historicismo, interaccionismo simbólico,...

Objetivo: reconstrucción de conceptos y acciones de la situación estudiada

Búsqueda de conocimiento a partir de la descripción / comprensión de acciones significativas, de realidades subjetivas.

Técnicas cualitativas que permiten descripciones en profundidad e “inmersión” en contextos.

El sentido no puede darse por supuesto, sino que va ligado a un contexto

Cada estrategia de muestreo es conveniente en:

- Diferentes estrategias de investigación.- En diferentes etapas de una misma investigación

No puede decirse que una estrategia sea mejor que otra, desde el punto de vista técnico deben adecuarse a la realidad objeto de estudio.Se debe considerar mantener un equilibrio óptimo entre el coste de la investigación y la importancia de los resultados que se vayan a obtener.

1. MUESTREOS NO PROBABILÍSTICOS

1.1. Muestreo de conveniencia1.2. Muestreo por cuotas1.3. Muestreo intencional

1.1. El muestreo de conveniencia Consiste en la selección de los casos que están más disponibles Se sitúa en los límites del concepto técnico de muestreo Se le denomina también fortuito o accidental. Es un muestreo fácil, rápido y económico. Ej.: emisoras de radio y televisión que “sacan un micrófono a la calle”. No permite hacer inferencias sobre la población a la que se “supone” que representa. Las generalizaciones sobre la información recogida no posee ningún rigor técnico.

Page 3: TEMA 5 Muestreo La selección de las unidades

Sólo se justifica en investigaciones en fase exploratoria o en la fase de elaboración de instrumentos de recogida de información: en pretest de cuestionarios, escalas, guías de entrevista, etc.

1.2. Muestreo por cuotas Similar a un muestreo aleatorio estratificado con afijación proporcional. Diferencia con el muestreo aleatorio: en la selección final de las unidades de muestreo, en la

selección de la persona a encuestar, rompe la cadena de aleatoriedad. Procedimiento:

o Selección de unas variables de control que van a servir para estratificar a la población, como la edad, sexo, región geográfica, etc. Debe existir información previa estandarizada sobre estas variables, ej.: censos, padrones, …

o Se seleccionan las variables de control que se supone que están relacionadas con los objetivos de segmentación de la población.

o Se determina la proporción de población que debe contener cada estrato. En la muestra debe aparecer representado cada estrato.

o Hasta aquí, la selección es igual que se haría en un muestreo aleatorio estratificado.o Una vez obtenido el tamaño de cada estrato, es decir, la “cuota” de personas a

encuestar, con las características básicas de segmentación de la población objeto de estudio.

SEXO EDADHOMBRES 18-30 2

31-45 446-65 3

MUJERES 18-30 131-45 346-65 4

o En la selección de las personas físicas por parte del encuestador es donde se puede romper la cadena de aleatoriedad, entrando en juego la intencionalidad del encuestador.

o Idealmente la cuota debería reproducir, en menor tamaño la población de la que ha sido extraída la muestra.

o Teóricamente se supone que si la muestra final tiene las mismas características sociodemográficas definidas en los estratos que la población, deberían distribuirse de manera similar otras características importantes, como las opiniones, ingresos, etc…

o La ventaja de este tipo de muestreo es asegurarse la heterogeneidad y proporcionalidad de la muestra.

- Inconvenientes de la estrategia de selección por cuotas:o Dificultad de seleccionar un sistema de estratificación que considere más de tres

variables, dado que el número de variables actúa como una función multiplicativa al considerar los valores o categorías de las mismas. Ej: sexo, 2 categorías, edad: 3 categorías, 2x3 = 6 estratos o tipos de personas a entrevistar.

o Libertad de elección del encuestador bajo los límites de las características de control: posibles problemas:

Entrevistar a amigos o conocidos: la muestra reproduce un perfil similar al entrevistado, introduciendo sesgo en la información.

Recurrir a lugares públicos o frecuentados para “completar las cuotas”: problema: el tipo de personas que frecuenta estos lugares tiene características distintas a los que no lo hacen.

Elegir barrios o comunidades accesibles y poco conflictivos: sesgo de más representación de determinadas clases sociales.

Page 4: TEMA 5 Muestreo La selección de las unidades

- Controles para evitar inconvenientes:o Seguir un sistema de rutas aleatoriaso Seguir un sistema de selección por áreas urbanas y geográficas.

Los controles para evitar introducir la intencionalidad del entrevistador, en términos rigurosamente técnicos no se pueden estimar los errores de muestreo, y esto es lo que diferencia a un muestreo por cuotas de un muestreo probabilístico estratificado. Si se consigue salvar esta dificultad técnica, es posible utilizarlo como sustituto de éste:

- Tiene menor coste porque simplica la selección geográfica y la dispersión de la muestra.

1.3. Muestreo intencional- Estrategia válida para muestras pequeñas y muy específicas.- Consiste en seleccionar casos por la información, especializada o por experiencia, que

poseen para estudiarlos en profundidad.- Son especialmente útiles en la caracterización de formas o perfiles sociales - No son adecuados para la cuantificación de la distribución de una variable- Se basa en el criterio de saturación para introducir elementos en las muestras.

Tipos de muestreo intencional:1.3.1. Muestreo de casos extremos

Elementos o casos cuyos valores se encuentran en los extremos del rango de una variable. Ej.: los valores extremos de la variable autoubicación ideológica: Extrema izquierda y extrema derecha.

1.3.2. De casos poco usuales o raros Elementos o casos cuyos valores en el rango de una variable son poco frecuentes o raros. Ej: afectados por enfermedades raras, ganadores de premios importantes en la lotería.

1.3.3. De casos con máxima variación Casos que presenten entre sí grandes diferencias en cuanto al objeto de estudio, para que puedan estudiarse en profundidad las características de los mismos. Ej: Personas que tiene confesiones religiosas muy diferentes.

1.3.4. De subgrupos homogéneos Caso o sujetos con experiencia social o condiciones sociales similares. Ej: líderes de movimientos sociales

1.3.5. Estructurales Casos o sujetos que ocupan determinadas posiciones sociales, normalmente forman parte de redes jerárquicas o de comunicación. Se considera que por la posición social que ocupa, el acceso a la información y a la reflexión sobre la misma será diferente que el resto de población que no ocupa determinada posición, siempre en relación con el objeto de estudio.

1.3.6. De informantes estratégicos Compuesto del estructural y homogéneo, se basa en la idea de que el conocimiento y la información está desigualmente distribuido. Los elementos seleccionados serán los que mayor información posean y ésta sea relavante para los objetivos de la investigación

1.3.6.1. De bola de nieve o en cadena Empleado para acceder a poblaciones de difícil acceso, apoyándose en informantes iniciales que aporten información sobre otros informantes relevantes, formando una “bola de nieve, cada vez más grande” o una “cadena” de informantes.

1.3.6.2. De expertos Utilizado para pedir la opinión cualificada de personas que son consideradas expertas en el tema en cuestión, seleccionándolas entre otras personas expertas o lugares clave.

Page 5: TEMA 5 Muestreo La selección de las unidades

1.3.7. De criterio Consiste en seleccionar elementos que se ajusten a un criterio predeterminado en los objetivos de la investigación. Ej: haber formado parte de un plan regional de integración socio-laboral.

1.3.8. De casos críticos Selección de elementos que sirvan de referencia lógica para el resto de la población. Ej: inmigrantes que deciden ir a otros países en condiciones muy precarias.

1.3.9. De casos confirmatorios y contradictorios Selección de casos que sirvan para confirmar o contradecir algunas de las generalizaciones o ayudar a plantear hipótesis, una vez que la investigación ya está avanzada.

2. MUESTREO PROBABILÍSTICO

El muestreo probabilístico posee una potencialidad muy especial dentro de la Investigación Científica. Para ello la herramienta fundamental es la estadística inferencial. Tal y como expresa “El propósito principal de los métodos estadísticos es legitimar generalizaciones sobre poblaciones usando datos de muestras”. No es habitual emplear censos, en los cuales la estadística adecuada es la descriptiva. Ciertamente, una media obtenida de una muestra tiene un margen de error, un intervalo de confianza dentro del cual se encuentra probablemente el valor real de la población.

Cuando se aplica la técnica de encuesta a una muestra de población implica: - identificar una población, - determinar el diseño de una muestra, - seleccionar una muestra representativa, - obtener datos de esa muestra, - grabarlos y tratarlos estadísticamente para su análisis de forma que puedan efectuarse

inferencias sobre el conjunto de la población.

La ventaja del muestreo probabilístico reside en su capacidad para estimar el posible error que afecte a la medición (estimado muestral) en su intención de determinar el valor del parámetro poblacional. A cambio de eso el muestreo probabilístico está sujeto a fuertes restricciones técnicas, que son las que permiten que estadísticamente exista un aval respaldando los resultados de una encuesta. - En ese sentido, el muestreo aleatorio simple, por ejemplo, que es el menos complejo

teóricamente hablando es, en un sentido práctico, el más difícil de utilizar. Esto quiere decir que la teoría del muestreo se complicará en tanto en cuanto intente formular estrategias que sean útiles en la práctica para la investigación.

El hecho básico es que la teoría del muestreo, en sus nociones centrales, es bastante asequible, y las complejidades que llega a adquirir son precisamente consecuencia de la diferencia entre la sociedad real y una situación experimental (ej. Bombo de la lotería). Una estrategia complicada de muestreo probabilístico acostumbra a ser la respuesta a que la realidad social lo es aún más. - Si existiera un ordenador accesible que contuviera el censo de población, y de modo rápido y

económico pudiese extraer muestras aleatorias, los problemas serían exclusivamente de tipo económico para recoger dichas muestras. Cada elemento muestral tendría nombre y dirección, y la extracción sería directa.

Esta situación ideal no existe, y lo que se hace es emplear datos agregados del censo, o del padrón municipal, para el diseño de la muestra y recurrir a mecanismos probabilísticos para

Page 6: TEMA 5 Muestreo La selección de las unidades

la solución final. Queremos, en este sentido concluir con una idea que no por conocida parece ser fácil de aceptar por algunos investigadores: la complejidad de los diseños maestrales responde a problemas reales de investigación. En otras palabras, toda esa complejidad está en definitiva intentando superar las dificultades de selección muestral en determinadas circunstancias.

Lo habitual es que el muestreo esté integrado en una estrategia más amplia de investigación y, evidentemente, hay otras decisiones que influirán en el tipo de muestra que se efectúe. Entre esas decisiones se encuentra el factor económico.

El diseño muestral que se elija tiene, generalmente, una gran dependencia de los recursos económicos de que se dispone. Así pues, el diseño muestral forma parte de un proceso de investigación en el que se integra, donde existe un tema de estudio, unas técnicas de aplicación para los instrumentos de recolección de datos y una población sobre las que aplicarlo.

Vamos a considerar el muestreo en dos apartados. El primero está referido a - Los aspectos donde el investigador debe tomar decisiones sobre las limitaciones que la

realidad impone sobre un diseño basado en muestras. Aquí y sobre estos aspectos, el investigador adquiere un claro conocimiento de la capacidad de inferencia de las mediciones que realice. Ej: una encuesta por internet

- Las cuestiones estadísticas, relacionadas con el diseño formal de la muestra . Aquí las decisiones están muy codificadas, en el sentido de que las preguntas y opciones de respuesta están consideradas de forma sistematizada por la estadística inferencial.

El punto de partida para afrontar un diseño muestral es definir cuál es la población a estudiar. Este concepto de “población” es empleado en un sentido técnico indicando la totalidad de los elementos en estudio o “universo”.

Por “elemento” se entiende la unidad de análisis. La unidad de análisis no tiene que estar compuesta por individuos, sino que puede tratarse de otros tipos, por ejemplo instituciones, textos, etc.

Es fundamental una buena definición de la población de acuerdo a los objetivos del estudio, dado que los resultados que se obtengan dependerán directamente de ello.

- Cuando se habla de población general, se entiende que la población sobre la que se efectúa el estudio está compuesta por hombres y mujeres de más de 18 años de edad, que habitan dentro de un área geográfica definida. Este tipo de población general es bastante empleado en los estudios de opinión pública.

- Otro ejemplo son los estudios sobre la juventud, que acostumbran a emplear un tramo de edad más corto, entre 15 y 29 años, por ejemplo.

- Los estudios de fecundidad definen otro tipo de población específica (mujeres en edad fértil)

- Etc.

Hay que recordar que se excluyen - Los ingresados en Prisiones, Hospitales, Cuarteles.- Los que se encuentran de viaje en el extranjero.- Determinados segmentos sociales: clase alta y baja.- ...

Se pueden seguir enumerando los elementos excluidos en la práctica de la población, pero lo importante es evaluar en qué grado su presencia o no presencia puede afectar al estudio.

Cuando la población ha sido definida, es el momento de afrontar la tarea de obtener una

Page 7: TEMA 5 Muestreo La selección de las unidades

muestra de ella. La cuestión central de cualquier diseño muestral es cómo seleccionar aquellos elementos de la población que van a formar parte de la muestra. Es decir, la extracción del elemento (individuo, institución, etc.) que va a facilitar la información. Si el criterio de selección es probabilístico, cada elemento de la población posee una probabilidad conocida y diferente de cero para ser incluido en la muestra. La consecuencia de esto es que se evitan los sesgos de selección y es factible emplear la teoría estadística para considerar las propiedades de los estimados.

Una vez definida la población que va a ser objeto de muestreo, necesitamos alguna forma de identificar a los elementos que forman parte de la población. A esto se le denomina “marco muestral”. Deming (1960) define el “marco muestral” como el “conjunto de materiales físicos (censos, mapas, listas, directorios, archivos) que nos permite dar cuenta del universo pieza a pieza”. Sin embargo, el “marco muestral” está en relación al diseño de muestra que se elija. Así, en un muestreo polietápico, es evidente que la lista que se posea en la primera etapa no será la de las unidades de análisis que, al final, son el objeto del estudio.

Existen dos formas de construir un “marco muestral”, que coinciden con los dos modos de definir en lógica un conjunto (o subconjunto). - Hacer u obtener un listado con todos los elementos.- Proveer de una regla para identificarlos. Listar todos los elementos no siempre es posible y

muchas veces es una opción más positiva, en la medida en que los elementos puedan ser identificados, el generar una regla para localizar y seleccionar los casos.

En el caso que se posea un listado con todos los elementos de la población, ese constituirá el “marco muestral”.

El poseer un buen marco muestral que facilite como mínimo de un medio para identificar y localizar los elementos, así como el modo en que esté organizada esta información, tiene una influencia sustancial en el diseño muestral.

La calidad de la información que constituye el marco muestral es esencial para un muestreo eficaz y fiable. Los problemas más frecuentes que pueden aparecer en un marco muestral son los considerados por Kish (1965):

1.- Elementos perdidos

- Un marco muestral inadecuado puede serlo porque la intención con la que se genera ese marco muestral no pretendía abarcar a toda la población que va a ser objeto de estudio- Un marco muestral puede ser incompleto, porque aunque pretenda abarcar a toda la población falle en el intento.

Es más fácil localizar un marco muestral inadecuado que uno incompleto, y las posibles soluciones son más viables para el primer caso.

Los elementos perdidos constituyen un problema bastante serio, pues esos casos no poseen ninguna probabilidad de estar incluidos en la muestra, con lo que ésta dejará de ser representativa de la población.

En ocasiones es posible evitar el problema de los elementos perdidos redefiniendo la población de forma que los incluya. Esto es fácil de hacer en el caso de los marcos muestrales inadecuados, aunque se trata de una solución bastante imperfecta. Se debe intentar completar el marco muestral recurriendo a otras posibles fuentes alternativas, si bien, esto nos llevará a la posible duplicación de elementos.

2.- Elementos extrañosLos listados o datos estadísticos pueden recoger elementos que no estén incluidos en la población objeto del estudio, con lo que afectarán al proceso de diseño muestral.

Page 8: TEMA 5 Muestreo La selección de las unidades

3.- AgrupacionesLos datos excesivamente agregados de algunos listados pueden ocasionar problemas de selección de la muestra.

4.- Duplicaciones

Los elementos pueden aparecer duplicados por encontrarse en diferentes listados, lo que incrementa su posibilidad de ser seleccionado para la muestra.

Se debe intentar la mayor coincidencia entre el “marco muestral” y la población objeto de estudio, dado que, estrictamente hablando, sólo pueden efectuarse inferencias sobre elementos presentes en el marco muestral.

El principio a respetar es que la muestra sea representativa, lo que significa que todos los elementos que componen la población tienen una probabilidad conocida e independiente de formar parte de la muestra. - En una muestra aleatoria, y, por tanto, representativa, la probabilidad de seleccionar a un

elemento es la misma que la de seleccionar a cualquier otro. - En segundo lugar, la probabilidad de seleccionar a un elemento debe ser independiente de

que se elija a cualquier otro. Es decir, la extracción de un elemento no condiciona las probabilidades de que otro sea elegido.

En la práctica, un muestreo aleatorio puede operativizarse de varias formas:la más tradicional es la utilización de la tabla de números aleatorios, es decir, una lista de dígitos “ordenados” aleatoriamente del 0 al 9.

Muestreo Aleatorio Simple

- Marco muestral: Listado de estudiantes de la Universidad de Alicante: Ej.: 33.200o 1º.- Asignamos un número a cada uno de ellos.o Después tomamos una tabla de números aleatorios y decidimos en qué dirección la

vamos a leer (de izquierda a derecha, comenzando hacia arriba, de derecha a izquierda, en diagonal, etc):

Page 9: TEMA 5 Muestreo La selección de las unidades

o Se toma un número de inicio cualquiera, por ejemplo, última columna derecha, y se comienza a utilizar número aleatorios sucesivos hacia abajo, tal y como van apareciendo.

09117, 10402, 33764, 74397, 10877, 39885, 07439,… hasta completar el tamaño de “n”, por ejemplo si n=500, se seleccionarán de esta forma 500 números, una vez descartados los que exceden de N (en amarillo), que es = 33.200

Muestreo aleatorio sistemático Es similar al anterior, pero se diferencia en que sólo se extrae al azar la primera unidad.- La primera unidad extraída al azar debe ser inferior al coeficiente de elevación (N/n, el tamaño

del universo dividido por el tamaño de la muestra).- El resto de unidades se obtiene sumando a esta primera cifra el coeficiente de elevación, y

sucesivamente al resultado se le va sumando el coeficiente de elevación. Ej. Si tuviéramos una población de 1000 alumnos y queremos seleccionar una muestra de 100 alumnos para hacer una encuesta y aplicamos un muestreo sistemático, dividiremos 1000 entre 100 y el coeficiente de elevación sería 10.

Page 10: TEMA 5 Muestreo La selección de las unidades

- Mediante una tabla de números aleatorios o cualquier otro procedimiento seleccionaríamos un número de 1 a 10, y el que salga sería la primera cifra a la que se irá sumando el coeficiente de elevación. Ej.: si sale el 5, el siguiente sería 15, 25, 35, 45,…

Muestreo aleatorio estratificado Se clasifican las unidades en un número reducido de grupos (estratos) a partir de su similitud, dictada por las características del marco muestral. La intención es que cada estrato esté representado en la muestra final.- Debe existir información sobre las variables de estratificación en el marco muestral.- Las variables de estratificación tienen que tener relación con los objetivos de la investigación.- Si estratificamos por más de una variable, conviene que la primera sea la de más importancia

para los objetivos de la investigación, la segunda variable de estratificación, sea la segunda en importancia, y así sucesivamente.

- Las variables más habituales en ciencias sociales son sexo y edad, pero también está la ocupación, el nivel de estudios, y en estudios de territorios amplios se suele estratificar por áreas geográficas menores (comarca, provincia, comunidad autónoma por tipo de hábitat (rural, urbano, semiurbano), tamaño de hábitat, etc.

Muestreo aleatorio por conglomerados

Se selecciona la población en grupos igual que en el estratificado, pero hay diferencias básicas:-

Estratficado Conglomerados- Se busca la homogeneidad

dentro de los estratos y la heterogeneidad entre los estratos.

- Se selecciona aleatoriamente una muestra para cada estrato.

- La unidad de muestreo son los individuos.

- se busca que cada conglomerado internamente sea heterogéneo, pero que los diferentes conglomerados se parezcan entre sí, ya que se necesita que cada uno de los conglomerados sea una representación lo más ajustada posible a la variedad de componentes del universo

- Se extrae una muestra aleatoria de conglomerados y sus integrantes conformarán la muestra final.

- La unidad de muestreo es el conglomerado o conjunto de individuos o elementos.

Los conglomerados suelen ser:- Unidades geográficas (secciones censales, distritos, municipios, comarcas, provincias,

comunidades autónomas)- Organizaciones, instituciones (colegios, hospitales, unidades administrativas)

El muestreo por conglomerados se recomienda:- cuando se hacen estudios de ámbito estatal o internacional, en los que la muestra puede

quedar dispersa, - cuando se quiere reducir la duración y el coste de la investigación,- cuando no se tienen claras las unidades últimas,

Page 11: TEMA 5 Muestreo La selección de las unidades