errores no muestreo

Post on 25-Jul-2015

38 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Errores de no muestreo en estadistica inferencial

TRANSCRIPT

Errores de no muestreo

Enrique Alfonso Guzmán PetoCarlos Ernesto López Natarén

Pierluigi Calia Cerrillo

Desarrollo Histórico•Imperio Romano, Egipcio (1700-1900)

• Uso de encuestas en el estudio de problemas sociales (marginación, encarcelamiento,etc.)

•Moser y kalton (1972), Warwick (1975) (referencias bibliográficas sobre historia de encuestas)

•Kruskal y Mosteller (1980) (desarrollo de la idea de muestra representativa)

El muestreo generalmente se hace con encuestas, los resultados de estas son afectados por numerosos errores que provienen de diferentes fuentes.

Las posibles fuentes de errores en el transcurso de la colecta de los datos estadísticos son las imprecisiones de las observaciones, interpretación, instrumentos de medición, procesamiento de los datos y el análisis.

Por errores de no muestreo nos referimos a la entidad de todos los errores que provienen de fuentes diferentes a la selección de la muestra.

Generalmente se piensan que son debidos enteramente a las equivocaciones y deficiencias durante el desarrollo y la ejecución los procedimientos de la encuesta. Se dice que se generan de definiciones concebidas erróneamente, imperfecciones en los planes de tabulación y la incapacidad para obtener respuesta en todos los miembros de la muestra.

Un diseño perfecto, perfectamente implementado sería libre de los errores de no muestreo.

¡Pero esto no siempre sucede en la vida real!

Los errores de no muestreo son difíciles de estimar en contraste con los errores de muestreo, no hay técnicas de estimación exacta.

Además de que hay muchos casos ambiguos en donde no es fácil decidir si algún error es debido al muestreo u otros factores.

Hay todavía una discusión en proceso para determinar las fuentes de errores de no muestreo, pero básicamente se habla de tres fuentes principales de errores de no muestreo:

Errores de marco muestral

Errores de no respuesta

Errores de medición

Errores de marco muestral

Definición de marco de muestreo

Definiciones para marco de muestreo

Estructuras de marcos de muestreo

Tipos de errores de marco

El marco juega un rol fundamental en el muestreo, este es una población finita de unidades a las cuales el mecanismo de muestreo probabilístico le es aplicado, la población de las unidades del marco no son necesariamente equivalentes a la población para las cuales la información es recolectada.

La construcción del marco de muestreo puede ser una de las tareas más difíciles que los diseñadores del muestreo tienen que afrontar.

… este consiste en los materiales, procedimientos y dispositivos que identifican, distinguen y permiten el acceso a los elementos de la población objetivo. El marco está compuesto por un conjunto finito de unidades a las cuales se les aplica el esquema de muestreo probabilístico.

Las reglas y mecanismos para ligar a las unidades del marco con elementos de la población de interés son una parte integral del marco.

Este también incluye información auxiliar (mediciones de tamaño, información demográfica) que se usa para técnicas especiales de muestreo como la estratificación y probabilidad proporcional al tamaño ó técnicas especiales de estimación como estimadores de razón o estimación de regresión.

Definiciones básicas de los marcos de muestreo

La población objetivo es una población finita de elementos identificables

El muestreo es llevado a cabo en algunos conjuntos de unidades, pero estos conjuntos no necesariamente son la población objetivo.

Algún mecanismo debe existir para ligar a la población objetivo y el conjunto que es muestreado.

Para ser capaz de colectar información de los elementos, debe ser posible localizar y distinguirlos entre ellos.

Puede existir más de un tipo de liga entre los elementos objetivo y el conjunto de muestreo. Estas ligas determinan el tipo de diseño de muestra y los procedimientos de estimación que pueden ser usados en la encuesta.

Algunos diseños de muestra y procedimientos de estimación requieren información auxiliar sobre los elementos de la población. Esta información debe ser conocida por cada miembro de la población objetivo.

Estructuras de marcos

Uno a uno

Cada unidad de marco muestral es asociada con un único elemento poblacional y cada elemento poblacional es asociado a un marco muestral.

Ejemplo: La lista del padrón electoral

Uno a muchos

Las unidades del marco muestral pueden estar asociados con más de un elemento poblacional, y cada elemento poblacional es asociado con una única unidad del marco muestral.

Ejemplo: Lista de unidades habitacionales

Muchos a uno

Cada unidad de marco muestral está asociada con un elemento poblacional, y cada elemento poblacional puede estar asociado con muchas unidades muestrales.

Ejemplo: Una lista de contadores en un banco para muestrear a clientes en un banco.

Muchos a muchos

Cada unidad del marco muestral puede estar asociado con muchos elementos poblacionales y cada elemento poblacional puede estar asociado a muchas unidades del marco muestral.

Ejemplo: Dueños de granjas y granjas

Tipos de errores debidos al marco muestral

Elementos de la población no presentes

No poder ligar algunos miembros de la población de interés con el marco es quizá el más serio error de marco muestral porque no puede ser encontrado y se descarta de la muestra o el marco y puede introducir un sesgo.

Tratamiento: Se puede tratar de estimar la subcobertura mediante algunos modelos.Y se pueden usar múltiples marcos.

Inclusión de elementos que no son de la población de interés

El marco muestral también podría contener elementos que no son parte de la población objetivo. Si este error no es corregido, los totales serían sobreestimados y otras estadísticas serían sesgadas.

Prevención: tratar de reconocerlos y eliminarlos al momento de hacer la encuesta. También se puede cuantificar con modelos el sesgo que está introduciendo.

Problemas de multiplicidad

Los elementos de la población objetivo podrían estar ligados a más de una unidad de marco muestral.

Tratamiento: Para determinar correctamente la probabilidad de inclusión de los elementos muestrales sería necesario conocer cuantas veces un elemento muestral está asociado con el marco muestral o remover las asociaciones múltiples antes de sacar la muestra, también se puede usar el ordenamiento, definir una única regla de conteo, redefinir la población objetivo, introducir un nuevo nivel de muestreo.

Información auxiliar incorrecta

Muchos marcos contienen información auxiliar usada para muestreos y técnicas de estimación especiales, tales como información usada para estratificar, medidas de tamaño usado para probabilidad proporcional al tamaño de muestra y características altamente correlacionadas con las variables de interés de la encuesta las cuales pueden ser usadas para la estimación de razón y estimación.

Acceder a información incorrecta

Los marcos obsoletos o imprecisos pueden llevar a información sobre los elementos que no permita su localización, similar al problema de no encontrar una liga.

Tratamiento: Si es posible tratar de actualizar el marco de muestreo, si no entonces usar ese y pensar que es una aproximación inexacta, hay modelos que permiten cuantificar el sesgo.

Uso inadecuado de marcos conglomerados

A menudo, las unidades de marco de muestreo representan conglomerados de elementos de la población objetivo, si un elemento se saca del conglomerado sin modificar al tamaño del conglomerado las estimaciones serán erróneas.

Tratamiento: Hansen et al. (1953a) sugiere que si un elemento ha sido medido para un conglomerado y el tramaño de los conglomerados puede ser determinado, las mediciones para los elementos deberían ser ponderadas al tamaño del conglomerado.

No respuesta

No Respuesta: Panorama General

1) Antecedentes y Terminología

2) Efectos estadísticos del problema

3) Tratando con el problema

1) No respuesta: Antecedentes y Terminología

i. Actividades de encuesta relacionadas con la no respuesta

ii. Terminología

iii. Razones de no respuesta

i) Actividades relacionadas con la no respuesta

a) Locación

b) Solicitud

c) Colección de datos

ii) Terminología

a) La noción de no respuesta

b) Medidas relativas asociadas

c) Sesgo asociado

iii) Razones de no respuesta

a) No elegibilidadb) No solicitado c) Solicitado pero indispuestod) Solicitado pero no disponiblee) Otras razones

2) No respuesta: Efectos Estadísticos del Problema

i. Perspectiva deterministica de la no respuesta

ii. Perspectiva estocástica

iii. Efecto en los errores de encuesta cuando se estiman medias y totales

i. Perspectiva deterministica

Asume que los miembros de la población están seguros de responder ó no; por lo que la decisión de respuesta es predeterminada en cada miembro de la muestra.

ii. Perspectiva estocástica

Se relacionan las características de la encuesta con la probabilidad de respuesta y el tamaño de la colectividad.

iii. Efectos en los errores de encuesta cuando se estiman parámetros

Los efectos de no respuesta siempre influyen en los parámetros a estimar, sin embargo estos pueden clasificarse, medirse e incluso minimizarse.

3) Tratando con el problema

i. Unidad de no respuesta

ii. Métodos para tratar con la no respuesta

iii. Selección de Método

i) Unidad de no respuesta

a) Maximizar la unidad de respuesta

b) Usar métodos compensatorios

ii) Métodos para tratar la no respuesta

a) Preventivos

b) Compensatorios

a) Métodos preventivos

1) Tipo de pregunta

2) Interfase para la captura de datos

3) Diseño de cuestionarios

b) Métodos compensatorios

1) Mean value

2) Regresión

3) Imputación deductiva

4) Imputación por rastreo

iii) Selección de método

a) Combinar métodos

b) Cualquier método implica asumir un riesgo

ERRORES DE MEDICIÓN

DEFINICION DE MEDICIÓN

“La estimación de la magnitud de algunos atributos de un objeto, como su longitud o peso, en relación con una unidad de medida”.

Stevens: “La asignación de números a los objetos de acuerdo a una regla - cualquier regla”.

ESCALAS DE MEDICIÓNESCALAS DE MEDICIÓN NOMINAL ORDINAL INTERVALO RAZON

Nota : El concepto de medición se confunde a menudo con la cuenta.

El Método de Medición

El proceso de Medición

MEDICIÓNMEDICIÓN

El método de medición adoptado por la encuesta esta definido por una definición operativa.

El método de medición se desarrolla para la encuesta considerando que de un resultado que se acerque mas a lo que se espera utilizando la definición operativa.

El método de medición adoptado por la encuesta no esta definido por una definición operativa.

MÉTODO DE MEDICIÓNMÉTODO DE MEDICIÓN

- Moser and Kalton (1972).

- Dalenius (1974).

PROCESO DE MEDICIÓNPROCESO DE MEDICIÓN

El error de medición es la diferencia entre las mediciones de la misma cantidad sobre el mismo objeto. Para cuantificar el error de medición, es necesario realizar diferentes mediciones en varios objetos.

DEFINICION DE ERROR DE MEDICIÓN

DEFINICION DE ERROR DE MEDICIÓN

Cada vez que se repite una medición con uninstrumento, obtendremos valores ligeramente diferentes debido a dos tipos de errores:

- Error Sistemático

- Error Aleatorio

TIPOS DE ERROR DE MEDICIÓN

TIPOS DE ERROR DE MEDICIÓN

Existen dos tipos diferentes de relacionar el error de medición con el concepto de valor verdadero:

- Considera que la existencia del valor verdadero sea independiente de las condiciones de la encuesta.

- Considera que el valor verdadero o el valor preferido esta relacionado con las condiciones de la encuesta.

ERROR Y VALOR VERDADERO

ERROR Y VALOR VERDADERO

Existen dos métodos para cuantificar el error:

- “Record check studies”, en el que una fuente de registros está revisada por las unidades de una submuestra incluidas en la encuesta.

- “Resurveys”, en el que las unidades de una submuestra son medidas de nuevo utilizando métodos más precisos.

METODOS PARA CUANTIFICAR EL ERROR

METODOS PARA CUANTIFICAR EL ERROR

Una fuente de error en un “record check study” es el hecho de no asociar correctamente los valores de la encuesta con los valores medidos de nuevo. Esta situación puede darse debido a que la información de identificación no es suficiente para realizar una comparación de datos, o a causa de errores cometidos durante el resurvey.

FUENTES DE ERRORESFUENTES DE ERRORES

Neter y Waksberg (1964) elaboraron un diseño experimental para estimar el sesgo, en el cual los datos que pueden ser razonablemente considerados con un sesgo pequeño (en la red) son comparados con los datos que tienen un sesgo mas grande. Tres fuentes de error en una encuesta de gastos se consideraron.

ESTUDIOS SOBRE FUENTES DE ERROR ESTUDIOS SOBRE

FUENTES DE ERROR

- Telescópico

- Acondicionado

- Pérdida de llamada de efecto

ESTUDIOS SOBRE FUENTES DE ERROR ESTUDIOS SOBRE

FUENTES DE ERROR

Para reducir los varios tipos de errores de no muestreo sedeberá utilizar métodos para verificar la calidad durante

lafase de: - Planificación

- Desarrollo del listado de direcciones

- Recopilación de datos

- Actividades de procesamientos de datos

REDUCCION DE ERRORES DE NO MUESTREO

REDUCCION DE ERRORES DE NO MUESTREO

En el censo de la década 1990 en USA, se intentó

entrevistar a cada una de las más de 100 millones de familias de esa nación.

Para evitar la ausencia de respuestas, Dillman propuso la iteración de tres factores

CASOS PRACTICOS CASOS PRACTICOS

En las empresas de Investigación de mercados se produce estos tipos de errores cuando el

entrevistado da una respuesta errónea, con intención o sin ella, o

cuando elencuestador interpreta o transcribe mal su

respuesta,influye en la respuesta del entrevistado o la

pregunta esmal interpretada.

CASOS PRACTICOS CASOS PRACTICOS

En los datos categóricos en los cuales no es significativo

hablar de la desviación del valor observado respecto el

valor real; sólo podemos decir que algunas respuestas son

buenas o malas. Y la desviación X puede interpretarse y

considerarse como una medida de respuestade error.

OBSERVACION OBSERVACION

En general, la medición de los errores ajenos al muestreo

(incluido los que pueden producirse en la fase del procesamiento de los datos) es considerada una

actividad difícil debido a la existencia de una diversidad

amplia de causas que generan este tipo de errores, la

inexistencia de procedimientos estándar de medición, el alto costo

de la información extramuestral para implementar procedimientos no estándares, entre otros.

CONCLUSIONES CONCLUSIONES

Por ello, en la práctica, siempre se ha puesto énfasis

para reducir su magnitud por medio de controles de calidad en todas las fases de ejecución de la

encuesta.

CONCLUSIONES CONCLUSIONES

Conclusiones

Un error de muestreo y de no muestreo ocurre cuando existen discrepancias entre lo esperado y lo observado

Diferenciar errores de muestreo y de no muestreo.

Un perfecto diseño implementado estará libre de errores de no muestreo, pero eso no siempre es posible.

Conclusiones

No subestimar los errores de no muestreo

La mejor manera de controlar los errores de no muestreo es llevar a cabo una planeación idónea en las actividades propias de una encuesta, selección de la muestra y análisis de resultados

Bibliografía

Non sampling error in surveys. Judith T. Lessler, William D. Kalsbeek.

Sampling and non sampling errors in survey. A Marton (seminar “Quality indicators in surveys and census”)

top related