técnicas de análisis para el uso de resultados de ... · particulares de la variable aleatoria...

33
Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida Por: Prof. Elena del C. Coba

Upload: tranphuc

Post on 05-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Técnicas de análisis para el uso de

resultados de encuestas y estudios

aplicados al VIH/sida

Por: Prof. Elena del C. Coba

Encuestas y estudios aplicados al

VIH/sida

Definir la fuente de los datos:

Datos primarios: Tienen vínculo directo entre investigación y recolección.

Datos secundarios: No existe vínculo entre su uso y el proceso de recolección.

¿Qué se necesita para hacer un

buen análisis?

Contar con información… ….de calidad

Conocer el diseño del estudio / muestreo

Conocer cómo se expresan las variables o indicadores

Conocer qué preguntas se desean contestar

Conocer cómo construir los indicadores

Si hay preguntas con hipótesis, conocer la prueba estadística a emplear

Contar con información de calidad

◦NO CONTAR CON:

Errores de campo

Errores al momento de

digitar

Valores extremos

Errores de campo

Verificar y/o conocer cómo se llevó a

cabo la recolección o levantado de

información (datos).

◦ ¿se han minimizado los posibles errores

por:

Sesgo de selección?

Se pierde validez externa

Sesgo de medición? se pierde validez interna

Validación de instrumentos

Capacitación / estandarización de personal

O ¿se espera encontrar estos errores?

Errores en digitación

El error humano se da!!!, asumir

lo contrario es un error!!

Estos se pueden CONTROLAR

y CORREGIR

◦ Se controlan a través del software

◦ Se corrigen a través de un doble

ingreso y validación

Limpieza de datos

Dos objetivos:

◦ Corregir o identificar errores provenientes de campo

◦ Corregir o identificar casos extremos (outliers)

¿qué pasa si no se pueden corregir?

◦ Se eliminan, lo cual disminuye el tamaño de muestra, aumentando el error en las estimaciones y se disminuye el poder estadístico en pruebas de hipótesis

Valores extremos

¿Qué son?

Se asumen?

No se toman en cuenta?

Conocer las variables / indicadores

¿Diferencia entre variable e indicador?

◦ Variable: >>> definiciones <<<:

Es lo qué se mide en el sujeto de estudio

◦ Indicador: Se caracteriza por tener una meta y usarse para comparar poblaciones, puede ser o construirse con:

Una variable

Más de una variable (índices, tasas, prevalencias, etc)

El tipo de variable o indicador orienta el análisis estadístico. Tipo de escala

Conocer las variables / indicadores

¿El indicador se construye con una o más de una variable?

◦ ¿se cuenta con todas las variables?

◦ ¿conoce cómo se relacionan las variables para construir el indicador?

¿El indicador requiere de un denominador? Todas las tasas, prevalencias, porcentajes requieren de denominador. ¿se cuenta con el denominador?

Tipos (escala) de variables (indicadores)

Categóricas

nominal Sexo: masculino, femenino

ordinal Nivel socioeconómico:

Bajo, Medio y Alto

Numéricas

de intervalo

Temperatura, calificación de examen, etc.

Estatura, peso, distancia, etc. de razón

o relación

Número de hijos por familia, etc. absoluta

Variables Escala de

medición Ejemplos

¿Qué queremos conocer o responder con esa base

de datos y esas variables o indicadores?

Y / o

Para contestar

Conocer el diseño del estudio / muestreo

¿Es necesario / se puede desagregar la información?

¿Existen variables confusoras? ¿se cuenta con información de las

mismas?

¿Queremos conocer cómo ésta se relaciona con,

por ejemplo, la educación de las personas?

¿Solamente queremos conocer cuál es la

prevalencia de VIH?

Técnicas de análisis de datos

a)Técnicas de análisis cualitativo

b)Técnicas de análisis cuantitativo

Técnicas de análisis cualitativo

a)Categorización (Los datos se revisan y

se reducen a unidades llamadas

categorías)

a)Análisis de contenido (permite la

descripción de la información a través de

variables pre definidas en el estudio.

Permite cuantificar datos cualitativos.

Nudist)

Clasificación de los diseños de investigación

Según los objetivos: Descriptivos, de asociación o analíticos

Según la participación del investigador: Observacionales e experimentales

Otras clasificaciones: Transversales y longitudinales

Prospectivos (Cohorte única y Cohortes) y Retrospectivos (Caso control y Cohorte histórica)

Diseño del estudio / muestreo

El análisis estadístico debe realizarse de acuerdo con el diseño del estudio / muestreo

De no tomarse en cuenta el diseño la información del análisis estaría sesgada, perdiéndose la validez interna del estudio. ◦ Por ejemplo: un diseño de muestreo para estimar

la prevalencia de VIH, que utiliza conglomerados y que se analiza como un diseño de muestreo simple aleatorio.

◦ Otro ejemplo: Un diseño longitudinal, de seguimiento, obliga a calcular la diferencia o cambio en indicadores a través de las personas, no de las poblaciones.

Variables de diseño

Cuando se tiene un diseño de muestreo que no es simple aleatorio se necesita definir/calcular variables de diseño: ◦ Estrato. Variable que identifica la

estratificación

◦ Conglomerado. Variable que identifica el conglomerado primario de muestreo.

◦ Ponderación. Variable que asigna un peso a cada observación de acuerdo con su probabilidad de selección (ponderación = 1 / prob de selección).

Cuando aplica: ◦ Variables para identificar sub poblaciones y/o

tratamientos / cohortes

¿VARIABLES CONFUSORAS?

Son variables que por su asociación con la variable dependiente (o respuesta), esconden la relación que existe entre la variable respuesta y otras variables de interés.

Por ejemplo: se desea establecer si un proyecto educativo tuvo éxito en dar conocimientos con respecto al VIH. Se cuenta con personas participantes y no participantes. Una variable confusora puede ser el nivel de educación de la persona. Si esta variable no se toma en cuenta al momento del análisis, se puede concluir erróneamente.

PREGUNTAS EN INVESTIGACIÓN

Asunto Pregunta

Anormalidad ¿El sujeto está bien o enfermo?

Diagnóstico ¿Cuán confiables son las pruebas para diagnosticar

la condición?

Frecuencia ¿Qué tan común es la enfermedad?

Riesgo ¿Qué factores aumentan el riesgo de enfermar?

Pronóstico ¿Cuáles son las consecuencias de enfermar?

Tratamiento ¿Cómo cambia un tratamiento el curso de la enfermedad?

Prevención ¿Una intervención en personas sanas evita la enfermedad?

Costos ¿Cuál intervención hace un mejor uso de los

recursos?

DISEÑOS MÁS APROPIADOS PARA

LAS PREGUNTAS DE INVESTIGACIÓN Pregunta Diseño

1. Descripción Estudio observacional descriptivo

2. Causalidad Ensayo controlado aleatorio

Cohortes

Casos y controles Revisión sistemática

3. Intervenciones Ensayo controlado aleatorio

Revisión sistemática

4. Pruebas diagnósticas Evaluación con “patrón de oro”

Revisión sistemática

5. Pronóstico Cohorte

Revisión sistemática

6. Evaluación económica Costo – efectividad

Costo – beneficio

Costo – utilidad

Técnica de análisis cuantitativo Usos Descripción Técnicas

Describir variables Caracterizar una muestra variable

por variable

Distribución de frecuencias

Porcentajes

Promedios, desviación estándar

Gráficos (de barra, de sectores, histogramas)

Comparar grupos Se compara la diferencia entre

grupos de la muestra según las

variables seleccionadas

T de student

Análisis de varianzas

Kruskall-Wallis

Gráficos de barras múltiples

Analizar la relación entre

variables

Determinar la relación entre 2 o

más variables

R de Pearson

R de Spearman

Chi-Cuadrado

Análisis de regresión (lineal, logística,

multinominal)

Análisis de correspondencia

Grafico de dispersión

Analizar la validez Analizar la validez de constructo de

los instrumentos de medición

Análisis factorial

Análisis de Clusters o conglomerados

Escalamiento multidimensional

Procesamiento y análisis

Dependiente Independiente

Univariado: 1 0

Bivariado: 1 1

Multivariado: 1 2 ó más

Tipos de análisis estadístico

(según el número y tipo de variables)

Análisis Descriptivo

Es dar a conocer los valores de tendencia central de la población a través de la muestra: media, mediana, porcentaje

Es importante dar a conocer los valores que miden la variabilidad: varianza, desviación estándar, error estándar, coeficiente de variabilidad.

Y, mejor aún: Intervalo de confianza

El análisis descriptivo se hace para toda la población y para las sub poblaciones o estratos (siempre y cuando sea factible)

Este análisis también es el primer paso de un estudio inferencial

Análisis inferencial

Requiere de una hipótesis

No confundir la hipótesis de investigación con las hipótesis estadísticas (nula y

alterna)

Los estudios en VIH y las hipótesis

◦ La mayoría de los estudios son descriptivos tipo encuesta, sin embargo hay

ocasiones en que se desea contestar alguna pregunta, por ejemplo:

¿Ha disminuido la prevalencia de VIH?

¿Hay mayor conocimiento sobre cómo se previene el VIH?

¿Es igual la prevalencia de VIH entre la población Maya y la Garífuna?

¿Es igual la prevalencia de VIH entre personas con baja o ninguna educación y

personas que tienen regular o alta educación?

Para contestar las preguntas se puede necesitar de uno o más

indicadores (variables)

Dado que la mayoría de estudios se hacen con muestras independientes

entre si, la prueba de hipótesis más útil es la que se conoce como de

“una población”:

◦ Ho: P = Po

◦ Ho: m = mo

¿Cómo se prueba esa hipótesis en forma

rápida y sencilla?

Se hace uso del intervalo de confianza. Por ejemplo:

En el país de Liliput se midió la prevalencia de VIH hace

5 años, siendo la misma de un 8.7%. El Fondo Global

/USAID / ONUSIDA, etc, invirtieron en prevención.

Ahora se llevó a cabo un nuevo estudio para conocer si

la prevalencia había cambiado, y el resultado obtenido

fue de 7.5%, con un intervalo de confianza de 7.0% a

8.0%.

Y si el intervalo hubiera sido de 6.0% a 9.0%, ¿qué

concluimos?

Para cada diseño y tipo de variable hay pruebas estadísticas

para contestar las preguntas varios cursos de estadística.

Resumen de algunas pruebas más utilizadas

Análisis Paramétricas

El análisis paramétrico presuponen distribuciones particulares de la variable aleatoria cuantitativa, o bien sus hipótesis especifican parámetros o distribuciones. Por esto la estadística que se usan con más frecuencia son las estadísticas paramétricas.

Estas técnicas se basan en especificar una forma de distribución de la variable aleatoria y de los estadísticos derivados de los datos.

Y permiten confirmar resultados o valorar las inconsistencias de ellos.

¿Cuáles son los supuestos de las estadísticas

paramétricas?

1. La distribución poblacional de la variable dependiente es normal: el universo tiene una distribución normal.

2. El nivel de la medición de la variable dependiente es por intervalo o razón

3. Cuando dos o más poblaciones son estudiadas, éstas tienen una varianza homogénea, es decir:

4. Las poblaciones en cuestión tienen una dispersión similar en sus distribuciones

¿Cuáles son los métodos o pruebas estadísticas

paramétricas más utilizadas?

Coeficiente de Correlación de Pearson y la regresión lineal

Prueba “ z” y “t ”

Prueba de contraste de la diferencia de proporciones

Análisis de varianza unidireccional (ANOVA Oneway)

Análisis de varianza factorial (ANOVA)

Análisis de covarianza (ANCOVA)

Análisis No Paramétricos

Una alternativa en la solución de problemas son los métodos no paramétricos o de distribución libre, los cuales no exigen supuestos tan numerosos ni severos y son aplicables a cualquier variable, en particular a las de tipo nominal u ordinal así como a distribuciones diversas

¿Cuáles son las presuposiciones de la

estadística no paramétrica?

La mayoría de estos análisis no requieren de presupuestos acerca de la forma

de la distribución poblacional. Aceptan distribuciones no normales

Las variables no necesariamente deben de estar medidas en un nivel por

intervalos o razón, pueden analizarse datos nominales u ordinales

Sí se quiere análisis no paramétricos a datos por intervalos o razón, estos

deben ser resumidos en categoría discretas. Las variables deben ser

categóricas

Ventajas e Inconvenientes:

Con n muy pequeña, inconsistente, no tabulada (n>5-6) desventaja.

A veces es compleja, no aparece siempre en los programas informáticos estandar

(desventaja), pero suele ser más sencilla de aprender y aplicar incluso de forma manual.

La interpretación suele ser más directa.

Cómo se aplican estas pruebas:

Aplicar una transformación a los datos originales, convertiéndolos en rangos, valores positivo o negativo, etc.

Con los datos transformados, calcular un estadístico en base a los datos (a veces también se calcula su promedio y error estándar)

Con el estadístico y los parámetros calculados, realizar una prueba de hipótesis de acuerdo a una cierta distribución paramétrica (Normal, Ji-cuadrado, Binomial, etc.)

Análisis temporal

¿Cómo varían las condiciones en el

tiempo?

◦ Epidemiológicas

◦ Discriminación y estigma

◦ Provisión / acceso a servicios

Comparación con márgenes

mínimos y máximos

Índices de series de tiempo

Regresiones

Análisis espacial

Distribución territorial de las características observadas

“Mapeo” de problemas versus mapeo de las respuestas sociales ¿coinciden?

Mejoras en la disponibilidad territorial de datos

Representatividad departamental de las encuestas

Dirige los esfuerzos y recursos hacia donde son más necesarios