técnicas de análisis para el uso de resultados de ... · particulares de la variable aleatoria...
TRANSCRIPT
Técnicas de análisis para el uso de
resultados de encuestas y estudios
aplicados al VIH/sida
Por: Prof. Elena del C. Coba
Encuestas y estudios aplicados al
VIH/sida
Definir la fuente de los datos:
Datos primarios: Tienen vínculo directo entre investigación y recolección.
Datos secundarios: No existe vínculo entre su uso y el proceso de recolección.
¿Qué se necesita para hacer un
buen análisis?
Contar con información… ….de calidad
Conocer el diseño del estudio / muestreo
Conocer cómo se expresan las variables o indicadores
Conocer qué preguntas se desean contestar
Conocer cómo construir los indicadores
Si hay preguntas con hipótesis, conocer la prueba estadística a emplear
Contar con información de calidad
◦NO CONTAR CON:
Errores de campo
Errores al momento de
digitar
Valores extremos
Errores de campo
Verificar y/o conocer cómo se llevó a
cabo la recolección o levantado de
información (datos).
◦ ¿se han minimizado los posibles errores
por:
Sesgo de selección?
Se pierde validez externa
Sesgo de medición? se pierde validez interna
Validación de instrumentos
Capacitación / estandarización de personal
O ¿se espera encontrar estos errores?
Errores en digitación
El error humano se da!!!, asumir
lo contrario es un error!!
Estos se pueden CONTROLAR
y CORREGIR
◦ Se controlan a través del software
◦ Se corrigen a través de un doble
ingreso y validación
Limpieza de datos
Dos objetivos:
◦ Corregir o identificar errores provenientes de campo
◦ Corregir o identificar casos extremos (outliers)
¿qué pasa si no se pueden corregir?
◦ Se eliminan, lo cual disminuye el tamaño de muestra, aumentando el error en las estimaciones y se disminuye el poder estadístico en pruebas de hipótesis
Conocer las variables / indicadores
¿Diferencia entre variable e indicador?
◦ Variable: >>> definiciones <<<:
Es lo qué se mide en el sujeto de estudio
◦ Indicador: Se caracteriza por tener una meta y usarse para comparar poblaciones, puede ser o construirse con:
Una variable
Más de una variable (índices, tasas, prevalencias, etc)
El tipo de variable o indicador orienta el análisis estadístico. Tipo de escala
Conocer las variables / indicadores
¿El indicador se construye con una o más de una variable?
◦ ¿se cuenta con todas las variables?
◦ ¿conoce cómo se relacionan las variables para construir el indicador?
¿El indicador requiere de un denominador? Todas las tasas, prevalencias, porcentajes requieren de denominador. ¿se cuenta con el denominador?
Tipos (escala) de variables (indicadores)
Categóricas
nominal Sexo: masculino, femenino
ordinal Nivel socioeconómico:
Bajo, Medio y Alto
Numéricas
de intervalo
Temperatura, calificación de examen, etc.
Estatura, peso, distancia, etc. de razón
o relación
Número de hijos por familia, etc. absoluta
Variables Escala de
medición Ejemplos
¿Qué queremos conocer o responder con esa base
de datos y esas variables o indicadores?
Y / o
Para contestar
Conocer el diseño del estudio / muestreo
¿Es necesario / se puede desagregar la información?
¿Existen variables confusoras? ¿se cuenta con información de las
mismas?
¿Queremos conocer cómo ésta se relaciona con,
por ejemplo, la educación de las personas?
¿Solamente queremos conocer cuál es la
prevalencia de VIH?
Técnicas de análisis de datos
a)Técnicas de análisis cualitativo
b)Técnicas de análisis cuantitativo
Técnicas de análisis cualitativo
a)Categorización (Los datos se revisan y
se reducen a unidades llamadas
categorías)
a)Análisis de contenido (permite la
descripción de la información a través de
variables pre definidas en el estudio.
Permite cuantificar datos cualitativos.
Nudist)
Clasificación de los diseños de investigación
Según los objetivos: Descriptivos, de asociación o analíticos
Según la participación del investigador: Observacionales e experimentales
Otras clasificaciones: Transversales y longitudinales
Prospectivos (Cohorte única y Cohortes) y Retrospectivos (Caso control y Cohorte histórica)
Diseño del estudio / muestreo
El análisis estadístico debe realizarse de acuerdo con el diseño del estudio / muestreo
De no tomarse en cuenta el diseño la información del análisis estaría sesgada, perdiéndose la validez interna del estudio. ◦ Por ejemplo: un diseño de muestreo para estimar
la prevalencia de VIH, que utiliza conglomerados y que se analiza como un diseño de muestreo simple aleatorio.
◦ Otro ejemplo: Un diseño longitudinal, de seguimiento, obliga a calcular la diferencia o cambio en indicadores a través de las personas, no de las poblaciones.
Variables de diseño
Cuando se tiene un diseño de muestreo que no es simple aleatorio se necesita definir/calcular variables de diseño: ◦ Estrato. Variable que identifica la
estratificación
◦ Conglomerado. Variable que identifica el conglomerado primario de muestreo.
◦ Ponderación. Variable que asigna un peso a cada observación de acuerdo con su probabilidad de selección (ponderación = 1 / prob de selección).
Cuando aplica: ◦ Variables para identificar sub poblaciones y/o
tratamientos / cohortes
¿VARIABLES CONFUSORAS?
Son variables que por su asociación con la variable dependiente (o respuesta), esconden la relación que existe entre la variable respuesta y otras variables de interés.
Por ejemplo: se desea establecer si un proyecto educativo tuvo éxito en dar conocimientos con respecto al VIH. Se cuenta con personas participantes y no participantes. Una variable confusora puede ser el nivel de educación de la persona. Si esta variable no se toma en cuenta al momento del análisis, se puede concluir erróneamente.
PREGUNTAS EN INVESTIGACIÓN
Asunto Pregunta
Anormalidad ¿El sujeto está bien o enfermo?
Diagnóstico ¿Cuán confiables son las pruebas para diagnosticar
la condición?
Frecuencia ¿Qué tan común es la enfermedad?
Riesgo ¿Qué factores aumentan el riesgo de enfermar?
Pronóstico ¿Cuáles son las consecuencias de enfermar?
Tratamiento ¿Cómo cambia un tratamiento el curso de la enfermedad?
Prevención ¿Una intervención en personas sanas evita la enfermedad?
Costos ¿Cuál intervención hace un mejor uso de los
recursos?
DISEÑOS MÁS APROPIADOS PARA
LAS PREGUNTAS DE INVESTIGACIÓN Pregunta Diseño
1. Descripción Estudio observacional descriptivo
2. Causalidad Ensayo controlado aleatorio
Cohortes
Casos y controles Revisión sistemática
3. Intervenciones Ensayo controlado aleatorio
Revisión sistemática
4. Pruebas diagnósticas Evaluación con “patrón de oro”
Revisión sistemática
5. Pronóstico Cohorte
Revisión sistemática
6. Evaluación económica Costo – efectividad
Costo – beneficio
Costo – utilidad
Técnica de análisis cuantitativo Usos Descripción Técnicas
Describir variables Caracterizar una muestra variable
por variable
Distribución de frecuencias
Porcentajes
Promedios, desviación estándar
Gráficos (de barra, de sectores, histogramas)
Comparar grupos Se compara la diferencia entre
grupos de la muestra según las
variables seleccionadas
T de student
Análisis de varianzas
Kruskall-Wallis
Gráficos de barras múltiples
Analizar la relación entre
variables
Determinar la relación entre 2 o
más variables
R de Pearson
R de Spearman
Chi-Cuadrado
Análisis de regresión (lineal, logística,
multinominal)
Análisis de correspondencia
Grafico de dispersión
Analizar la validez Analizar la validez de constructo de
los instrumentos de medición
Análisis factorial
Análisis de Clusters o conglomerados
Escalamiento multidimensional
Procesamiento y análisis
Dependiente Independiente
Univariado: 1 0
Bivariado: 1 1
Multivariado: 1 2 ó más
Tipos de análisis estadístico
(según el número y tipo de variables)
Análisis Descriptivo
Es dar a conocer los valores de tendencia central de la población a través de la muestra: media, mediana, porcentaje
Es importante dar a conocer los valores que miden la variabilidad: varianza, desviación estándar, error estándar, coeficiente de variabilidad.
Y, mejor aún: Intervalo de confianza
El análisis descriptivo se hace para toda la población y para las sub poblaciones o estratos (siempre y cuando sea factible)
Este análisis también es el primer paso de un estudio inferencial
Análisis inferencial
Requiere de una hipótesis
No confundir la hipótesis de investigación con las hipótesis estadísticas (nula y
alterna)
Los estudios en VIH y las hipótesis
◦ La mayoría de los estudios son descriptivos tipo encuesta, sin embargo hay
ocasiones en que se desea contestar alguna pregunta, por ejemplo:
¿Ha disminuido la prevalencia de VIH?
¿Hay mayor conocimiento sobre cómo se previene el VIH?
¿Es igual la prevalencia de VIH entre la población Maya y la Garífuna?
¿Es igual la prevalencia de VIH entre personas con baja o ninguna educación y
personas que tienen regular o alta educación?
Para contestar las preguntas se puede necesitar de uno o más
indicadores (variables)
Dado que la mayoría de estudios se hacen con muestras independientes
entre si, la prueba de hipótesis más útil es la que se conoce como de
“una población”:
◦ Ho: P = Po
◦ Ho: m = mo
¿Cómo se prueba esa hipótesis en forma
rápida y sencilla?
Se hace uso del intervalo de confianza. Por ejemplo:
En el país de Liliput se midió la prevalencia de VIH hace
5 años, siendo la misma de un 8.7%. El Fondo Global
/USAID / ONUSIDA, etc, invirtieron en prevención.
Ahora se llevó a cabo un nuevo estudio para conocer si
la prevalencia había cambiado, y el resultado obtenido
fue de 7.5%, con un intervalo de confianza de 7.0% a
8.0%.
Y si el intervalo hubiera sido de 6.0% a 9.0%, ¿qué
concluimos?
Para cada diseño y tipo de variable hay pruebas estadísticas
para contestar las preguntas varios cursos de estadística.
Resumen de algunas pruebas más utilizadas
Análisis Paramétricas
El análisis paramétrico presuponen distribuciones particulares de la variable aleatoria cuantitativa, o bien sus hipótesis especifican parámetros o distribuciones. Por esto la estadística que se usan con más frecuencia son las estadísticas paramétricas.
Estas técnicas se basan en especificar una forma de distribución de la variable aleatoria y de los estadísticos derivados de los datos.
Y permiten confirmar resultados o valorar las inconsistencias de ellos.
¿Cuáles son los supuestos de las estadísticas
paramétricas?
1. La distribución poblacional de la variable dependiente es normal: el universo tiene una distribución normal.
2. El nivel de la medición de la variable dependiente es por intervalo o razón
3. Cuando dos o más poblaciones son estudiadas, éstas tienen una varianza homogénea, es decir:
4. Las poblaciones en cuestión tienen una dispersión similar en sus distribuciones
¿Cuáles son los métodos o pruebas estadísticas
paramétricas más utilizadas?
Coeficiente de Correlación de Pearson y la regresión lineal
Prueba “ z” y “t ”
Prueba de contraste de la diferencia de proporciones
Análisis de varianza unidireccional (ANOVA Oneway)
Análisis de varianza factorial (ANOVA)
Análisis de covarianza (ANCOVA)
Análisis No Paramétricos
Una alternativa en la solución de problemas son los métodos no paramétricos o de distribución libre, los cuales no exigen supuestos tan numerosos ni severos y son aplicables a cualquier variable, en particular a las de tipo nominal u ordinal así como a distribuciones diversas
¿Cuáles son las presuposiciones de la
estadística no paramétrica?
La mayoría de estos análisis no requieren de presupuestos acerca de la forma
de la distribución poblacional. Aceptan distribuciones no normales
Las variables no necesariamente deben de estar medidas en un nivel por
intervalos o razón, pueden analizarse datos nominales u ordinales
Sí se quiere análisis no paramétricos a datos por intervalos o razón, estos
deben ser resumidos en categoría discretas. Las variables deben ser
categóricas
Ventajas e Inconvenientes:
Con n muy pequeña, inconsistente, no tabulada (n>5-6) desventaja.
A veces es compleja, no aparece siempre en los programas informáticos estandar
(desventaja), pero suele ser más sencilla de aprender y aplicar incluso de forma manual.
La interpretación suele ser más directa.
Cómo se aplican estas pruebas:
Aplicar una transformación a los datos originales, convertiéndolos en rangos, valores positivo o negativo, etc.
Con los datos transformados, calcular un estadístico en base a los datos (a veces también se calcula su promedio y error estándar)
Con el estadístico y los parámetros calculados, realizar una prueba de hipótesis de acuerdo a una cierta distribución paramétrica (Normal, Ji-cuadrado, Binomial, etc.)
Análisis temporal
¿Cómo varían las condiciones en el
tiempo?
◦ Epidemiológicas
◦ Discriminación y estigma
◦ Provisión / acceso a servicios
Comparación con márgenes
mínimos y máximos
Índices de series de tiempo
Regresiones
Análisis espacial
Distribución territorial de las características observadas
“Mapeo” de problemas versus mapeo de las respuestas sociales ¿coinciden?
Mejoras en la disponibilidad territorial de datos
Representatividad departamental de las encuestas
Dirige los esfuerzos y recursos hacia donde son más necesarios