comisión asesora de til seminarios-talleres …...bioestadistica aplicación de la estadística a...
TRANSCRIPT
Universidad Nacional de Córdoba
Facultad de Ciencias Médicas
Escuela de Nutrición
Comisión Asesora de TIL
Seminarios-Talleres Seminarios-Talleres
ESTADÍSTICA Y BIOESTADÍSTICA
Dra. María del Pilar Díaz
Dra. Laura R. Aballay
Dra. Sonia A. Pou
1
•La pregunta de investigación: líneas de estudio en el campo de la Nutrición.
•Conceptos claves en Bioestadística, aplicaciones.
•Estadística Descriptiva: tablas y gráficos, medidas resúmenes (usos e
interpretaciones).
•Estadística Inferencial: generalidades, ejemplos de aplicación de análisis
estadísticos clásicos.
2
•Reflexión sobre sus propios trabajos de investigación.
Típicas preguntas en el área de las
Ciencias de la Salud y la Nutrición
�Cómo estimamos las concentraciones de minerales en muestras reales de alimentos?
�Las tendencias en las prevalencias de obesidad dependen del estrato urbano, de la edad,
del sexo o de la actividad física?
�Cómo pueden identificarse factores de riesgo en el destete precoz de lactantes en una
ciudad?
3
ciudad?
�Cómo influye la depresión en la presencia de trastornos en la alimentación? Existe
asociación entre anorexia y estrato social?
�Cuál es la aceptación de un nuevo producto alimentario lanzado al mercado?
� Otras...... Cuáles?
� TIL ??
4
Ciencia y
Tecnología de los
Alimentos
Nutrición y
Salud Humana
Algunos conceptos claves …
Introducción
5
Concepto clave: DATOS
Resultados numéricos, medidas u observaciones obtenidas a partir de una investigación
con el objetivo de responder a una cuestión.
Ejemplos: niveles de colesterol en sangre; hábito de fumar; sexo; talla; estado
nutricional, etc.nutricional, etc.
BIOESTADISTICA
Aplicación de la Estadística a las Ciencias Biológicas, Medicina, Salud Pública y
demás áreas de la Salud para trabajar con esos datos
6
Concepto clave: VARIABLE
Cualquier característica cuyo valor o modalidad cambia entre los objetos de una
población.
Variables cualitativas o Variables cuantitativas
7
Variables cualitativas o
categóricas
•Nominales
•Ordinales•Discretas
•Continuas
Variables cuantitativas
Concepto clave: POBLACIÓN
Conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se
desea estudiar un determinado fenómeno.
Elementos? Qué significa?Elementos? Qué significa?
Propiedades? Cuáles son?
Fenómeno? Cuándo? Dónde?
8
Concepto clave: MUESTRA
Subconjunto de la población que es estudiado y a partir del cual se extraen
conclusiones acerca de las características de la población.
Subconjunto? Cómo lo defino?
Conclusiones sobre la población?
9
INFERENCIA
Extraer conclusiones sobre características de la población con base en el estudio de
solamente una parte de ella.
Estadística Descriptiva
10
Estadística Descriptiva
Estadística Inferencial
Población
Parámetros
Muestra
Estadísticos / Estimadores
Se desea investigar la relación entre estudiantes becados y su desempeño académico.
Se desea conocer los hábitos alimentarios de la población de adultos mayores del estrato
social bajo del país.social bajo del país.
Una fábrica de envases desea estimar el porcentaje de éstos que salen defectuosos al
mercado. Para eso analiza los envases producidos por la fábrica en una hora.
11
Estadística Descriptiva y Análisis
Exploratorio
12
Dado un conjunto de datos de una variable X,
la Estadística Descriptiva estudia
procedimientos para sintetizar la información que contienen.
Descripción basada en
Métodos gráficos
y tabular:
•Tablas
•Gráficos
Medidas resumen
numéricas:
•Medidas de posición
o tendencia central
•Medidas de dispersión
Descripción basada en
Descripción de datos basada en
métodos gráficos y tabular
La presentación de un conjunto de datos suele hacerse indicando los valores o categorías
de la variable y sus frecuencias de aparición, tanto en términos absolutos como relativos.
• Frecuencia - el número de veces que el valor ocurre en los datos.• Frecuencia - el número de veces que el valor ocurre en los datos.
• Frecuencia acumulada - es el número de observaciones que son iguales o menores que el valor.
• Frecuencia relativa - es el % de veces que el valor ocurre (frecuencia/N).
• Frecuencia relativa acumulada - es el % de la muestra que es igual o menor que el valor
(frecuencia acumulada /N).
Consumo de bebidas alcohólicas
Hombres Mujeres TOTALNro % Nro % Nro %
Frecuencia de consumo de bebidas alcohólicas según sexo en adultos de la
ciudad X, Provincia de Córdoba, Argentina. Año 2012.TÍTULO
MATRIZ O
MOLDE
Tablas de contingencia
bebidas alcohólicas Nro % Nro % Nro %
Ingesta nula 12 25,0 9 37,5 21 29,2
< 10 vasos por semana
17 35,4 6 25,0 23 31,9
> 10 vasos por semana
19 39,6 9 37,5 28 38,9
TOTAL 48 100 24 100 72 100
Fuente: Estudio sobre factores de riesgo cardiovasculares, FCM, UNC, 2012.
TOTALES
CUERPO
FUENTE
Métodos Gráficos
La distribución de frecuencias es ilustrada mediante gráficos, considerando para su elección
el tipo de variable representada
Variables cualitativas/categóricas:Variables cualitativas/categóricas:
Diagrama de barras
Diagrama de sectores
Variables cuantitativas:
*Discretas: *Continuas:
Diagrama de barras Histograma
Gráfico de bastones Polígono de frecuencias
Gráfico a escalones Gráfico Boxplot
0
5
10
15
20
25
30
(120 , 150] (150 , 180] (180 , 210] (210 , 240] (240 , 270]
N°
de
obse
rva
cio
nes
mg %
Niveles de colesterol en sangre en hombres de más de 50 años en la ciudad de Córdoba en el año 2007
0
5
10
15
20
25
30
0 1 2 3 4
N°d
e m
uje
res
Cantidad de consultas al ginecólogo en un año
Nº de consultas al ginecólogo por año, de mujeres de 20 a 60 años de la ciudad de Córdoba, en el año 2007
Escolaridad de los trabajadores de la Empresa XX de la ciudad de Córdoba, en el
año 2005
127
Peso en relación a la circunferencia de cintura
17
Primario completo
25%
Secundario Completo
45%
Universitario30%
año 2005
61 69 77 85 94
circunferencia de cintura (cm)
66
81
97
112
Pe
so (k
g)
Boxplot
Es un gráfico que muestra los cuartiles de un conjunto de datos, como asi también el rango. Valores
extremos grandes o pequeños son también identificados.
6,00
08,
000
Val
or e
nerg
étic
o to
tal (
Cal
/día
)
18
02,
000
4,00
06,
000
Val
or e
nerg
étic
o to
tal (
Cal
/día
)
Controles Casos
Tablas y Gráficos
• Es una presentación compacta de los datos.
• Apariencia visual.
• Las tablas son mejores para mostrar los valores exactos númericos, los datos
19
• Las tablas son mejores para mostrar los valores exactos númericos, los datos
con menor frecuencia y/o otro tipo de comparaciones.
• Los gráficos son mejores para resaltar la calidad de los aspectos cualitativos de
los datos y mostrar gran cantidad de datos.
Media Media
Medidas de tendencia central o posición
Descripción de datos basada en
cálculo de medidas resumen
Promedio.Media Media
MedianaMediana
ModaModa
Mitad de los valores están por debajo de la mediana y mitad
por encima.
Valor más frecuente en la muestra.
Promedio.
VarianzaVarianza
Medidas de dispersión
Descripción de datos basada en
cálculo de medidas resumen
Nos muestran cuanto distan en promedio los valores
Desvío Desvío estándar estándar
Rango Rango intercuartilicointercuartilico
Nos muestran cuanto distan en promedio los valores
de la variable con respecto a la media.
Longitud del intervalo que contiene al 50% central de
los datos.
Estadística Descriptiva
Objetivo:
Resumir información empírica.
Metodología:
•Gráficos y Tablas
Estadística
Inferencial
Objetivo:
En base a los datos de la muestra,
extraer conclusiones acerca de la
población.
22
•Gráficos y Tablas
•Cálculo de medidas resumen (de
tendencia central y dispersión)Metodología:
•Muestreo
•Estimación de Parámetros
•Prueba de Hipótesis
•Análisis de Relaciones
MUESTREO
Es el proceso por el cual puede conocerse algo acerca de una población en base a
una muestra obtenida de ella.
MUESTREO
23
PROBABILISTICO
ALEATORIO SIMPLE
ALEATORIO SISTEMÁTICO
ALEATORIO ESTRATIFICADO
POR CONGLOMERADOS
NO PROBABILISTICO
POR CONVENIENCIA
POR CUOTAS
MUESTREO
PROBABILISTICO NO PROBABILISTICO
24
Muestras aleatorias.
Los sujetos se seleccionan con base en probabilidades conocidas.
Garantizan la representatividad de la población.
Mediante técnicas no aleatorias se obtienen muestras no necesariamente
representativas de una población.
Más económicas y sencillas.
MUESTRAS PROBABILISTICAS
Muestra aleatoria simple (M.A.S):
Cada sujeto tiene la misma oportunidad de selección que cualquier otro sujeto.
25
Sobre una población finita determinada (de tamaño N conocido) se realizan extracciones al
azar de n elementos para conformar la muestra.
Muestreo Estratificado Aleatorio:
Estratificar?
1ro. Definir agrupamientos o estratos homogéneos en toda la población (de acuerdo a la
información existente respecto de alguna característica de interés).
2do. Tomar una m.a.s. dentro de cada estrato
Para qué?
26
Ejemplo: Se desea estimar la proporción de los niños en edad escolar que sufren cierta enfermedad
(parasitosis) en Córdoba.
(Sería importante conocer si hay diferencias entre los que tienen
hasta 10 años aún no cumplidos y los que tiene 10 o más años).
Para qué?
Asegurar la cobertura completa de todos los tipos de sujetos en la población.
Muestreo por Conglomerado:
Se usa por razones de costos o de practicidad.
Selección de la muestra tomando como base del muestreo subconjuntos de unidades
(conglomerados) de una población, de forma tal que hay:
• heterogeneidad entre las unidades dentro de un mismo conglomerado
• homogeneidad entre conglomerados.
27
• homogeneidad entre conglomerados.
Ejemplo: Se desea estimar la producción de soja en un departamento de la Pcia. de Córdoba.
Necesidad: visitar una gran cantidad de campos. Hacer un M.A.S.?
Dividir el departamento en áreas (conglomerados),
seleccionar al azar algunos de ellos y luego censar.
Muestreo Sistemático
Para aplicarlo es necesario seleccionar aleatoriamente
un “arranque”, que determina el primer elemento de la
muestra (sea el elemento a) y luego , sin efectuar nuevas
selecciones al azar, se incorporan a la muestra nuevos
elementos a + k, a+2k, a +3k, etc.
28
elementos a + k, a+2k, a +3k, etc.
Ese numero k se denomina “intervalo de muestreo”.
Ejemplo: Estudios de alimentación seleccionados los sujetos por sus historias clínicas, de un
fichero.
ESTIMACIÓN DE PARÁMETROS
Estimación por Intervalo: procedimiento mediante el cual se puede afirmar, con
una determinada probabilidad, que cierto intervalo (o rango de valores) encierra el
verdadero valor del parámetro.
29
Ejemplos…
�Con un 95% de confianza se puede concluir que los adolescentes de la Escuela X pasan, en
promedio, entre 3 y 6 horas mirando TV.
�Con un 99% de confianza se puede afirmar que el contenido medio de sacarosa de la caña
de azúcar (variedad A) se encuentra entre 0,71 y 0,97%.
PRUEBAS DE HIPÓTESIS
•La comparación estadística de parámetros poblacionales, mediante la formulación
de hipótesis, permite evaluar con rigor científico los resultados de una
investigación:
¿Los resultados del estudio son sólo efecto de diferencias casuales entre los grupos
de una muestra, o bien, si reflejan verdaderas diferencias en la población?
30
de una muestra, o bien, si reflejan verdaderas diferencias en la población?
Ej: Test T, Diferencia de proporciones, etc.
Ejemplos. Pruebas de hipótesis
�Un investigador supone que las personas con niveles altos de colesterol, luego de aplicada una dieta
específica, disminuirá dichos niveles, alcanzando el valor recomendado.
Prueba de hipótesis (1 población) para la media de una variable aleatoria con distribución
Normal
�Se desea conocer si la proporción de sujetos con sobrepeso en dos localidades son diferentes.
31
Prueba de hipótesis (2 poblaciones) para la diferencia de proporciones de dos distribuciones
binomiales independientes.
Prueba de hipótesis (2 poblaciones) para la diferencia de Medias de dos variables aleatorias
independientes con Distribuciones Normales
�Se desea comparar la cantidad de cenizas (minerales) en dos variedades de dulce de leche fabricados
en dos cuencas lecheras distintas.
OTROS ANÁLISIS…
Test de Chi-cuadrado: Prueba si existe asociación entre dos variables cualitativas.
�¿La desnutrición en la edad escolar está asociada con el nivel de instrucción materno?
32
Análisis de Regresión :Estudia la relación entre dos variables, pudiendo estimarse en
cuánto se puede esperar que se modifique una si se modifica el valor de la otra.
�En un estudio se desea cuantificar la relación que existe entre el peso de nacimiento y la
ganancia de peso de la madre en el octavo mes de embarazo.
OTROS ANÁLISIS…
Análisis de correlación: Mide la fuerza y la dirección de la relación lineal entre dos
variables cuantitativas.
�¿Existe correlación entre el grosor del pilegue tricipital y el del pliegue subescapular?
�¿El contenido de cierto micronutriente en un alimento se correlaciona con el contenido de otro
compuesto en el mismo? ¿De que manera?
33
Estimación de Riesgos: Cálculo de OR� indica la chance de ocurrencia de un evento (ej:
enfermedad) según la exposición o no a cierto “factor de riesgo”.
�En un estudio epidemiológico se desea conocer si las personas con alta ingesta de fructosa
presentan un riesgo incrementado de padecer diabetes tipo II.
1. La Estadística juega un rol importante desde la concepción del estudio hasta el informe
de los resultados.
2. La Estadística permite la realización de inferencias válidas acerca de una población a
partir de muestras que están sujetas a varias fuentes de variabilidad.
En síntesis
34
partir de muestras que están sujetas a varias fuentes de variabilidad.
3. Estudios diferentes requieren abordajes estadísticos diferentes.