tesis de grado sistema analítico para la identificación y
TRANSCRIPT
TESIS DE GRADO
Sistema Analítico para la Identificación y Prevención Temprana del Hambre
Oculta en Colombia
DIEGO FERNANDO ESCOBAR TRUJILLO
Asesores:
MARÍA DEL PILAR VILLAMIL GIRALDO
ANDRÉS DARIO MORENO BARBOSA
JOHN CALVO MARTINEZ
UNIVERSIDAD DE LOS ANDES
MAESTRÍA EN INGENIERÍA DE INFORMACIÓN
BOGOTA D.C.
JUNIO, 2020
2
Dedicatoria:
A Dios, fuente y autor de todo bien, quien ha inspirado en el corazón humano el
desarrollo de esta obra y tantas otras más para el bien de cada uno de sus hijos.
¡A Él sea la honra, el honor, y la gloria por los siglos de los siglos!
3
Agradecimientos:
A mis padres Nubia Trujillo y Hernando Escobar, por cuya humildad, esfuerzo y
apoyo incondicional, me han permitido recorrer este camino y dar siempre lo mejor
de mí. A Ángela Mancipe, cuya inspiración y palabras de aliento llegaron en el
momento en que más lo necesitaba.
A mis asesores de tesis, John, Andrés y especialmente María del Pilar que con su
conocimiento y paciencia direccionaron este esfuerzo a buen término. A Elisa
Cadena, quien con una apertura única y gran experticia en la temática estuvo
siempre atenta a resolver mis inquietudes.
Y a todas las personas que, de alguna u otra manera durante este proceso han
contribuido a ser una mejor versión de mí: Compañeros de estudios, maestros,
administrativos, simplemente ¡Gracias!,
4
Contenido 1. INTRODUCCIÓN ............................................................................................................ 6
1.2 Problema .................................................................................................................. 6
1.3 Objetivos .................................................................................................................. 7
2 CONTEXTO .................................................................................................................... 8
2.1 Ciencia de Datos ...................................................................................................... 8
2.2 Desnutrición Oculta.................................................................................................. 9
2.3 Diagnóstico del hambre oculta .............................................................................. 11
3 ESTADO DEL ARTE DE LA DESNUTRICIÓN POR MICRONUTRIENTES ............... 13
3.1 Observaciones sobre los estudios analizados y diferencias sobre el enfoque de
esta investigación ............................................................................................................. 18
4 ESTUDIO DEL HAMBRE OCULTA EN COLOMBIA ................................................... 20
4.1 Escenario Analítico ................................................................................................ 20
4.2 Fuentes de datos ................................................................................................... 21
4.3 Segmentación de la población .............................................................................. 22
4.4 Selección de variables de interés .......................................................................... 22
4.5 Definición de desnutrición por deficiencia de hierro en la población objetivo ...... 26
4.6 Metodología de estudio ......................................................................................... 27
4.7 Discusión e interpretación de los resultados de los modelos ............................... 28
5 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE MUJERES
GESTANTES. ....................................................................................................................... 29
5.1 Caracterización de la población ............................................................................ 29
5.2 Análisis descriptivo ................................................................................................ 31
5.3 Análisis de correlaciones ....................................................................................... 35
5.4 Regresión lineal ..................................................................................................... 37
5.5 Árbol de decisión ................................................................................................... 40
5.6 Consolidación de las variables identificadas en los modelos ............................... 43
5.7 Incidencia de las variables identificadas en el árbol de decisión ......................... 45
6 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE PRIMERA
INFANCIA. ............................................................................................................................ 51
6.1 Caracterización de la población ............................................................................ 51
6.2 Análisis descriptivo ................................................................................................ 53
6.3 Análisis de correlaciones ....................................................................................... 61
6.4 Regresión lineal ..................................................................................................... 63
5
6.5 Árbol de decisión ................................................................................................... 65
6.6 Consolidación de las variables identificadas en los modelos ............................... 69
6.7 Incidencia de las variables identificadas en el árbol de decisión ......................... 71
7. VALIDACIÓN CON LOS EXPERTOS .......................................................................... 80
7.1 Población de Mujeres Gestantes........................................................................... 80
7.2 Población de Primera Infancia ............................................................................... 81
8. CONCLUSIONES Y TRABAJOS FUTUROS ............................................................... 83
8.1 Trabajos futuros ..................................................................................................... 84
BIBLIOGRAFÍA ..................................................................................................................... 86
6
1. INTRODUCCIÓN
El hambre es una de las guerras en que la humanidad está lejos de ganar. A pesar
de los avances en el cultivo, producción y distribución de alimentos millones de
personas aún pasan hambre [1]. Muchas organizaciones y gobiernos han trabajado
con logros significativos en diversas estrategias para que el alimento llegue a más
personas, sin embargo, la magnitud de la problemática sigue sobrepasando todo
esfuerzo.
No siendo suficientemente enorme la tarea de erradicar el hambre en el mundo,
asoma un nuevo enemigo que se ha denominado “hambre oculta” [2]. Si bien ya
están ampliamente documentados los efectos en la salud y en la sociedad de una
población que pasa hambre de manera aguda o crónica, aún está por cuantificarse
el impacto real en la sociedad de las poblaciones que padecen hambre oculta, por
lo que desde ya requiere una especial atención por parte de los líderes de la
sociedad. El hambre oculta se caracteriza por la deficiencia de uno o más
micronutrientes y se ha intentado abordar a través de las mismas estrategias
utilizadas para la lucha contra el hambre pero dado que tiene características muy
particulares, estos esfuerzos para combatirlos resultan aún más ineficaces.
La presente investigación propone un nuevo enfoque basado en la ciencia de datos
que permita identificar los rasgos de la población en riesgo de padecer hambre
oculta. Este nuevo enfoque intenta ir un paso más allá de analizar la relación entre
una determinada variable y la prevalencia del fenómeno sino que intenta explicar
cómo desde un contexto socioeconómico pueden encontrarse grupos poblacionales
en riesgo que puedan ser sujeto de programas gubernamentales que permitan
intervenir y mitigar el impacto del hambre oculta en Colombia.
Por tanto, la serie de técnicas y análisis de resultados que se proponen a lo largo
de la investigación buscan direccionar de una mejor manera los recursos destinados
para abordar el problema del hambre oculta en el contexto social del país, con la
premisa general que son una herramienta más para seguir vigentes en una lucha
contra el hambre que aún se tiene pendiente por vencer.
1.2 Problema
Al igual que la desnutrición aguda o crónica, el hambre oculta está asociada a un
conjunto de variables multifactoriales cuya complejidad es ciertamente alta y
requieren un tratamiento integral lo que dificulta su adecuada gestión por parte de
los organismos y gobiernos que se proponen luchar contra estas patologías [3].
7
Por otra parte, las estrategias convencionales usadas para la lucha contra la
desnutrición en todas sus manifestaciones, si bien han mostrado resultados
esperanzadores, a hoy lucen insuficientes debido a que precisamente se enfocan
en el componente clínico de la enfermedad y su tratamiento específico relegando a
un segundo plano otros componentes que pueden tener una incidencia significativa
sobre la enfermedad.
Por tanto, en el contexto de la realidad social y cultural de Colombia el problema
radica en proveer una herramienta a los entes gubernamentales que les permita
identificar cuáles son las variables que más inciden sobre el fenómeno del hambre
oculta y así permitirles direccionar con una alta efectividad los recursos necesarios
para su intervención, a su vez que se permita identificar sectores de población
particularmente en riesgo minimizando la magnitud de la problemática y su impacto
en el país.
1.3 Objetivos
La presente investigación plantea los siguientes objetivos:
Objetivo General:
Identificar las condiciones socioeconómicas más relevantes de los sectores de la
población con mayor riesgo de exposición al hambre oculta por deficiencia de hierro.
Objetivos específicos:
a) Identificar las fuentes de datos más representativas para la construcción de
un modelo analítico.
b) Caracterizar y segmentar la población objetivo más relevante para el estudio
de la prevalencia del fenómeno del hambre oculta.
c) Identificar y comprender la relevancia de las características socioeconómicas
en el desarrollo del fenómeno del hambre oculta a través de modelos
estadísticos, descriptivos o analíticos.
8
2 CONTEXTO
Para comprender el desarrollo de presente la investigación es necesario tener
presente dos conceptos fundamentales: Ciencia de datos y Hambre Oculta. A
continuación se describe cada uno de ellos y posteriormente se mostrará cómo se
relacionan estrechamente con el fin de explicar con las herramientas dispuestas en
la ciencia de datos el fenómeno del hambre oculta en Colombia.
2.1 Ciencia de Datos
En la medida en que las tecnologías de la información se han adentrado más en la
cotidianidad y se ha hecho posible recopilar y procesar cada vez más y mejor
información, se ha hecho evidente que es un recurso de una utilidad excepcional
para analizar, interpretar y emprender acciones sobre fenómenos de una
complejidad muy alta que quizás, en otras etapas de la historia de la humanidad, no
se hubieran imaginado.
Este potencial ha emergido por medio de diversas disciplinas que han ido aportando
conocimiento a la sociedad inicialmente de manera individual, como por ejemplo,
las matemáticas, la estadística, la programación y la informática. Por tanto, no pasó
mucho tiempo para que la combinación de esas diversas disciplinas comenzaran a
ser asociadas y agrupadas bajo un nuevo término, denominado “Ciencia de datos”
que a su vez se definió como “Procedimientos para analizar datos, técnicas para
interpretar los resultados de dichos procedimientos, formas de planificar la
recopilación de datos para hacer su análisis más fácil, más preciso o acertado, y
toda la maquinaria y los resultados de las estadísticas matemáticas que se aplican
al análisis de datos.” [4]
Ha sido tan relevante el desempeño de la Ciencia de Datos para la resolución de
problemas complejos, que en el 2001 se propuso como una nueva disciplina
independiente involucrando adicionalmente la computación con datos, a través de
seis áreas técnicas concretas: investigaciones multidisciplinarias, modelos y
métodos para datos, computación con datos, pedagogía, evaluación de
herramientas, y teoría. [5]
Es por esta razón que para el desarrollo de esta investigación se involucran
especialmente esas áreas de la ciencia de datos:
Programación: Por medio de un lenguaje de programación, en este caso
Python, se codifica una serie de instrucciones de tal manera que sean
interpretables por el equipo de cómputo. De esta manera, se consigue
9
realizar una gran cantidad de cálculos en muy poco tiempo que de otra
manera no sería posible realizar.
Estadística: La estadística consiste en una serie de herramientas que
permiten analizar e interpretar un conjunto de datos determinado. A través
de estas herramientas es posible evaluar y establecer la validez de un
resultado de manera objetiva, siendo especialmente útil para concretar las
acciones a tomar sobre los datos.
Comunicación: Desde la perspectiva de la ciencia de datos, es una
habilidad que permite el trabajo armónico entre diferentes equipos o
disciplinas. Su valor radica precisamente en que no basta con las habilidades
estrictamente técnicas para tratar el fenómeno sino también con habilidades
blandas que permitan socializar los resultados y crear acciones que puedan
ser ejecutados por otros actores de la sociedad.
Conocimiento de dominio: Hace referencia a la experiencia específica en
un campo o disciplina en la sociedad. Su importancia radica en que, junto a
las habilidades analíticas, permiten entender el fenómeno a la luz de los
resultados obtenidos y proponer acciones consecuentes con la realidad del
entorno sujeto de estudio.
2.2 Desnutrición Oculta
La desnutrición crónica por ausencia de micronutrientes o hambre oculta es una
enfermedad caracterizada por la ingesta inadecuada de vitaminas y minerales cuya
carencia supone un grave riesgo para la salud especialmente en niños menores de
cinco (5) años y mujeres en estado de gestación [6]. A diferencia de otras formas
de desnutrición, el hambre oculta no presenta los síntomas o signos evidentes
relacionados con una pobre alimentación por lo que su diagnóstico frecuentemente
es tardío y se realiza cuando las consecuencias son particularmente graves.
El término hambre oculta surge precisamente porque esta enfermedad puede
presentarse en pacientes que cumplen una o varias de las siguientes condiciones:
a) No presentan signos clásicos de desnutrición, como por ejemplo, delgadez.
b) Cuentan con acceso a diversos alimentos sin restricciones de carácter
geográfico, económicas o dietarios superando incluso las porciones de
alimento diario recomendados.
c) Inclusive pueden presentar signos de obesidad.
Y aun así presentar deficiencias de micronutrientes que pueden derivar más
adelante en problemas más serios para la salud e inclusive la muerte. De hecho, la
desnutrición y el hambre oculta contribuyen a aumentar la tasa de morbilidad de
10
niños contribuyendo con hasta un tercio de las muertes infantiles, una cifra alta si
se compara con otras patologías de carácter infectocontagioso como, por ejemplo,
la malaria y la tuberculosis [7]. Esto sugiere que, en gran parte de los casos de
hambre oculta, los pacientes cuentan con un buen índice de masa corporal y una
talla adecuada (Signos clásicos de desnutrición) dificultando así su temprana
identificación y tratamiento antes de derivar en problemas más serios para la salud.
Los micronutrientes abarcan un total de 17 minerales, 14 vitaminas, 2 ácidos grasos,
17 aminoácidos, hierro, yodo y calcio [7] y aunque es claro que la deficiencia de
cualquiera de éstos componentes es diagnosticado como el desarrollo de un
proceso de desnutrición por deficiencia de micronutrientes o hambre oculta son
particularmente las vitaminas A, B, y D, y los minerales Hierro, Yodo y Zinc aquellos
que han sido catalogadas como las más relevantes para la salud pública y
relacionados directamente con diversidad de patologías entre las que se destacan
la emaciación, retraso del crecimiento, sobrepeso u obesidad, y otras enfermedades
no transmisibles relacionadas con la alimentación.
A pesar de que las vitaminas y minerales estén presentes en verduras, legumbres,
carnes y derivados lácteos, una gran cantidad de personas en todo el mundo
presenta un consumo por debajo de lo recomendado. Por lo tanto, se estima que
más de 2 mil millones de personas en todo el mundo pueden presentar hambre
oculta [2]. En ese mismo sentido, el hambre oculta no hace distinción entre los
países en vía de desarrollo y aquellos considerados como el primer mundo puesto
que impacta a todos en mayor o menor proporción debido a diversos factores
económicos y sociales afectando, de acuerdo con la Organización Mundial de la
Salud, a casi una de cada tres personas en el mundo [8].
Para el año 2016 se estimó que 1900 millones de adultos tenían sobrepeso o eran
obesos, mientras que 462 millones de personas tenían insuficiencia ponderal. 52
millones de niños menores de 5 años presentaban emaciación, 17 millones
padecían emaciación grave, y 155 millones sufrían de retraso del crecimiento,
mientras que 41 millones tenían sobrepeso o eran obesos. Alrededor del 45% de
las muertes de menores de 5 años tenían que ver con la desnutrición. En su mayoría
se registraron en los países de ingresos bajos y medianos. Al mismo tiempo, en
esos países están aumentando las tasas de sobrepeso y obesidad en la niñez [9].
En Colombia la situación, aunque ha presentado alguna mejoría, no es
particularmente alentadora. De acuerdo con la Encuesta Nacional de la Situación
Nutricional en Colombia (ENSIN) adelantado por el Instituto Nacional de Salud, solo
en menores de 5 años, 25 de cada 100 niños presenta anemia, en tanto que se
estima que aproximadamente la mitad de estos casos de anemia están relacionados
11
con la deficiencia de Hierro [10]; El país también redujo una de las manifestaciones
del hambre oculta como lo es la anemia en mujeres en edad reproductiva, al pasar
del 22,1% en el año 2012, al 21,1% en el año 2016 [11].
2.3 Diagnóstico del hambre oculta
El hambre oculta puede catalogarse en tres fases de acuerdo con su estado de
evolución:
a) Primera fase: Esta es la fase más compleja y menos diagnosticada. En tanto
que otros indicadores de salud relacionados con la alimentación pueden
estar correctos, como el peso y la talla, se caracteriza por falta de hierro que
puede derivar en algunos problemas que podrían pasar desapercibidos:
Dificultad para aprender, dificultad para recordar o solucionar problemas.
Sin embargo, la falta de hierro es especialmente crítico en el periodo de la
gestación y en la primera infancia (De cero a cinco años de edad) puesto que
en estas etapas es cuando más conexiones de carácter neurológico se
desarrollan en el cerebro humano. Es por esto, que la deficiencia de hierro
podría afectar gravemente y de por vida las capacidades cognitivas del
paciente afectado.
b) Segunda fase: Esta etapa de la enfermedad es frecuentemente
diagnosticada. Es caracterizada por la prevalencia de anemia que a menudo
conlleva a consultas médicas producto de mareos, debilidad y dolor de
cabeza. Si bien la anemia puede diagnosticarse por varias causas, puede
asociarse rápidamente al hambre oculta por la deficiencia de hierro o
ferropenia [12].
Sin embargo, es importante anotar que si bien, la deficiencia de hierro es el
indicador más veraz y efectivo para el diagnóstico clínico puede no ser el
único mineral o vitamina en carencia.
c) Tercera fase: Diagnóstico exacto por prevalencia de otras patologías. En
esta etapa, el hambre oculta se hace manifiesta en el paciente producto de
enfermedades causadas por la ausencia de micronutrientes específicos. Por
ejemplo, se requerirán exámenes más detallados para evaluar patologías
como la ceguera nocturna asociada a deficiencia de vitamina A; la
enfermedad de Beriberi asociada a la deficiencia de vitamina B1; escorbuto
relacionado con la deficiencia de vitamina C.
12
En estos casos, también se debe analizar cuidadosamente que estas
patologías estén efectivamente relacionadas con la deficiencia en el
consumo de determinados vitaminas y minerales.
13
3 ESTADO DEL ARTE DE LA DESNUTRICIÓN POR MICRONUTRIENTES
Para el desarrollo de esta investigación, se realizó una indagación sobre cómo se ha abordado la problemática de la desnutrición en el mundo a partir de herramientas de ciencia de datos y tecnologías de información y pos supuesto sobre la desnutrición del hambre oculta. Si bien la desnutrición por deficiencia de micronutrientes no es una enfermedad relativamente nueva, no se hallaron muchos estudios que articulen su prevalencia desde el punto de vista del análisis de los factores que inciden en el mismo. En la otra orilla, si existe una gran cantidad de contenido valioso de carácter más bien médico y/o clínico acerca de la desnutrición entendida como las deficiencias de peso y talla y su relación con la anemia, así como la prevalencia de anemia respecto a otras patologías, como por ejemplo, la parasitosis. A continuación, se muestran los estudios hallados más relevantes desde el punto de vista de ciencia de datos. Para cada uno de los estudios descritos se analiza detenidamente los siguientes aspectos: segmentación o clasificación de la población, fuentes de datos, metodología y resultados.
India: En India, se realizó un estudio [13] para investigar la asociación de la desnutrición con la anemia mediante la realización de análisis separados de niños menores de cinco años y mujeres en edad reproductiva utilizando datos los datos representativos de la encuesta nacional demográfica y de salud de Bangladesh de 2011. Los autores partieron de un análisis descriptivo de la información y estimaron la asociación entre la exposición al fenómeno y el resultado utilizando la prueba de Cochran-Mantel-Haenszel. Finalmente, estimaron por separado (Para los niños menores de cinco años y mujeres en edad reproductiva) modelos de regresión multivariables que se ajustaron simultáneamente para varias variables confusoras. Como resultado concluyeron una asociación entre la anemia, la desnutrición y particularmente las condiciones económicas y educativas de la madre, por lo que sugieren políticas basadas en la evidencia para combatir la anemia y las deficiencias nutricionales simultáneamente bajo un mismo programa. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción
Objetivo del estudio Investigar la asociación de la desnutrición con la anemia mediante la realización de análisis separados de niños menores de cinco años y mujeres en edad reproductiva utilizando los datos representativos de la encuesta nacional demográfica y de salud de Bangladesh de 2011.
Población objetivo Niños de edad entre 6 y 59 meses.
Mujeres en edad reproductiva
Datos Encuesta nacional demográfica y de salud de Bangladesh de 2011. Cuenta con datos de toda la
14
población clasificada en 14 estratos basados en 7 divisiones administrativas y áreas urbano-rurales. La encuesta recopila información sobre salud, nutrición e historia demográfica para hombres, mujeres y niños. En particular, se recopilaron datos sobre anemia de mujeres en edad reproductiva y niños en el grupo de edad de 6 a 59 meses a partir de un subconjunto cada tercer hogar visitado, obteniendo a partir de muestras de sangre los niveles de hemoglobina (Hb) (g / dl).
También se tomaron estudios previos socioeconómicos para examinar si los factores sociodemográficos están asociados con anemia. Estos estudios identificaron el estado socioeconómico del hogar, la inseguridad alimentaria, y ubicación geográfica como factores de riesgo.
Metodología Análisis descriptivo de la información.
Estimación de la asociación entre la exposición y el resultado mientras se controla por un único factor de confusión mediante el cálculo de las razones de probabilidades ajustadas utilizando la prueba de Cochran-Mantel-Haenszel en el análisis estratificado.
Se estiman las asociaciones entre las exposiciones y los resultados se estiman por separado para niños menores de cinco años y mujeres en edad reproductiva ajustando modelos de regresión multivariables que se ajustan simultáneamente para varias variables confusoras.
Resultados En general, la prevalencia de anemia fue notablemente alta tanto entre los niños con retraso en el crecimiento como entre las mujeres con un IMC bajo en comparación con sus contrapartes normales. Se requieren políticas basadas en la evidencia dirigidas a los grupos vulnerables para combatir la anemia y las deficiencias nutricionales simultáneamente bajo el mismo programa tales como:
Mejorar el empoderamiento y educación de la mujer.
Campañas de concientización y prevención social para reconocer tempranamente la enfermedad.
Suiza: En la Clínica de la Universidad Geriátrica de Basilea se realizó un estudio [14] para analizar la prevalencia de anemia y su asociación con el estado nutricional en población geriátrica hospitalizada utilizando datos de las historias clínicas de los pacientes. Los autores realizaron un análisis estadístico a través del método de Pearson Chi cuadrado para hallar las relaciones entre variables categóricas y a través del método Prueba U de Mann-Whitney para hallar las relaciones entre las variables continuas. Finalmente se realizó un modelo basado en regresión logística
15
multivariada para determinar qué factores se asociaron significativamente con la anemia. Como resultado, concluyeron una asociación de la anemia con marcadores de desnutrición muy significativa a pesar del tamaño de reducido de la muestra. En este caso, no se tenían marcadores de ferritina en todos los pacientes, por lo que se cree que el impacto de esta variable está subvalorado. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción
Objetivo del estudio Analizar la prevalencia de anemia y su asociación con el estado nutricional en población geriátrica hospitalizada.
Población objetivo Personas de la tercera edad hospitalizadas en el Basel Geriatric University Clinic desde 65 años. La edad media de la población objetivo es de 85 años.
Datos Historias clínicas: Se consideraron los pacientes hospitalizados por las siguientes sintomatologías: Desmayos, confusión, enfermedades graves y pérdida de independencia en las actividades diarias.
Muestras de sangre de todos los pacientes internados.
Metodología Estadístico: Los resultados de los datos obtenidos se presentaron como la mediana y rangos de valores. A través del método de chi-cuadrado de Pearson se hallaron las relaciones entre variables categóricas y a través del método Prueba U de Mann-Whitney se comprobaron las relaciones entre las variables continuas.
Se construyó un modelo basado en regresión logística multivariada con entrada variable paso a paso utilizó para determinar qué factores se asociaron significativamente con la anemia.
Resultados El principal hallazgo es una asociación de la anemia con marcadores de desnutrición muy significativa a pesar del tamaño de reducido de la muestra. Los datos obtenidos de anemia, desnutrición, la deficiencia de hierro y la inflamación crónica fueron utilizados según la disponibilidad de acuerdo con el protocolo de ingreso a hospitalización y ciertamente pueden ser criticados. Los niveles de ferritina no se determinaron en la mitad de los pacientes y, por lo tanto, la definición de deficiencia de hierro es incierto. Con base en estas premisas probablemente el estudio está subestimando en lugar de sobreestimar el impacto de deficiencia de hierro.
China: En el noroeste de China se realizó un estudio [15] para proporcionar datos para desarrollar un enfoque basado en políticas que permita controlar la anemia y la
16
desnutrición infantil en las zonas rurales de Shaanxi provincia en el noroeste de China. El estudio se centró en la población de niños de 0 a 18 meses y a partir de un cuestionario elaborado específicamente para el estudio se recopiló información sociodemográfica así como prácticas de alimentación infantil. Los autores utilizaron técnicas estadísticas como el método de Wilcoxon para probar las diferencias de la ingesta dietética y las concentraciones séricas de hierro, zinc y vitamina A entre lactantes anémicos y lactantes no anémicos. Posteriormente realizaron la prueba de Pearson Chi Cuadrado para examinar las relaciones entre desnutrición, características sociodemográficas, patrones de alimentación y anemia. Finalmente construyeron un modelo de regresión logística utilizando el grupo de infantes no anémicos como referencia. Como resultado, la prevalencia de anemia en lactantes rurales se asoció con el peso al nacer, el número de hermanos, la educación de la madre, los ingresos familiares, el número de personas por habitación y los hábitos alimenticios. Estos hallazgos sugieren la necesidad urgente de una política nutricional infantil más efectiva y un programa integral que incluya el cuidado materno, la salud infantil y la educación nutricional. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción
Objetivo del estudio Proporcionar datos para desarrollar un enfoque basado en políticas que permita controlar la anemia y la desnutrición infantil en las zonas rurales de Shaanxi provincia en el noroeste de China.
Población objetivo Niños de 0 a 18 meses en 28 aldeas rurales de 2 condados de Shaanxi.
Datos Cuestionario estructurado para recopilar información sociodemográfica sobre el hogar, así como entrevistas acerca de las prácticas de alimentación infantil.
Tres días consecutivos de registro de la alimentación de los niños para medir los hábitos alimenticios calculando los nutrientes ingeridos totales.
Se recolectaron muestras de sangre de 2 ml entre 55 lactantes como sub muestra.
Metodología Estadístico: Todas las variables fueron categorizadas antes del análisis. Se utilizó la prueba de los rangos con signo de Wilcoxon para probar las diferencias de la ingesta dietética y las concentraciones séricas de hierro, zinc y vitamina A entre anémicos y lactantes no anémicos.
A través del método de chi-cuadrado de Pearson se examinaron las relaciones entre desnutrición, características sociodemográficas, patrones de alimentación y anemia.
Se construyó un modelo de regresión logística utilizando el grupo de infantes no anémicos como referencia.
Resultados La prevalencia de anemia en lactantes rurales se asoció con el peso al nacer, el número de hermanos, la educación de la madre, los ingresos familiares, el número de personas por
17
habitación y los hábitos alimenticios. Programas de educación sanitaria centrados en la lactancia materna y las prácticas de alimentación complementaria podrían ser estrategias críticas y prácticas para prevenir la anemia y desnutrición en niños pequeños. Estos hallazgos sugieren la necesidad urgente de una política nutricional infantil más efectiva y un programa integral que incluya el cuidado materno, la salud infantil y la educación nutricional.
Ghana: En Ghana, se realizó un estudio [16] para examinar la prevalencia y los determinantes de desnutrición en niños menores de 5 años en la población ghanesa. Para ello, se utilizaron los datos demográficos recopilados en la encuesta de salud (GDHS) de Ghana 2008 y los datos de niños obtenidos del archivo del Servicio de Estadística de Ghana (GSS). Por medio de técnicas estadísticas, como por ejemplo, Pearson Chi Cuadrado, los autores estimaron y compararon entre los subgrupos la prevalencia general de desnutrición así como de retraso en el crecimiento, emaciación y bajo peso. También construyeron modelos de regresión logística univariada utilizados para investigar la asociación entre cada uno de los factores de riesgo individualmente con las tres formas principales de desnutrición. Se realizó también modelos de regresión logística multivariable para identificar determinantes independientes de la desnutrición infantil en la población ghanesa. Como resultado, este estudio subrayó el efecto de la educación de la madre, la pobreza y la edad del niño sobre el estado nutricional de los niños ghaneses menores de 5 años. También mostró la asociación de la desnutrición infantil con cuidados infantiles inadecuados y prácticas de alimentación en general insalubres. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción
Objetivo del estudio Examinar la prevalencia y los determinantes de desnutrición en niños menores de 5 años en la población ghanesa.
Población objetivo Niños de 0 a 5 años en Ghana en 5 subgrupos (0 a 11 meses, 12 a 23 meses, 24 a 35 meses, 36 a 47 meses y 48 a 59 meses)
Datos Datos demográficos y encuesta de salud (GDHS) de Ghana 2008.
Recodificación de datos de niños obtenido del archivo del Servicio de Estadística de Ghana (GSS).
Metodología Estadístico: A través del método de chi-cuadrado de Pearson se estimó y comparó entre los subgrupos la prevalencia general de desnutrición, así como de retraso en el crecimiento, emaciación y bajo peso.
La regresión logística univariada se utilizó para investigar la asociación entre cada uno de los factores de riesgo individualmente con las tres formas principales de desnutrición.
18
La regresión logística multivariable también se utilizó para identificar determinantes independientes de la desnutrición infantil en la población ghanesa. Las estimaciones se presentaron como probabilidades de relaciones (OR) con los correspondientes intervalos de confianza.
Resultados Este estudio subrayó el efecto de la educación de la madre, la pobreza y la edad del niño sobre el estado nutricional de los niños ghaneses menores de 5 años. También mostró la asociación de la desnutrición infantil con cuidados infantiles inadecuados y prácticas de alimentación en general insalubres. Los grupos particulares que requieren mayor atención son niños que acababan de ser introducidos a una alimentación complementaria y aquellos que acababan de finalizar la etapa de la lactancia. La identificación de los factores de riesgo asociados con la desnutrición infantil en Ghana también ayuda a la asignación de los recursos pertinentes de acuerdo con las necesidades específicas de los subgrupos, áreas y características sociodemográficas analizadas.
3.1 Observaciones sobre los estudios analizados y diferencias sobre el enfoque de
esta investigación
Los estudios recopilados tienen en común que, para lograr su objetivo, estudian y analizan las relaciones entre el fenómeno de la desnutrición y/o la prevalencia de anemia y otras variables del entorno estudiado. Igualmente utilizan estadística descriptiva, regresión lineal o algunas técnicas de comprobación de hipótesis para corroborar las fortalezas de dichas relaciones identificadas. Por sus características, el primer estudio es el más similar a la presente investigación en cuanto a la envergadura, población objetivo y métodos utilizados salvo por las siguientes distinciones:
a) Esta investigación se centra en la desnutrición por deficiencia de hierro (Hambre oculta), por lo tanto:
i. A diferencia de los estudios presentados que abordan características ampliamente aceptadas como relacionadas a la desnutrición aguda o crónica como, por ejemplo, los niveles de índice masa muscular (IMC por sus siglas en inglés) y los niveles de hemoglobina, esta investigación excluye las variables relacionadas con el peso y la talla e incluye los niveles de hierro como indicadores de deficiencia de micronutrientes.
ii. Se incluyen variables relacionadas con el estado actual del individuo, de tal manera que pueda analizarse si las condiciones de anemia por deficiencia de hierro pueden deberse a la manifestación clínica de otras enfermedades presentes y/o otros problemas de salud preexistentes.
19
iii. No se incluyen los patrones o hábitos de consumo de alimentos debido a que restringiría la información disponible.
b) Esta investigación no busca solamente entender la fortaleza de la relación entre las diferentes variables sino explicar de manera concreta cómo se da la relación. Por esta razón, se utilizan otras técnicas de ciencia de datos para explicar la incidencia de las variables tales como la construcción de modelos basados en árboles de decisión.
c) Esta investigación utiliza variables establecidas del acuerdo al contexto social de Colombia, como por ejemplo, la medida de riqueza de los hogares estudiados que es obtenido a través de un indicador basado en cuartiles de riqueza.
20
4 ESTUDIO DEL HAMBRE OCULTA EN COLOMBIA En esta sección se detallará el estudio realizado sobre el fenómeno del hambre
oculta en Colombia describiendo cuáles son los datos utilizados, la población
objetivo seleccionada, las variables propuestas para el desarrollo de la
investigación, la definición del fenómeno del hambre oculta a partir de los datos
seleccionados y por último las técnicas aplicadas para el procesamiento de
información.
Para comprender el paso a paso de la investigación, los pasos pueden ilustrarse en
el siguiente diagrama basado en la metodología ASUM-DM propuesta por IBM [17]:
Ilustración 1 - Metodología ASUM-DM
4.1 Escenario Analítico
A continuación se muestra el escenario analítico, sobre el cual, se plantea la
investigación:
21
Ilustración 2 - Escenario Analítico
Por tanto, la presente investigación se constituye como una herramienta adicional
para el Ministerio de Salud con el fin que pueda implementar acciones que generen
impacto sobre la sociedad colombiana.
4.2 Fuentes de datos
Etapa del proceso de acuerdo con la metodología: Analizar.
Para la realización del estudio se utilizó como fuente de datos la Encuesta Nacional
de Situación Nutricional para el año 2015. Es una encuesta nacional realizada por
muestreo que permite la recolección de datos de forma organizada y metódica de
hogares y sus integrantes, utilizando procedimientos definidos para la compilación
de la información recolectada, tomando medidas corporales y muestras biológicas.
Su desarrollo está a cargo del Instituto Colombiano de Bienestar Familiar - ICBF, el
Ministerio de Salud y Protección Social, el Departamento Administrativo para la
Prosperidad Social - PS, el Instituto Nacional de Salud – INS - y la Organización
Panamericana de la Salud-OPS/OMS [18].
Es importante anotar que a la fecha de esta investigación no se cuenta con la
información de la ENSIN para el año 2020 toda vez que:
Si bien se han publicado resultados relevantes de la encuesta, no se ha
finalizado la exploración detallada de los datos obtenidos a partir del año
22
2015.
En línea con el punto anterior, el gobierno nacional no ha tomado acciones
que permitan suponer que en una encuesta ENSIN 2020 se obtengan
resultados significativamente diferentes, por lo que de momento no ha
tomado la determinación de realizar nuevamente dicho estudio.
En relación a la pandemia declarada por la OMS por la enfermedad COVID-
19, el gobierno nacional ha declarado la emergencia sanitaria. En este
sentido, es razonable que los recursos económicos se asignen a la
preparación y atención de la pandemia en lugar de destinarse al
levantamiento de nueva información proveniente de la ENSIN.
4.3 Segmentación de la población
Etapa del proceso de acuerdo con la metodología: Analizar.
ENSIN recoge información de distintas poblaciones a lo largo y ancho del territorio
colombiano. Sin embargo, entendiendo que la complejidad del fenómeno de la
desnutrición y del hambre oculta es alta y caracterizar sus causas puede variar
significativamente de un grupo poblacional a otro se optó, con el apoyo de los
expertos en segmentar la población en dos grupos de interés:
Madres gestantes: El periodo de gestación es particularmente importante en
el análisis de fenómeno del hambre oculta puesto que es una condición
particular que predispone a la madre a la anemia por deficiencia de hierro.
Por supuesto, que una condición de esta naturaleza que no se maneje
adecuadamente durante este periodo puede tener consecuencias en el
desarrollo del bebé en el vientre materno y para la madre misma, siendo muy
relevante para la salud pública focalizar y tratar médicamente a aquellas
mamás en riesgo.
Primera infancia: El periodo comprendido entre los 0 y 5 años de edad es el
más importante en la formación y desarrollo físico de cualquier niño. Cuadros
crónicos de desnutrición y hambre oculta en este periodo de tiempo pueden
tener graves consecuencias de salud a corto y largo plazo, siendo
fundamental identificar y tratar adecuadamente a los niños en riesgo.
4.4 Selección de variables de interés
Etapa del proceso de acuerdo con la metodología: Diseñar.
La encuesta ENSIN trae una gran cantidad de información relevante para el estudio de los
hábitos de nutrición en el país. Por tanto, es necesario filtrar aquellas variables que se
consideren más relevantes para el fenómeno en estudio con base en (a) el conocimiento
23
experto, en este caso por parte del Ministerio de Salud y (b) en estudios similares realizados
en otros países. Producto de dicha selección se obtuvo:
Variable Descripción
Dimensión: Caracterización del Individuo
PERSONA Identificador del individuo en los datos. Esta variable
se elimina para su ingreso en los modelos.
HEMOGLOBINA Nivel de hemoglobina (g/dL) ajustada por altura
sobre el nivel del mar.
FERRITINA Nivel de ferritina (μg/L)
EDAD Edad del sujeto de estudio.
Dimensión: Estado de salud del individuo
EMBARAZADA Si la persona sujeto de estudio se encuentra en
gestación o no.
PROBLEMAS_SALUD Indica si la persona tuvo síntomas de problemas de
salud en los últimos 15 días.
PROBLEMAS_SALUD_DIARREA Indica si la persona tuvo diarrea en los últimos 15
días.
DIAGNOSTICADO Indica si la persona ha sido diagnosticado(a) de
alguna enfermedad en el último año.
HOSPITALIZADO Indica si la persona tuvo algún problema de salud
que haya implicado hospitalización en el último año.
Dimensión: Condiciones del hogar
TAMANO_HOGAR Indica el tamaño del hogar por categorías.
1. Unipersonal
2. 2 a 4 personas
3. 5 a 6 personas
4. 7 personas o mas
NO_COCINA Indica si el hogar en el que vive cuenta con
infraestructura para cocinar alimentos.
NO_ACUEDUCTO Indica si el hogar en el que vive cuenta con
infraestructura y servicio de acueducto.
NO_ALCANTARILLADO Indica si el hogar en el que vive cuenta con
infraestructura y servicio de alcantarillado.
AGUA_PREPARAR Indica la fuente primaria del agua del hogar que se
utiliza para lavar y/o preparar los alimentos.
-1. Otro
1. Acueducto público
2. Acueducto comunal o veredal
3. Pozo con bomba
4. Pozo sin bomba, jagüey
5. Aguas lluvias
6. Manantial, nacimiento
7. Río, quebrada
24
8. Pila pública
9. Carro tanque
10. Aguatero
11. Agua embotellada o en bolsa
12. Donación
NO_ENERGIA Indica si el hogar en el que vive cuenta con
infraestructura y servicio de energía eléctrica.
NO_RECOLECCION Indica si el hogar en el que vive cuenta con servicio
de recolección de basuras.
PAREDES Indica el tipo de material con el cual están
construidas las paredes del hogar en el que habita:
-1. Otro
1. Bahareque revocado
2. Bahareque sin revocar
3. Madera burda, tabla, tablón
4. Guadua, caña, esterilla, otro vegetal
5. Bloque, ladrillo, piedra, madera pulida
6. Material prefabricado
7. Tierra pisada, adobe
8. Zinc, tela, cartón, latas, desechos, plásticos.
9. Sin paredes
PISOS Indica el tipo de material con el cual están
construidos los pisos del hogar en el que habita:
-1. Otro
1. Madera pulida y lacada, parqué
2. Mármol
3. Alfombra o tapete de pared a pared
4. Baldosas, vinilo, tableta o ladrillo, caucho, otros
materiales sintéticos
5. Madera burda, madera en mal estado, tabla o
tablón
6. Cemento o gravilla
7. Tierra o arena
Dimensión: Ubicación Geográfica
COD_DEPTO Código de departamento en el que habita la
persona.
AREA Indica el tipo de área en el cual habita la persona:
1. Cabecera municipal
2. Resto (Centro poblado )
3. Resto (Rural disperso)
Dimensión: Condiciones Socioeconómicas
ACTIVIDAD_MES_PASADO Indica la actividad en que ocupó la mayor parte del
tiempo del mes pasado.
-1. Otra actividad
25
1. Trabajando
2. Buscando trabajo
3. Estudiando
4. Oficios del hogar
5. Incapacitado permanente para trabajar
6. Sin actividad
7. Rentista
8. Jubilado/ pensionado
NIVEL_TRABAJO Indica el rol que la persona tiene en su trabajo.
-1. Otro
1. Obrero o empleado de empresa particular
2. Obrero o empleado del gobierno
3. Empleado doméstico
4. Jornalero o peón
5. Trabajador por cuenta propia
6. Patrón o empleador
7. Trabajador de su propia finca en arriendo o
aparcería
8. Trabajador familiar sin remuneración
9. Trabajador sin remuneración en empresa o
negocios de otros hogares.
CON_QUIEN_PERMANECE Indica dónde o con quién permanece durante la
mayor parte del tiempo entre semana.
-1. Otro
1. Asiste a un hogar comunitario, guardería, jardín
o centro de desarrollo infantil
2. Con su padre o madre en la casa
3. Con su padre o madre en el trabajo
4. Con empleada o niñera en la casa
5. Al cuidado de un pariente de 18 años o más
diferente a los abuelos en la casa
6. Al cuidado de un pariente de 18 años o más
diferente a los abuelos en OTRA casa
7. Al cuidado de un pariente menor de 18 años en
la casa
8. Al cuidado de un pariente menor de 18 años en
OTRA casa
9. Al cuidado de los abuelos en la casa
10. Al cuidado de los abuelos en OTRA casa
11. En un sitio para el cuidado de menores (jornada
adicional o alterna, talleres, etc)
12. En casa solo
TIPO_HOGAR_ASISTE Indica a qué tipo de establecimiento (hogar
26
comunitario, guardería, jardín o centro de desarrollo
infantil) asiste el individuo.
1. Hogar comunitario de ICBF
2. Hogar infantil o jardín de ICBF
3. Centro de Desarrollo Infantil de ICBF
4. Guardería, salacuna, preescolar o jardín oficial
5. Guardería, salacuna, preescolar o jardín privado
AFILIADO Indica si la persona está afiliado(a) a alguna entidad
de seguridad social en salud. (EPS-Contributiva,
EPS-Subsidiada, régimen de excepción).
-3. Ns/Nr
1. Si
2. No
REGIMEN Indica a cuál de los siguientes regímenes en salud
está afiliado la persona.
-3. Ns/Nr
1. EPS contributiva
2. EPS subsidiada
3. Regímenes especiales (Fuerzas, Armadas,
Ecopetrol, universidades, públicas, magisterio)
CUARTIL_RIQUEZA Indica el cuartil de riqueza armonizado calculado
solo para la base 2015.
1. primer cuartil
2. segundo cuartil
3. tercero cuartil
4. cuarto cuartil
SEXO_JEFE_HOGAR Indica el sexo de quien fue identificado como jefe del
hogar.
EDUCACION_JEFE_HOGAR Indica el nivel de escolaridad del jefe del hogar.
1. Menos de primaria completa (0-4 años)
2. Entre primaria completa y secundaria incompleta
(5-10 años)
3. Entre secundaria completa y superior incompleta
(11-15 años)
4. Superior completa y más (16-24 años)
En total se seleccionaron 30 variables que serán discriminadas en función de la
población objetivo seleccionado (Gestantes o primera infancia) que involucran
distintos componentes socioeconómicos de la persona.
4.5 Definición de desnutrición por deficiencia de hierro en la población objetivo
Etapa del proceso de acuerdo con la metodología: Diseñar.
27
Para cada grupo de interés, se definieron los siguientes umbrales de hemoglobina
[6] y ferritina [19] para diferenciar las personas que padecen deficiencia de
micronutrientes por deficiencia de hierro, que es una de las manifestaciones más
frecuentes de hambre oculta, de las que no padecen dicha enfermedad:
Población Nivel de Hemoglobina
(g/dL) ajustada por altura
sobre el nivel del mar.
Nivel de Ferritina (μg/L)
Mujeres Gestantes 11 20
Primera infancia 11 12
4.6 Metodología de estudio
Etapa del proceso de acuerdo con la metodología: Configurar y Construir.
Para el análisis de las variables seleccionadas se estableció el siguiente esquema:
Para cada grupo de interés seleccionado (Gestantes y primera infancia) se estudia:
Análisis descriptivo: El análisis descriptivo incluye un estudio cuantitativo de
los patrones que rodean cada variable seleccionada respecto a la
hemoglobina (de manera independiente), la ferritina (de manera
independiente) y la combinación de las dos, hemoglobina y ferritina teniendo
en cuenta su definición de nivel bajo (Anemia por deficiencia de hierro).
Análisis de correlaciones: El análisis de correlaciones incluye un estudio de
la fortaleza de la relación de cada variable según sus características respecto
a la hemoglobina (de manera independiente), la ferritina (de manera
28
independiente) y la combinación de las dos, hemoglobina y ferritina teniendo
en cuenta su definición de nivel bajo (Anemia por deficiencia de hierro). Para
las correlaciones se utiliza:
Variables Métodos
Numérica con Numérica Spearman [20]
Categórica con Categórica Chi Cuadrado / V Crammer [21]
Categórica (2 niveles) con Numérica
Se utiliza la correlación punto-biserial (0 – 1) (Equivalente a la correlación de Pearson).
Categórica (>2 niveles) con Numérica*
Se debe usar la correlación ETA (raíz cuadrada del R2 de la regresión multifactorial)
Modelo de regresión lineal: Modelo matemático que permite aproximar la
relación entre una variable dependiente Y respecto a un conjunto de variables
determinadas X. En el contexto del estudio se utiliza para determinar las
variables que más incidencia tienen sobre el fenómeno de desnutrición por
hambre oculta.
Modelo de Clasificación Basado en Árboles de Decisión (Predictivo): De
acuerdo con la naturaleza de las variables (En su mayoría categóricas), se
propuso utilizar como modelo predictivo la clasificación basada en árboles de
decisión. Este modelo, cuenta con la ventaja de permitir una interpretación
de la importancia de las variables que se están teniendo en cuenta para
tomar las decisiones.
4.7 Discusión e interpretación de los resultados de los modelos
Etapa del proceso de acuerdo con la metodología: Operar y optimizar.
Finalmente, el último paso está dado por el análisis de los resultados de los modelos
construidos intentando describir adecuadamente la interacción entre las variables.
Si bien, por la complejidad del fenómeno estudiado no se esperan reglas de negocio
infalibles que permitan identificar con certeza a las poblaciones en riesgo, es
fundamental el apoyo de los expertos en la problemática quienes orientarán
adecuadamente los resultados de la investigación.
29
5 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE
MUJERES GESTANTES. Para abordar el estudio, es necesario identificar y segmentar la población de
mujeres gestantes entre mujeres con desnutrición por deficiencia de hierro y
aquellas que no padecen desnutrición por deficiencia de micronutrientes. A
continuación, se detalla cómo se realiza esta clasificación y los criterios establecidos
para tal efecto.
5.1 Caracterización de la población
A partir de los datos recopilados el estudio busca identificar las características
generales de la población de mujeres gestantes con el fin de establecer la variable
objetivo que permitirá elaborar el modelo, por tal razón es importante analizar las
siguientes preguntas:
¿Cuántas mujeres gestantes padecen anemia?
¿Cuántas mujeres gestantes padecen deficiencia de hierro?
¿Cuántas mujeres gestantes padecen anemia y deficiencia de hierro?
Por medio de un análisis descriptivo, en la encuesta ENSIN se cuenta con un total
de 1234 registros correspondientes a mujeres gestantes que se pueden clasificar
de la siguiente manera:
Si Si (%) No No (%) Total
Mujeres Gestantes con Anemia 337 27% 897 73% 1234
Mujeres Gestantes con Deficiencia de Hierro 744 60% 490 40% 1234
Mujeres Gestantes con Anemia y Deficiencia
de Hierro
249 20% 985 80% 1234
Para identificar las proporciones en la población, se muestran los siguientes
gráficos:
30
Ilustración 3 - Distribución de Mujeres Gestantes con Anemia
Ilustración 4 - Distribución de mujeres gestantes con deficiencia de hierro
337; 27%
897; 73%
Mujeres Gestantes con Anemia
Si No
744; 60%
490; 40%
Mujeres Gestantes con Deficiencia de Hierro
Si No
31
Ilustración 5 - Distribución de mujeres gestantes con anemia y deficiencia de hierro
Es importante anotar que el 60% de las mujeres en estado de gestación se
encuentra con deficiencia de hierro. Esta condición es propia del embarazo y por lo
general se presenta antes que se manifiesten valores bajo de hemoglobina
(anemia).
Es por esta razón que las mujeres en estado de gestación son consideradas una
población en riesgo. El grupo de interés seleccionado se centra en las mujeres
gestantes con anemia y deficiencia de hierro, esto significa que la desnutrición por
hambre oculta se encuentra en un estado más avanzado, que de acuerdo con los
datos disponibles representan el 20% (249 mujeres) de la población disponible.
5.2 Análisis descriptivo
El análisis descriptivo se realizó por cada variable usando como variable objetivo la
hemoglobina y ferritina de manera independiente. En las variables en las que el
promedio más bajo de hemoglobina coincidieron en una o más categorías de
respuesta con el promedio más bajo de ferritina se constituyó como un hallazgo.
En este sentido las variables más relevantes son:
Variable Tamaño del hogar:
Respecto a la Hemoglobina Respecto a la Ferritina
249; 20%
985; 80%
Mujeres Gestantes con Anemia y Deficiencia de Hierro
Si No
32
Los hogares unipersonales son aquellos
que tienen niveles de hemoglobina
significativamente por encima de la media.
Los hogares más grandes, tienen
promedios semejantes. Sin embargo, en la
medida en que los hogares crecen el
percentil del 25% es más bajo.
Se observa que los hogares unipersonales
son aquellos que tienen niveles de ferritina
significativamente por encima de la media.
Los hogares más grandes, tienen
promedios semejantes.
Variable Problemas de Salud:
Respecto a la Hemoglobina Respecto a la Ferritina
Resulta contradictorio que la categoría (2.
No) resulta ligeramente más baja en su
media que quienes han tenido problemas
de saludo en los últimos 15 días.
Resulta contradictorio que la categoría (2.
No) resulta ligeramente más baja en su
media que quienes han tenido problemas
de saludo en los últimos 15 días.
Aunque se podría considerar contradictoria, es una variable indicativa de la
ocurrencia del fenómeno.
Variable Problemas de Salud Diarrea:
Respecto a la Hemoglobina Respecto a la Ferritina
33
Resulta contradictorio que la categoría (2.
No) resulta ligeramente más baja en su
media que quienes han tenido problemas
de saludo en los últimos 15 días.
Resulta contradictorio que la categoría (2.
No) resulta ligeramente más baja en su
media que quienes han tenido problemas
de saludo en los últimos 15 días.
Aunque se podría considerar contradictoria, es una variable indicativa de la
ocurrencia del fenómeno.
Variable Hospitalizado
Respecto a la Hemoglobina Respecto a la Ferritina
Se observa una diferencia en la media
entre quienes han sido hospitalizados en
el último año respecto a los que no.
Se observa una diferencia en la media
entre quienes han sido hospitalizados en
el último año respecto a los que no.
Variable Régimen
Respecto a la Hemoglobina Respecto a la Ferritina
34
Se observa una pequeña tendencia en la
media a disminuir según el régimen,
siendo la categoría (3. Regímenes
especiales) tiene la media más baja.
Se observa una pequeña tendencia en la
media a disminuir según el régimen,
siendo la categoría (3. Regímenes
especiales) tiene la media más baja.
Variable Departamento
Respecto a la Hemoglobina Respecto a la Ferritina
Departamentos con media más baja:
47 Magdalena
27 Chocó
44 La Guajira
99 Vichada
52 Nariño
Departamentos con media más baja:
47 Magdalena
88 San Andrés
23 Córdoba
18 Caquetá
70 Sucre
Coincide en primer lugar el departamento del Magdalena.
Variable Cuartil Riqueza
Respecto a la Hemoglobina Respecto a la Ferritina
Se observa una tendencia que a menor El cuartil 2 cuenta con la media más baja.
35
cuartil de riqueza, más baja es la media de
los niveles de hemoglobina.
Particularmente en los cuartiles 1 y 2.
Por otra parte, el cuartil 3 y el 4 son los
más altos.
Aunque en la ferritina no sigue exactamente el mismo patrón de tendencia en los
cuartiles, si se destaca la coincidencia en el cuartil 2 como uno de los más bajos en
ambas perspectivas.
Variable Educación Jefe del Hogar
Respecto a la Hemoglobina Respecto a la Ferritina
Llama la atención que las categorías (1.
Menos de primaria completa (0-4 años)) y
(3. Entre secundaria completa y superior
incompleta (11-15 años)) tienen la media
más baja de hemoglobina.
Llama la atención que las categorías (3.
Entre secundaria completa y superior
incompleta (11-15 años)) y (4. Superior
completa y más (16-24 años)) tienen la
media más baja de ferritina.
Aunque en la ferritina no sigue exactamente el mismo patrón de tendencia de la
educación de jefe del hogar respecto a la ferritina, si se destaca la coincidencia en
la categoría (3. Entre secundaria completa y superior incompleta (11-15 años))
como uno de los más bajos en ambas perspectivas.
En síntesis, el análisis descriptivo muestra una influencia de variables de diferentes
dimensiones, siendo particularmente relevantes las condiciones propias del estado
de salud de la mujer tales como si ha tenido problemas de salud en el último año y
si ha tenido problemas de diarrea, pero también una incidencia importante de otras
dimensiones con las condiciones económicas proyectadas en las condiciones del
hogar y el cuartil de riqueza.
5.3 Análisis de correlaciones
El análisis de correlaciones se realizó:
36
Por cada variable respecto a la hemoglobina y ferritina de manera
independiente. En las variables en las que el coeficiente de Pearson y ETA
es superior al 10% se constituye como una correlación en el estudio.
Por cada variable respecto a la variable “anemia hierro” que se construye a
partir de la caracterización de la población de acuerdo con los umbrales
descritos en la sección 5.4. En las variables en las que el coeficiente de
Pearson y ETA es superior al 10% se constituye como una correlación en el
estudio. En el caso de las variables analizadas con el método de Chi2, se
constituyen como correlación aquellas que tenga una significancia mayor al
95%. (p < 0.05).
Cuando una variable, se constituyó como “correlacionada” en dos o más variables
(Respecto a la hemoglobina, o la ferritina o la variable combinada anemia hierro) se
constituye como un hallazgo en el estudio. A continuación se muestran los
hallazgos:
(*) Destaca las variables que se seleccionan como relevantes para el estudio.
Cifras truncadas a cinco (5) decimales.
Variable Objetivo Hemoglobina
Objetivo Ferritina Objetivo Anemia Hierro
HEMOGLOBINA* No aplica Pearson: 0.15917 Pearson: -0.59325
FERRITINA* Pearson: 0.15917 No aplica Pearson: -0.27087
TAMANO_HOGAR Pearson: -0.02179 Pearson: 0.00963 Pearson: 0.04841
EDAD Pearson: 0.0387094 Pearson: 0.0559021 Pearson: -0.03184
ACTIVIDAD_MES_PASADO
eta: 0.10537 eta: 0.09030 Chi: 8.88253 p: 0.26120
NIVEL_TRABAJO eta: 0.06809 eta: 0.03617 Chi: 1.88181 p: 0.93024
PROBLEMAS_SALUD Biserial (Pearson): 0.05698
Biserial (Pearson): 0.06866
Chi: 1.32406 p: 0.24986
PROBLEMAS_SALUD_DIARREA
Biserial (Pearson): 0.01536
Biserial (Pearson): 0.05915
Chi: 0.00707 p: 0.93297
DIAGNOSTICADO Biserial (Pearson): -0.00908
Biserial (Pearson): -0.02698
Chi: 1.08308 p: 0.29800
HOSPITALIZADO Biserial (Pearson): -0.05232
Biserial (Pearson): -0.01462
Chi: 3.87418 p: 0.04903
AFILIADO eta: 0.00902 eta: 0.02297 Chi: 1.82863 p: 0.40078
REGIMEN eta: 0.06423 eta: 0.02991 Chi: 2.61906 p: 0.45415
37
COD_DEPTO* eta: 0.33464 eta: 0.13216 Chi: 69.73705 p: 0.00012
AREA eta: 0.01094 eta: 0.02155 Chi: 1.63645 p: 0.20081
CUARTIL_RIQUEZA Pearson: 0.11213 Pearson: 0.01065 Pearson: -0.08914
NO_COCINA Biserial (Pearson): -0.01708
Biserial (Pearson): -0.00503
Chi: 0.59988 p: 0.43862
NO_ACUEDUCTO Biserial (Pearson): -0.06304
Biserial (Pearson): 0.01124
Chi: 1.91274 p: 0.16665
NO_ALCANTARILLADO* Biserial (Pearson): -0.14165
Biserial (Pearson): -0.01107
Chi: 20.84162 p: 4.98868e-06
NO_ENERGIA Biserial (Pearson): -0.05941
Biserial (Pearson): -0.04776
Chi: 7.80790 p: 0.00520
NO_RECOLECCION Biserial (Pearson): -0.05292
Biserial (Pearson): -0.03617
Chi: 1.71766 p: 0.18999
PAREDES eta: 0.12177 eta: 0.04775 Chi: 11.07422 p: 0.19752
PISOS* eta: 0.10937 eta: 0.04459 Chi: 15.28483 p: 0.00921
AGUA_PREPARAR eta: 0.15096 eta: 0.08597 Chi: 19.05660 p: 0.08717
SEXO_JEFE_HOGAR Biserial (Pearson): -0.01123
Biserial (Pearson): 0.0219928
Chi: 0.06983 p: 0.79157
EDUCACION_JEFE_HOGAR
eta: 0.05326 eta: 0.06083 Chi: 3.50206 p: 0.32049
5.4 Regresión lineal
La regresión lineal se utilizó con dos objetivos:
Identificar las variables más relevantes en la tarea de clasificación.
Construir un primer modelo de clasificación.
En este caso, la regresión se hizo directamente contra la variable “anemia hierro”
que se construye a partir de la caracterización de la población de acuerdo con los
umbrales descritos en la sección 5.4. Se utilizaron los siguientes mejores
parámetros hallados:
Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de
38
entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba
o control del modelo (30%).
C: 0.4181.
Peso de las clases (class_weight): balanced.
Iteraciones máximas (max_iter): 10.
Estrategia de penalización (penalti): L1
Kernel (solver): Liblinear
Métrica para encontrar la mejor calificación: Exhaustividad (Recall).
A continuación, se muestra la importancia relativa de las variables identificadas en
la regresión:
Ilustración 6 - Importancia relativa de las variables en el modelo de regresión lineal de mujeres gestantes
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
39
Mujeres en etapa de
gestación que SI
presentan desnutrición
por ausencia de
micronutrientes (hierro).
24% 55% 73
Mujeres en etapa de
gestación que NO
presentan desnutrición
por ausencia de
micronutrientes (hierro).
84% 57% 298
Promedio Balanceado
del Modelo (Weighted
AVG)
72% 56% 371
De acuerdo con los resultados la regresión lineal para la población de mujeres
gestantes nos da como resultados:
Del total de los registros que el modelo clasifica como “SI presenta
desnutrición por ausencia de micronutrientes (hierro)”, el 24% en la realidad
sí corresponde a esta condición.
Del total de los registros disponibles para el modelo que en realidad “SI
presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de
regresión clasificó correctamente el 55%.
Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la
métrica de exactitud para evaluar el desempeño del modelo. Esto debido a que el
algoritmo se inclinará preferentemente por la clase mayoritaria (Quienes nos
padecen la enfermedad) y por ende tendrá un porcentaje de éxito mayor que no
corresponde al objeto del estudio (Identificar a quienes sí padecen la enfermedad).
En la regresión lineal, el algoritmo muestra una fuerte relación con la variable “Nivel
de trabajo” en sus distintas categorías que muestran una asociación entre la
ocupación y la jerarquía del cargo que desempeña la persona respecto a la
prevalencia del hambre oculta. Desde la dimensión de las características de
infraestructura del hogar, toma relevancia la presencia o no de cocina y desde la
dimensión de las condiciones individuales la prevalencia de problemas de salud y
la edad. En ese sentido, respecto al análisis descriptivo, la regresión también resalta
la importancia de ciertas condiciones de infraestructura del hogar pero deja
manifiesto algunos aspectos novedosos como precisamente, el tamaño del hogar.
40
5.5 Árbol de decisión
El árbol de decisión se utilizó con tres objetivos:
Identificar las variables más relevantes en la tarea de clasificación.
Construir un segundo modelo de clasificación.
Utilizar un algoritmo más adecuado para las características de los datos
(Ampliamente categóricos).
En este caso, el modelo del árbol de decisión se construyó utilizando como variable
objetivo “anemia hierro” que se construye a partir de la caracterización de la
población de acuerdo con los umbrales descritos en la sección 5.4. Se utilizaron los
siguientes mejores parámetros hallados:
Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de
entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba
o control del modelo (30%).
Índice de medida de impureza: Gini
Profundidad: 5
Peso de las clases (class_weight): balanced.
Métrica para encontrar la mejor calificación: Exhaustividad (Recall).
Se construyeron modelos alternos utilizando técnicas de preparación de los
datos para mejorar el desempeño del algoritmo en cuanto al balance de las
clases:
o Submuestreo (Undersampling): Técnica en la cual se reduce la
cantidad de registros de la clase mayoritaria, seleccionando de forma
aleatoria registros de tal manera que no sobrepasen en número a la
cantidad de registros de la clase minoritaria [22].
o Sobremuestreo (Oversampling): Técnica en la cual se aumenta la
cantidad de registros de la clase minoritaria, generando copias
sintéticas de los registros de tal manera que sea igual a la cantidad de
registros de la clase mayoritaria [22].
A continuación, se muestra la importancia relativa de las variables identificadas en
el árbol de decisión:
Datos originales:
Variable Importancia Relativa
NO_ALCANTARILLADO 0.238
AFILIADO_1.0 0.152
41
EDAD 0.109
COD_DEPTO_25.0 0.079
COD_DEPTO_63.0 0.071
COD_DEPTO_8.0 0.071
COD_DEPTO_50.0 0.069
COD_DEPTO_18.0 0.064
NO_RECOLECCION_nan 0.050
PAREDES_8.0 0.041
PISOS_7.0 0.034
COD_DEPTO_54.0 0.021
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Mujeres en etapa de
gestación que SI
presentan desnutrición
por ausencia de
micronutrientes (hierro).
28% 38% 73
Mujeres en etapa de
gestación que NO
presentan desnutrición
por ausencia de
micronutrientes (hierro).
83% 76% 298
Promedio Balanceado
del Modelo (Weighted
AVG)
72% 68% 371
Submuestreo:
Variable Importancia Relativa
PISOS_7.0 0.174
EDAD 0.164
COD_DEPTO_63.0 0.123
COD_DEPTO_15.0 0.122
COD_DEPTO_25.0 0.091
COD_DEPTO_97.0 0.087
PISOS_5.0 0.055
AGUA_PREPARAR_1.0 0.053
COD_DEPTO_81.0 0.049
42
COD_DEPTO_52.0 0.047
EDUCACION_JEFE_HOGAR_2.0 0.020
CUARTIL_RIQUEZA 0.014
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Mujeres en etapa de
gestación que SI
presentan desnutrición
por ausencia de
micronutrientes (hierro).
20% 88% 73
Mujeres en etapa de
gestación que NO
presentan desnutrición
por ausencia de
micronutrientes (hierro).
80% 12% 298
Promedio Balanceado
del Modelo (Weighted
AVG)
68% 27% 371
Sobremuestreo:
Variable Importancia Relativa
NO_ALCANTARILLADO 0.312
AFILIADO_1.0 0.103
EDAD 0.102
COD_DEPTO_8.0 0.102
COD_DEPTO_25.0 0.085
COD_DEPTO_18.0 0.069
CUARTIL_RIQUEZA 0.058
PAREDES_2.0 0.055
PAREDES_8.0 0.049
COD_DEPTO_50.0 0.044
PISOS_4.0 0.022
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
43
Población Precisión Exhaustividad Soporte
Mujeres en etapa de
gestación que SI
presentan desnutrición
por ausencia de
micronutrientes (hierro).
30% 42% 73
Mujeres en etapa de
gestación que NO
presentan desnutrición
por ausencia de
micronutrientes (hierro).
84% 76% 298
Promedio Balanceado
del Modelo (Weighted
AVG)
74% 69% 371
El modelo que mostró mejor resultados es el realizado con la técnica de
sobremuestreo. De acuerdo con estos resultados se tiene:
Del total de los registros que el modelo clasifica como “SI presenta
desnutrición por ausencia de micronutrientes (hierro)”, el 30% en la realidad
sí corresponde a esta condición.
Del total de los registros disponibles para el modelo que en realidad son “SI
presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de
clasificación basado en árboles con sobremuestreo clasificó correctamente
el 42%.
Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la
métrica de exactitud para evaluar el desempeño del modelo incluyo aplicando las
técnicas de sobremuestreo o submuestreo.
5.6 Consolidación de las variables identificadas en los modelos
Dado que el propósito del estudio es identificar las variables que inciden sobre el
fenómeno del hambre oculta en la población de las mujeres gestantes, a
continuación se resume por cada modelo las variables más relevantes en la
caracterización del fenómeno:
En el resultado analítico se calificó el número de ocurrencias por variable entre el
análisis descriptivo y las correlaciones con el fin de resumir la información. A
continuación se muestra en orden de relevancia las variables que más inciden de
acuerdo con el análisis efectuado:
44
Top Características -
Analítico
Top Características – Regresión Top Características -
Árbol
COD_DEPTO
HOSPITALIZADO
CUARTIL_RIQUE
ZA
PISOS
AGUA_PREPARA
R
NIVEL_TRABAJO
ACTIVIDAD_MES_PASADO
PROBLEMAS_SALUD
NO_COCINA
HOSPITALIZADO
TAMANO_HOGAR
EDAD
DIAGNOSTICADO
PROBLEMAS_SALUD_DIARR
EA
AFILIADO
CUARTIL_RIQUEZA
NO_ALCANTARILLADO
NO_ENERGIA
NO_ACUEDUCTO
NO_ALCANTARILLA
DO
AFILIADO_1.0
EDAD
COD_DEPTO_8.0
COD_DEPTO_25.0
COD_DEPTO_18.0
CUARTIL_RIQUEZA
PAREDES_2.0
PAREDES_8.0
COD_DEPTO_50.0
PISOS_4.0
A continuación se relacionan las variables que inciden en el fenómeno de acuerdo
con su coincidencia en los modelos realizados:
Variable Desc. Reg. Árb. Desc. y
Reg.
Desc. y
Árb.
Reg. y
Árb.
Desc.,
Reg.
y Árb.
COD_DEPTO X
HOSPITALIZADO X
CUARTIL_RIQUEZA X
PISOS X
AGUA_PREPARAR X
NIVEL_TRABAJO X
ACTIVIDAD_MES_PASADO X
PROBLEMAS_SALUD X
NO_COCINA X
TAMANO_HOGAR X
EDAD X
DIAGNOSTICADO X
PROBLEMAS_SALUD_DIARREA X
AFILIADO X
NO_ALCANTARILLADO X
NO_ENERGIA X
NO_ACUEDUCTO X
PAREDES X
45
PISOS X
Convenciones:
Desc. = Presente solo en el análisis descriptivo.
Reg. = Presente solo en la regresión lineal.
Arb. = Presente solo en el modelo de árbol de decisión.
Desc. y Reg. = Presente en el modelo descriptivo y en la regresión.
Desc. y Arb = Presente en el modelo descriptivo y en el árbol de decisión.
Desc, Reg. Y Arb = Presente en el modelo descriptivo, regresión y en el árbol
de decisión.
En términos generales se observa que las variables recopiladas por el modelo
basado en árboles de decisión absorbe de una manera u otra las variables
identificadas en los análisis descriptivo. No obstante la regresión sí toma en cuenta
nueve (9) variables como importantes que no se reflejan en los demás análisis. En
ese sentido, solo hay una variable que prevalece en los tres modelos denominada
CUARTIL_RIQUEZA.
Por tal motivo, se analizarán las variables a continuación a partir del árbol de
decisión.
5.7 Incidencia de las variables identificadas en el árbol de decisión
En las secciones anteriores, por medio de las técnicas de estadística descriptiva,
regresión y un modelo basado en árboles de decisión se determinaron las variables
que pueden estar incidiendo o no en el desarrollo del fenómeno. En esta sección se
estudiará a partir de los árboles de decisión cómo es la incidencia de estas variables
en el fenómeno.
A continuación se muestra el árbol de decisión de las madres gestantes:
46
Ilustración 7 - Árbol de decisión para el modelo de las mujeres gestantes
Para el análisis se tienen en cuentan los nodos finales donde la clase positiva (Con
desnutrición para ausencia de micronutrientes) es mayor que la clase minoritaria
(Sin desnutrición por ausencia de micronutrientes) con una impureza GINI igual a 0.
Si bien el algoritmo permite establecer reglas de negocio para explicar el fenómeno,
debe tenerse en cuenta que la aplicación de manera individual de una determinada
regla no describe fulminantemente el fenómeno sino que debe considerarse como
las piezas clave que en conjunto permiten describir el fenómeno.
En este caso se tienen las siguientes reglas:
a) SI (AFILIADO_1.0 es 0) Y (COD_DEPTO_8.0 es 0) Y
(NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a sufrir de
hambre oculta.
La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no
tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de
Atlántico y no son afiliadas al sistema general de salud tienen mayor susceptibilidad
a la desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 2 mujeres gestantes que sí tienen desnutrición por deficiencia de hierro
y 26 que no.
b) SI (COD_DEPTO_25 es 1) Y (AFILIADO es 1) Y (COD_DEPTO_8.0 es 0) Y
(NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a sufrir de
hambre oculta.
47
La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no
tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de
Atlántico y se encuentran afiliadas al sistema general de salud y viven en el
departamento de Cundinamarca tienen mayor susceptibilidad a la desnutrición por
deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 1 mujer gestante que sí tiene desnutrición por deficiencia de hierro y 26
que no.
c) SI (PISOS_4.0 es 0) Y (COD_DEPTO_8.0 es 0) Y (NO_ALCANTARILLADO
es 0) ENTONCES tiene mayor riesgo a sufrir de hambre oculta.
Desde el punto de vista de negocio, la regla se puede interpretar de la siguiente
manera: Las mujeres gestantes que no tienen déficit de servicio de alcantarillado y
no se encuentran en el departamento de Atlántico y los pisos de su vivienda no son
de baldosas, vinilo, tableta o ladrillo, caucho, otros materiales sintéticos tienen
mayor susceptibilidad a la desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 75 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro
y 342 que no.
d) SI (CUARTIL_RIQUEZA es 3 o 4) Y (PISOS_4.0 es 1) Y (COD_DEPTO_8.0
es 0) Y (NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a
sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no
tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de
Atlántico y los pisos de su vivienda son de baldosas, vinilo, tableta o ladrillo, caucho,
otros materiales sintéticos y se encuentran en el cuartil de riqueza superior (Tercero
o cuarto) tienen mayor susceptibilidad a la desnutrición por deficiencia de
micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 34 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro
y 186 que no.
e) SI (COD_DEPTO_18 es 1) Y (EDAD es menor que 34.5) Y
(NO_ALCANTARILLADO es 1) ENTONCES tiene mayor riesgo a sufrir de
48
hambre oculta.
La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que
tienen déficit de servicio de alcantarillado y son menores de 34.5 años de edad y
se encuentran en el departamento de Caquetá tienen mayor susceptibilidad a la
desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 0 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro
y 8 que no.
La siguiente tabla muestra la importancia relativa de cada variable y su tendencia
en el análisis:
Variable Importancia Interpretación
NO_ALCANTARILLADO 0.312 El modelo está caracterizando como
mayoritariamente susceptibles a las
mujeres que no tienen déficit de
alcantarillado.
Sin déficit de alcantarillado
889 Mujeres Gestantes
o 739 Sin deficiencia
o 150 Con deficiencia
Con déficit de alcantarillado
345 Mujeres gestantes
o 246 Sin deficiencia
o 99 Con deficiencia
AFILIADO_1.0 0.103 El modelo está caracterizando como
susceptibles a las mujeres que no están
afiliadas al sistema general de salud.
Afiliados al sistema
1190 Mujeres Gestantes
o 952 Sin deficiencia
o 238 Con deficiencia
No afiliadas al sistema
44 Mujeres gestantes
o 33 Sin deficiencia
o 11 Con deficiencia
49
EDAD 0.102 El modelo está caracterizando como
susceptibles a las mujeres menores de
34.5 años. En el modelo que tiene
mayor especificidad, caracteriza a las
mujeres menores de 16.5 años como
mayor riesgo.
COD_DEPTO_8.0 0.102 El modelo está caracterizando en
términos generales que quienes no
viven en el departamento del Atlántico
tienen mayor riesgo.
COD_DEPTO_25.0 0.085 El modelo está caracterizando en
términos generales que quienes viven
en el departamento de Cundinamarca
tienen mayor riesgo. Esto puede
deberse al balance de las muestras.
COD_DEPTO_18.0 0.069 El modelo está caracterizando en
términos generales a quienes viven en
el departamento del Caquetá como más
susceptible al fenómeno.
CUARTIL_RIQUEZA 0.058 Es llamativo encontrar que el modelo
está caracterizando como población en
riesgo quienes están en los cuartiles 3
y 4 (que son los más altos)
precisamente como mayor riesgo de
padecer desnutrición por deficiencia de
hierro.
PAREDES_2.0 0.055 El modelo tiende a caracterizar como
mujeres con mayor riesgo a quienes
habitan en viviendas cuyas paredes no
son de bahareque sin revocar.
PAREDES_8.0 0.049 El modelo tiende a caracterizar como
mujeres con mayor riesgo a quienes
habitan en viviendas cuyas paredes no
son de zinc, tela, cartón, latas,
desechos, plásticos.
COD_DEPTO_50.0 0.044 El modelo está caracterizando en
términos generales que quienes no
viven en el departamento del Meta
tienen mayor riesgo.
PISOS_4.0 0.022 El modelo está caracterizando las
50
viviendas cuyos pisos no son de
Baldosas, vinilo, tableta o ladrillo,
caucho, otros materiales sintéticos
como los que más presentan riesgo.
51
6 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE
PRIMERA INFANCIA. Para abordar la segunda parte del estudio, es necesario identificar y segmentar la
población de primera infancia entre niños con desnutrición por deficiencia de por
deficiencia de hierro y aquellos que no padecen desnutrición por deficiencia de
micronutrientes. A continuación, se detalla cómo se realiza esta clasificación y los
criterios establecidos para tal efecto.
6.1 Caracterización de la población
A partir de los datos recopilados, el estudio busca identificar las características
generales de la población de mujeres gestantes con el fin de establecer la variable
objetivo que permitirá elaborar el modelo, por tal razón es importante analizar las
siguientes preguntas:
¿Cuántos niños padecen anemia?
¿Cuántos niños padecen deficiencia de hierro?
¿Cuántos niños padecen anemia y deficiencia de hierro?
Por medio de un análisis descriptivo, en la encuesta ENSIN se cuenta con un total
de 9425 registros correspondientes a niños que se pueden clasificar de la siguiente
manera:
Si Si (%) No No (%) Total
Niños con Anemia 1506 15.98% 7919 84.02% 9425
Niños con Deficiencia de Hierro 1304 13.84% 8121 86.16% 9425
Niños con Anemia y Deficiencia de Hierro 381 4.04% 9044 95.96% 9425
Para identificar las proporciones en la población, se muestran los siguientes
gráficos:
52
Ilustración 8 - Distribución de Primera Infancia con Anemia
Ilustración 9 - Distribución de Primera Infancia con Deficiencia de Hierro
Ilustración 10 - Distribución de Primera Infancia con Anemia y Deficiencia de Hierro
1506; 16%
7919; 84%
Primera Infancia con Anemia
Si No
1304; 14%
8121; 86%
Primera infancia con deficiencia de hierro
Si No
381; 4%
9044; 96%
Primera Infancia con anemia y deficiencia de hierro
Si No
53
Es importante anotar que para efectos del estudio, el 4% de niños con anemia por
deficiencia de hierro se ha seleccionado como variable objetivo del estudio. Lo
anterior por considerarlo una fase más avanzada de la enfermedad que resulta
fácilmente diagnosticable en esta etapa. No obstante, dentro de la definición de
hambre oculta puede tratarse la primera infancia con deficiencia de hierro (14% de
la población) como población que padece la enfermedad.
6.2 Análisis descriptivo
El análisis descriptivo se realizó por cada variable utilizando como variable objetivo
la hemoglobina y ferritina de manera independiente. En las variables en las que el
promedio más bajo de hemoglobina coincidieron en una o más categorías de
respuesta con el promedio más bajo de ferritina se constituyó como un hallazgo.
En este sentido las variables más relevantes son:
Variable Edad
Respecto a la Hemoglobina Respecto a la Ferritina
Hay una tendencia muy clara en los niños.
A menor edad, la media de hemoglobina es
más baja, por lo que a menor edad son más
vulnerables.
Hay una tendencia muy clara en los niños.
A menor edad, la media de ferritina es más
baja, por lo que a menor edad son más
vulnerables.
Variable Sexo:
Respecto a la Hemoglobina Respecto a la Ferritina
54
Se observa que la media de hemoglobina
es ligeramente inferior en los niños
respecto a las niñas.
Se observa que la media de ferritina es
significativamente más baja en los niños
respecto a las niñas.
Variable Con Quien Permanece:
Respecto a la Hemoglobina Respecto a la Ferritina
Se observa que las actividades (6. Al
cuidado de un pariente de 18 años o más
diferente a los abuelos en OTRA casa) y (7.
Al cuidado de un pariente menor de 18
años en la casa) son aquellos que tienen
una media de niveles de hemoglobina más
bajo que el resto de las categorías.
Se observa que las actividades (7. Al
cuidado de un pariente menor de 18 años
en la casa) y (4. Con empleada o niñera)
son aquellos que tienen una media de
niveles de ferritina más bajo que el resto de
las categorías.
Esta variable se consideró relevante por la coincidencia en la actividad (7. Al
cuidado de un pariente menor de 18 años en la casa).
Variable Tipo Hogar Asiste:
Respecto a la Hemoglobina Respecto a la Ferritina
55
Se observa que la actividad (3. Centro de
Desarrollo Infantil de ICBF) es aquel que
tiene una media de niveles de
hemoglobina más bajo que el resto de las
categorías en tanto que la categoría (5.
Guardería, sala cuna, preescolar o jardín
privado) es la que tiene una media más
baja.
Se observa que las actividades (1. Hogar
comunitario de ICBF) y (3. Centro de
Desarrollo Infantil de ICBF) son aquellos
que tienen una media de niveles de ferritina
más bajo que el resto de las categorías.
Esta variable se consideró relevante por la coincidencia en la actividad (3. Centro
de Desarrollo Infantil de ICBF).
Variable Problemas de Salud Diarrea:
Respecto a la Hemoglobina Respecto a la Ferritina
La categoría (1. Sí) resulta ligeramente
más baja en su media que quienes no han
tenido problemas de saludo en los últimos
15 días.
La categoría (1. Sí) resulta ligeramente
más baja en su media que quienes no han
tenido problemas de salud diarrea en los
últimos 15 días.
Variable Afiliado:
56
Respecto a la Hemoglobina Respecto a la Ferritina
Se observa una diferencia notable entre
quienes no están afiliados al sistema de
salud (2) en su media respecto a los que sí
(1).
Se observa una diferencia notable entre
quienes no están afiliados al sistema de
salud (2) en su media respecto a los que sí
(1).
Variable Régimen:
Respecto a la Hemoglobina Respecto a la Ferritina
Se observa una pequeña tendencia en la
media a disminuir según el régimen, siendo
la categoría (2. EPS subsidiada) y (3.
Regímenes especiales) tiene la media más
baja.
Se observa una pequeña tendencia en la
media a disminuir según el régimen, siendo
la categoría (2. EPS subsidiada) y (1. EPS
contributiva) tiene la media más baja
Esta variable se consideró relevante por la coincidencia en la categoría (2. EPS
subsidiada).
Variable Departamento
Respecto a la Hemoglobina Respecto a la Ferritina
Departamentos con media más baja: Departamentos con media más baja:
57
27 Chocó
97 Vaupés
44 La Guajira
91 Amazonas
52 Nariño
88 San Andrés
44 La Guajira
47 Magdalena
23 Córdoba
70 Sucre
Coincide en el top 5 el departamento de la Guajira.
Variable Área:
Respecto a la Hemoglobina Respecto a la Ferritina
Hay una ligera diferencia entre la media de
la cabecera municipal (Más alta) respecto al
centro poblado.
Hay una ligera diferencia entre la media de
la cabecera municipal (Más alta) respecto
al centro poblado.
Variable Cuartil Riqueza:
Respecto a la Hemoglobina Respecto a la Ferritina
Hay una tendencia muy marcada en la
media de los niveles de hemoglobina a
medida que aumentan los cuartiles.
Hay una tendencia muy marcada en la
media de los niveles de ferritina a medida
que aumentan los cuartiles.
58
Variable No Cocina:
Respecto a la Hemoglobina Respecto a la Ferritina
La media más baja está en los niños que
tienen déficit en la cocina.
La media más baja está en los niños que
tienen déficit en la cocina.
Variable No alcantarillado:
Respecto a la Hemoglobina Respecto a la Ferritina
La media más baja está en los niños cuyo
hogar tiene déficit de alcantarillado.
La media más baja está en los niños cuyo
hogar tiene déficit de alcantarillado.
Variable No energía:
Respecto a la Hemoglobina Respecto a la Ferritina
59
La media más baja está en los niños cuyo
hogar presenta déficit de energía.
La media más baja está en los niños cuyo
hogar presenta déficit de energía.
Variable No recolección:
Respecto a la Hemoglobina Respecto a la Ferritina
La media más baja está en los niños cuyo
hogar tiene déficit de recolección de
basuras.
La media más baja está en los niños cuyo
hogar tiene déficit de recolección de
basuras.
Variable Paredes:
Respecto a la Hemoglobina Respecto a la Ferritina
60
Las categorías (9. Sin paredes) y (3. Madera
burda, tabla, tablón) son las que cuentan con
los valores más bajos en las medias de
hemoglobina.
Las categorías (9. Sin paredes) y (2.
Bahareque sin revocar) son las que
cuentan con los valores más bajos en las
medias de hemoglobina
Esta variable se seleccionó por la coincidencia en la categoría (9. Sin paredes).
Variable Agua Preparar:
Respecto a la Hemoglobina Respecto a la Ferritina
Las categoría (5. Aguas lluvias), (4. Pozo
sin bomba, jagüey) y (7. Río, quebrada)
cuenta con los valores más bajos en las
medias de hemoglobina.
Las categorías (10. Aguatero), (9. Carro
tanque) y (4. Pozo sin bomba, jagüey)
cuenta con los valores más bajos en las
medias de hemoglobina
Esta variable se seleccionó por la coincidencia en la categoría (4. Pozo sin bomba,
jagüey).
Variable Educación Jefe Hogar:
Respecto a la Hemoglobina Respecto a la Ferritina
61
Llama la atención que entre menor la
educación del jefe del hogar, menor es la
media de hemoglobina.
Aunque la diferencia es muy leve, llama la
atención que entre menor la educación del
jefe del hogar, menor es la media de
ferritina.
En síntesis, el análisis descriptivo muestra una influencia de variables de diferentes
dimensiones, siendo particularmente relevantes las condiciones propias del niño
como su edad y sexo, las condiciones de cuidado del niño como por ejemplo, con
quién pasa la mayoría del tiempo (Entre más lejano el parentesco, mayor riesgo) y
si cuenta o no con la posibilidad de asistir a algún tipo de hogar de asistencia
comunitaria. También, ocupa un lugar destacado algunas condiciones
socioeconómicas del hogar del niño, tales como su cuartil de riqueza, régimen de
afiliación al Sistema General de Salud, departamento y las condiciones de servicios
públicos domiciliarios.
6.3 Análisis de correlaciones
El análisis de correlaciones se realizó:
Por cada variable respecto a la hemoglobina y ferritina de manera
independiente. En las variables en las que el coeficiente de Pearson y ETA
es superior al 10% se constituye como una correlación en el estudio.
Por cada variable respecto a la variable “anemia hierro” que se construye a
partir de la caracterización de la población de acuerdo con los umbrales
descritos en la sección 5.4. En las variables en las que el coeficiente de
Pearson y ETA es superior al 10% se constituye como una correlación en el
estudio. En el caso de las variables analizadas con el método de Chi2, se
constituyen como correlación aquellas que tenga una significancia mayor al
95%. (p < 0.05).
Cuando una variable, se constituyó como “correlacionada” en dos o más variables
62
(Respecto a la hemoglobina, o la ferritina o la variable combinada anemia hierro) se
constituye como un hallazgo en el estudio. A continuación se muestran los
hallazgos:
(*) Destaca las variables que se seleccionan como relevantes para el estudio.
Cifras truncadas a cinco (5) decimales.
Variable Objetivo Hemoglobina
Objetivo Ferritina Objetivo Anemia Hierro
HEMOGLOBINA No aplica Pearson: 0.06738 Pearson: -0.33610
FERRITINA Pearson: 0.06738 No aplica Pearson: -0.17978
TAMANO_HOGAR Pearson: -0.06964 Pearson: -0.00306 Pearson: 0.02717
EDAD* Pearson: 0.287966 Pearson: 0.140916 Pearson: -0.174998
SEXO Biserial (Pearson): -0.03329
Biserial (Pearson): -0.03368
Chi: 3.94221 p: 0.04708
CON_QUIEN_PERMANECE*
eta: 0.17327 eta: 0.08149 Chi: 68.62966 p: 5.77482e-10
TIPO_HOGAR_ASISTE*
eta: 0.11806 eta: 0.05966 Chi: 36.95650 p: 1.83884e-07
PROBLEMAS_SALUD Biserial (Pearson): -0.03239
Biserial (Pearson): 0.07301
Chi: 8.74918 p: 0.00309
PROBLEMAS_SALUD_DIARREA
Biserial (Pearson): -0.08703
Biserial (Pearson): -0.00470
Chi: 9.19221 p: 0.00243
DIAGNOSTICADO Biserial (Pearson): -0.01833
Biserial (Pearson): 0.01494
Chi: 1.98042 p: 0.15934
HOSPITALIZADO Biserial (Pearson): -0.03675
Biserial (Pearson): -0.00674
Chi: 22.17326 p: 2.491183e-06
AFILIADO eta: 0.05906 eta: 0.01842 Chi: 8.15340 p: 0.01696
REGIMEN* eta: 0.10273 eta: 0.02810 Chi: 24.53167 p: 1.93440e-05
COD_DEPTO* eta: 0.33147 eta: 0.11784 Chi: 130.27580 p: 8.188064e-14
AREA eta: 0.05213 eta: 0.02287 Chi: 13.55095 p: 0.00023
CUARTIL_RIQUEZA Pearson: 0.170461 Pearson: 0.0354878 Pearson: -0.0566158
NO_COCINA Biserial (Pearson): -0.04632
Biserial (Pearson): -0.01925
Chi: 4.97914 p: 0.02565
NO_ACUEDUCTO* Biserial (Pearson): -0.12536
Biserial (Pearson): 0.01622
Chi: 20.67324 p: 5.44719e-06
NO_ALCANTARILLADO*
Biserial (Pearson): -0.16112
Biserial (Pearson): -0.01383
Chi: 38.44994 p: 5.617606e-10
63
NO_ENERGIA* Biserial (Pearson): -0.12294
Biserial (Pearson): -0.00710
Chi: 15.09360 p: 0.00010
NO_RECOLECCION* Biserial (Pearson): -0.12969
Biserial (Pearson): -0.02107
Chi: 4.31997 p: 0.03766
PAREDES* eta: 0.18675 eta: 0.04630 Chi: 38.67334 p: 1.31924e-05
PISOS* eta: 0.19095 eta: 0.05003 Chi: 41.85205 p: 1.96667e-07
AGUA_PREPARAR* eta: 0.22670 eta: 0.06509 Chi: 67.35087 p: 9.99284e-10
SEXO_JEFE_HOGAR Biserial (Pearson): 0.00090
Biserial (Pearson) 0.00119
Chi: 0.36896 p: 0.54356
EDUCACION_JEFE_HOGAR
eta: 0.06500 eta: 0.02577 Chi: 4.92939 p: 0.17704
6.4 Regresión lineal
La regresión lineal se utilizó con dos objetivos:
Identificar las variables más relevantes en la tarea de clasificación.
Construir un primer modelo de clasificación.
En este caso, la regresión se hizo directamente contra la variable “anemia hierro”
que se construye a partir de la caracterización de la población de acuerdo con los
umbrales descritos en la sección 5.4. Se utilizaron los siguientes mejores
parámetros hallados:
Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de
entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba
o control del modelo (30%).
C: 0.0171.
Peso de las clases (class_weight): balanced.
Iteraciones máximas (max_iter): 10.
Estrategia de penalización (penalti): L1
Kernel (solver): Liblinear
Métrica para encontrar la mejor calificación: Exhaustividad (Recall).
A continuación, se muestra la importancia relativa de las variables identificadas en
la regresión:
64
Ilustración 11 - Importancia relativa de las variables en el modelo de regresión lineal de primera infancia
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Primera infancia que SI
presenta desnutrición
por ausencia de
micronutrientes (hierro).
10% 70% 137
Primera infancia que NO
presenta desnutrición
por ausencia de
micronutrientes (hierro).
98% 68% 2691
Promedio balanceado
del modelo (Weighted
AVG)
94% 68% 2828
De acuerdo con los resultados la regresión lineal para la población de primera
infancia nos da como resultados:
Del total de los registros que el modelo clasifica como “SI presenta
desnutrición por ausencia de micronutrientes (hierro)”, el 10% en la realidad
sí corresponde a esta condición.
Del total de los registros disponibles para el modelo que en realidad “SI
65
presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de
regresión clasificó correctamente el 70%.
Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la
métrica de exactitud para evaluar el desempeño del modelo. Esto debido a que el
algoritmo se inclinará preferentemente por la clase mayoritaria (Quienes no
padecen la enfermedad) y por ende tendrá un porcentaje de éxito mayor que no
corresponde al objeto del estudio (Identificar a quienes sí padecen la enfermedad).
En la regresión lineal, es claro que el tamaño del hogar tiene la relevancia más alta
para determinar el riesgo de exposición al hambre oculta. En efecto, a mayor es el
tamaño del hogar, se muestra una asociación más alta a la prevalencia de la
enfermedad especialmente cuando se compone de 7 integrantes o más.
Igualmente, el cuartil de riqueza sigue siendo un determinante relevante siendo
particularmente destacados los cuartiles más bajos (1 y 2). Otra condición
particularmente de la regresión lineal y que es consecuente con el análisis
descriptivo es que existe cierto riesgo asociado a padecer al fenómeno de acuerdo
con quién está al frente del cuidado del niño.
6.5 Árbol de decisión
El árbol de decisión se utilizó con tres objetivos:
Identificar las variables más relevantes en la tarea de clasificación.
Construir un segundo modelo de clasificación.
Utilizar un algoritmo más adecuado para las características de los datos
(Ampliamente categóricos).
En este caso, el modelo del árbol de decisión se construyó utilizando como variable
objetivo “anemia hierro” que se construye a partir de la caracterización de la
población de acuerdo con los umbrales descritos en la sección 5.4. Se utilizaron los
siguientes mejores parámetros hallados:
Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de
entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba
o control del modelo (30%).
Índice de medida de impureza: Gini
Profundidad: 5
Peso de las clases (class_weight): balanced.
Métrica para encontrar la mejor calificación: Exhaustividad (Recall).
Se construyeron modelos alternos utilizando técnicas de preparación de los
66
datos para mejorar el desempeño del algoritmo en cuanto al balance de las
clases:
o Submuestreo (Undersampling): Técnica en la cual se reduce la
cantidad de registros de la clase mayoritaria, seleccionando de forma
aleatoria registros de tal manera que no sobrepasen en número a la
cantidad de registros de la clase minoritaria [22].
o Sobremuestreo (Oversampling): Técnica en la cual se aumenta la
cantidad de registros de la clase minoritaria, generando copias
sintéticas de los registros de tal manera que sea igual a la cantidad de
registros de la clase mayoritaria [22].
A continuación, se muestra la importancia relativa de las variables identificadas en
el árbol de decisión:
Datos originales:
Variable Importancia Relativa
EDAD 0.716
AGUA_PREPARAR_5.0 0.075
AGUA_PREPARAR_4.0 0.045
AREA_1.0 0.040
CUARTIL_RIQUEZA 0.028
AGUA_PREPARAR_2.0 0.025
HOSPITALIZADO_0.0 0.018
COD_DEPTO_54.0 0.016
PROBLEMAS_SALUD_DIARREA_0.0 0.016
EDUCACION_JEFE_HOGAR_1.0 0.013
REGIMEN_1.0 0.009
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Primera infancia que SI
presenta desnutrición
por ausencia de
micronutrientes (hierro).
11% 55% 137
Primera infancia que NO
presenta desnutrición
por ausencia de
97% 77% 2691
67
micronutrientes (hierro).
Promedio balanceado
del modelo (Weighted
AVG)
93% 76% 2828
Submuestreo:
Variable Importancia Relativa
EDAD 0.583
AGUA_PREPARAR_5.0 0.100
NO_ALCANTARILLADO 0.057
AGUA_PREPARAR_4.0 0.044
CON_QUIEN_PERMANECE_2.0 0.041
PAREDES_5.0 0.038
COD_DEPTO_23.0 0.034
AGUA_PREPARAR_3.0 0.034
COD_DEPTO_52.0 0.026
CON_QUIEN_PERMANECE_7.0 0.022
TAMANO_HOGAR 0.021
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Primera infancia que SI
presenta desnutrición
por ausencia de
micronutrientes (hierro).
9% 64% 137
Primera infancia que NO
presenta desnutrición
por ausencia de
micronutrientes (hierro).
97% 68% 2691
Promedio balanceado
del modelo (Weighted
AVG)
93% 68% 2691
Sobremuestreo:
Variable Importancia Relativa
68
EDAD 0.585
AGUA_PREPARAR_5.0 0.059
NO_RECOLECCION_nan 0.037
AGUA_PREPARAR_4.0 0.035
HOSPITALIZADO_1.0 0.025
CUARTIL_RIQUEZA 0.025
NO_ENERGIA 0.024
EDUCACION_JEFE_HOGAR_3.0 0.020
AGUA_PREPARAR_6.0 0.020
AGUA_PREPARAR_2.0 0.019
REGIMEN_2.0 0.017
SEXO_1.0 0.017
TIPO_HOGAR_ASISTE_1.0 0.017
HOSPITALIZADO_0.0 0.016
PROBLEMAS_SALUD_DIARREA_0.0 0.015
COD_DEPTO_11.0 0.015
COD_DEPTO_54.0 0.013
AREA_2.0 0.011
TAMANO_HOGAR 0.010
COD_DEPTO_18.0 0.009
EDUCACION_JEFE_HOGAR_2.0 0.007
SEXO_JEFE_HOGAR_1.0 0.005
Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos
de prueba se obtuvieron los siguientes resultados:
Población Precisión Exhaustividad Soporte
Primera infancia que SI
presenta desnutrición
por ausencia de
micronutrientes (hierro).
12% 55% 137
Primera infancia que NO
presenta desnutrición
por ausencia de
micronutrientes (hierro).
97% 80% 2691
Promedio balanceado
del modelo (Weighted
AVG)
93% 79% 2828
El modelo que mostró mejor resultados es el realizado con la técnica de
69
sobremuestreo. De acuerdo con estos resultados se tiene:
Del total de los registros que el modelo clasifica como “SI presenta
desnutrición por ausencia de micronutrientes (hierro)”, el 12% en la realidad
sí corresponde a esta condición.
Del total de los registros disponibles para el modelo que en realidad son “SI
presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de
clasificación basado en árboles con sobremuestreo clasificó correctamente
el 55%.
Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la
métrica de exactitud para evaluar el desempeño del modelo incluyo aplicando las
técnicas de sobremuestreo o submuestreo.
6.6 Consolidación de las variables identificadas en los modelos
Dado que el propósito del estudio es identificar las variables que inciden sobre el
fenómeno del hambre oculta en la población de la primera infancia, a continuación
se resume por cada modelo las variables más relevantes en la caracterización del
fenómeno:
En el resultado analítico se calificó el número de ocurrencias por variable entre el
análisis descriptivo y las correlaciones con el fin de resumir la información. A
continuación se muestra en orden de relevancia las variables que más inciden de
acuerdo con el análisis efectuado:
Top Características -
Analítico
Top Características -
Regresión
Top Características - Árbol
EDAD
COD_DEPTO
CON_QUIEN_PERM
ANECE
TIPO_HOGAR_ASIS
TE
REGIMEN
NO_ALCANTARILLA
DO
NO_ENERGIA
NO_RECOLECCION
PAREDES
AGUA_PREPARAR
TAMANO_HOGAR
CON_QUIEN_PERM
ANECE
CUARTIL_RIQUEZA
SEXO
NO_ENERGIA
NO_COCINA
EDAD
NO_ALCANTARILLA
DO
NO_ACUEDUCTO
AGUA_PREPARAR_5.0
NO_RECOLECCION_nan
AGUA_PREPARAR_4.0
HOSPITALIZADO_1.0
CUARTIL_RIQUEZA
NO_ENERGIA
EDUCACION_JEFE_HOGA
R_3.0
AGUA_PREPARAR_6.0
AGUA_PREPARAR_2.0
REGIMEN_2.0
SEXO_1.0
TIPO_HOGAR_ASISTE_1.0
HOSPITALIZADO_0.0
PROBLEMAS_SALUD_DIA
70
RREA_0.0
COD_DEPTO_11.0
COD_DEPTO_54.0
AREA_2.0
TAMANO_HOGAR
COD_DEPTO_18.0
EDUCACION_JEFE_HOGA
R_2.0
SEXO_JEFE_HOGAR_1.0
A continuación se relacionan las variables que inciden en el fenómeno de acuerdo
con su coincidencia en los modelos realizados:
Variable Desc. Reg. Árb. Desc. y
Reg.
Desc. y
Árb.
Reg. y
Árb.
Desc.,
Reg.
y Árb.
EDAD X
COD_DEPTO X
CON_QUIEN_PERMANECE X
TIPO_HOGAR_ASISTE X
REGIMEN X
NO_ALCANTARILLADO X
NO_ENERGIA
NO_RECOLECCION X
PAREDES X
AGUA_PREPARAR X
TAMANO_HOGAR X
CUARTIL_RIQUEZA X
SEXO X
NO_COCINA X
NO_ACUEDUCTO X
HOSPITALIZADO X
EDUCACION_JEFE_HOGAR X
PROBLEMAS_SALUD_DIARREA X
SEXO_JEFE_HOGAR X
NO_ENERGIA X
Convenciones:
Desc. = Presente solo en el análisis descriptivo.
Reg. = Presente solo en la regresión lineal.
Arb. = Presente solo en el modelo de árbol de decisión.
Desc. y Reg. = Presente en el modelo descriptivo y en la regresión.
Desc. y Arb = Presente en el modelo descriptivo y en el árbol de decisión.
71
Desc, Reg. Y Arb = Presente en el modelo descriptivo, regresión y en el árbol
de decisión.
En términos generales se observa que las variables recopiladas por el modelo
basado en árboles de decisión absorbe de una manera u otra las variables
identificadas en los análisis descriptivos y de regresión puesto que en la medida en
que el árbol de decisión intenta realizar abstraer los rasgos de la información (Con
el riesgo de sobre ajustarse) puede recorrer la totalidad de las variables disponibles.
Por otra parte, solo hay una variable que prevalece en los tres modelos denominada
NO_ENERGIA.
Por tal motivo, se analizarán las variables a continuación a partir del árbol de
decisión.
6.7 Incidencia de las variables identificadas en el árbol de decisión
En las secciones anteriores, por medio de las técnicas de estadística descriptiva,
regresión y un modelo basado en árboles de decisión se determinaron las variables
que pueden estar incidiendo o no en el desarrollo del fenómeno. En esta sección se
estudiará a partir de los árboles de decisión cómo es la incidencia de estas variables
en el fenómeno.
A continuación se muestra el árbol de decisión construido bajo el modelo de
oversampling para la primera infancia:
Ilustración 12 - Rama izquierda del árbol de decisión para la primera infancia
72
Ilustración 13 - Rama izquierda del árbol de decisión para la primera infancia
Para el análisis se tienen en cuentan los nodos finales donde la clase positiva (Con
desnutrición para ausencia de micronutrientes) es mayor que la clase minoritaria
(Sin desnutrición por ausencia de micronutrientes) con una impureza GINI igual a 0.
Si bien el algoritmo permite establecer reglas de negocio para explicar el fenómeno,
debe tenerse en cuenta que la aplicación de manera individual de una determinada
regla no describe fulminantemente el fenómeno sino que debe considerarse como
las piezas clave que en conjunto permiten describir el fenómeno.
En este caso se tienen las siguientes reglas:
a) SI (COD_DEPTO_18 es 1) y (COD_DEPTO_54 es 0) y (CUARTIL_RIQUEZA
es 1 o 2) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES tiene mayor riesgo a
sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que viven en el
departamento del Caquetá, que no viven en el departamento Norte de Santander y
cuyo hogar se encuentra en el Cuartil de Riqueza 1 o 2 y que son menores a 1.5
años tienen mayor susceptibilidad a la desnutrición por deficiencia de
micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se encontró
1 niño que sí tienen desnutrición por deficiencia de hierro y 23 que no.
b) SI (COD_DEPTO_54 es 1) y (CUARTIL_RIQUEZA es 1 o 2) y (EDAD < 1.5)
y (EDAD < 2.5) ENTONCES tiene mayor riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que viven en el
departamento de Norte de Santander, cuyo hogar se encuentra en el Cuartil de
73
Riqueza 1 o 2 y que son menores de 1.5 años tienen mayor susceptibilidad a la
desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos con esta condición no se encontraron niños que sí
tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 32 niños
que no padecen desnutrición oculta.
c) SI (COD_DEPTO_11 es 0) y (REGIMEN_2 es 0) y (CUARTIL_RIQUEZA es
3 o 4) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES tiene mayor riesgo a sufrir
de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que no viven el
en Bogotá D.C. y cuyo régimen de salud corresponde a EPS contributiva o
Regímenes especiales (Fuerzas, Armadas, Ecopetrol, universidades, públicas,
magisterio) y cuyo hogar está caracterizado el cuartil de riqueza 3 o 4 y que son
menores de 1.5 años tienen mayor susceptibilidad a la desnutrición por deficiencia
de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 143 que
no.
d) SI (PROBLEMAS_SALUD_DIARREA_0 es 1) y (REGIMEN_2 es 1) y
(CUARTIL_RIQUEZA es 3 o 4) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES
tiene mayor riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que no
presentaron problemas de salud relacionados con diarrea en los últimos 15 días,
cuyo régimen de afiliación es EPS subsidiada, y cuyo hogar está caracterizado
el cuartil de riqueza 3 o 4 y que son menores de 1.5 años tienen mayor
susceptibilidad a la desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos con esta condición no se encontraron niños que sí
tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 26 niños
que no padecen desnutrición oculta.
e) SI (HOSPITALIZADO_0 es 0) y (TIPO_HOGAR_ASISTE_1 es 0) y
(NO_RECOLECCION_nan es 0) y (EDAD > 1.5) y (EDAD < 2.5)
ENTONCES tiene mayor riesgo a sufrir de hambre oculta.
74
La regla se puede interpretar de la siguiente manera: Los niños que han sido
hospitalizados en el último año y que no asisten a un Hogar comunitario de ICBF
y cuyo hogar puede tener o no servicio de recolección de basuras y son menores
de 2.5 años pero mayores que 1.5 tienen mayor susceptibilidad a la desnutrición
por deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 164 que
no.
f) SI (HOSPITALIZADO_1 es 0) y (AGUA_PREPARAR_2 es 1) y
(NO_RECOLECCION_nan es 1) y (EDAD > 1.5) y (EDAD < 2.5)
ENTONCES tiene mayor riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que no han sido
hospitalizados en el último año y cuya fuente de agua para preparar alimentos
es el acueducto comunal o veredal y cuyo hogar no reporta información sobre la
disponibilidad del servicio de recolección de basuras y son menores de 2.5 años
pero mayores que 1.5 tienen mayor susceptibilidad a la desnutrición por deficiencia
de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se
encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 130 que
no.
g) SI (NO_ENERGIA es 0) y (AGUA_PREPARAR_4 es 1) y (EDAD > 3.5) y
(AGUA_PREPARAR_5 es 0) y (EDAD > 2.5) ENTONCES tiene mayor
riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños cuyo hogar no
tiene déficit de energía y cuya fuente de agua para preparar alimentos es un
pozo sin bomba, jagüey y no tienen disponible como fuente de agua para
preparar alimentos aguas lluvias y son mayores de 3.5 años tienen mayor
susceptibilidad a la desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos se evidenció que con esta condición se encontró
1 niño que sí tienen desnutrición por deficiencia de hierro y 83 que no.
h) SI (TAMANO_HOGAR > 3.5) y (EDUCACION_JEFE_HOGAR_2 es 0) y
(EDAD <= 4.5) y (AGUA_PREPARAR_5 es 1) y (EDAD > 2.5) ENTONCES
75
tiene mayor riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños cuyo hogar están
conformados por 7 personas o más, cuyo jefe del hogar tiene un nivel de
educación distinta a entre primaria completa y secundaria incompleta (5-10
años) y cuya fuente de agua para preparar alimentos es aguas lluvias y son
mayores de 2.5 años pero menores 4.5 tienen mayor susceptibilidad a la
desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos con esta condición no se encontraron niños que sí
tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 47 niños
que no padecen desnutrición oculta.
i) SI (PROBLEMAS_SALUD_DIARREA_0 es 1) y
(EDUCACION_JEFE_HOGAR_2 es 1) y (EDAD <= 4.5) y
(AGUA_PREPARAR_5 es 1) y (EDAD > 2.5) ENTONCES tiene mayor
riesgo a sufrir de hambre oculta.
La regla se puede interpretar de la siguiente manera: Los niños que no han
padecido problemas de salud por diarrea en los últimos 15 días y la educación
del jefe del hogar es entre primaria completa y secundaria incompleta (5-10
años) y su fuente de agua para preparar alimentos es Agua lluvias y su edad es
mayor que 2.5 años pero menor que 4.5 tienen mayor susceptibilidad a la
desnutrición por deficiencia de micronutrientes.
En la comprobación de los datos con esta condición no se encontraron niños que sí
tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 14 niños
que no padecen desnutrición oculta.
La siguiente tabla muestra la importancia relativa de cada variable y su tendencia
en el análisis:
Variable Importancia Interpretación
EDAD 0.585 El modelo está
caracterizando la edad como
el factor de riesgo más
prevalente en el fenómeno.
En efecto, a menor edad el
niño es más vulnerable a la
76
desnutrición y por ende a la
deficiencia de
micronutrientes.
AGUA_PREPARAR_5.0 0.059 El modelo intenta
caracterizar la fuente de
agua de preparar “Agua
lluvia” como un posible
riesgo asociado a la
prevalencia de hambre
oculta.
NO_RECOLECCION_nan 0.037 En el caso de los servicios
de recolección de basuras el
algoritmo asocia
rápidamente a los hogares
que no manifestaron
explícitamente si cuentan o
no con el servicio.
AGUA_PREPARAR_4.0 0.035 El modelo intenta
caracterizar la fuente de
agua de preparar “Pozo sin
bomba, jagüey” como un
posible riesgo asociado a la
prevalencia de hambre
oculta.
HOSPITALIZADO_1.0 0.025 El modelo caracteriza a
quienes no han sido
hospitalizados en el último
año como aquellos con
mayor prevalencia del
fenómeno.
CUARTIL_RIQUEZA 0.025 De acuerdo con el modelo
en las menores edades
(menores de 2.5 años) se
asocia a los cuartiles más
bajos (1y 2) en tanto que en
las edades mayores el
algoritmo caracteriza los
cuartiles más altos (3 y 4)
como los de mayor riesgo.
NO_ENERGIA 0.024 El modelo caracteriza los
77
hogares sin déficit de
energía como los más
propensos a desarrollar el
fenómeno.
EDUCACION_JEFE_HOGAR
_3.0
0.020 En general, el modelo
intenta caracterizar a
quienes tienen un nivel de
educación distinto a “Entre
secundaria completa y
superior incompleta (11-15
años)” como los más
propensos a padecer de
hambre oculta.
AGUA_PREPARAR_6.0 0.020 El modelo asocia la fuente
de agua para preparar
“Manantial, nacimiento”
como uno de los factores de
riesgo.
AGUA_PREPARAR_2.0 0.019 El modelo asocia la fuente
de agua para preparar
“Manantial, nacimiento”
como uno de los factores de
riesgo.
REGIMEN_2.0 0.017 El modelo asocia las
personas con régimen de
salud “EPS subsidiada” a
ser menos propensos a la
prevalencia del hambre
oculta.
SEXO_1.0 0.017 El modelo caracteriza a las
niñas como población
especialmente vulnerable al
fenómeno del hambre
oculta.
TIPO_HOGAR_ASISTE_1.0 0.017 El modelo caracteriza a los
niños que no asisten a un
hogar comunitario de ICBF
como más propensos al
hambre oculta.
HOSPITALIZADO_0.0 0.016 El modelo caracteriza a
78
quienes no han sido
hospitalizados en el último
año como aquellos con
mayor prevalencia del
fenómeno.
PROBLEMAS_SALUD_DIAR
REA_0.0
0.015 El algoritmo caracteriza a los
niños que han sufrido
episodios de diarrea en los
últimos 15 días con mayor
tendencia a sufrir deficiencia
de micronutrientes.
COD_DEPTO_11.0 0.015 El modelo caracteriza con
mayor riesgo a quienes no
se encuentran en Bogotá
D.C.
COD_DEPTO_54.0 0.013 El modelo caracteriza con
mayor riesgo a quienes
habitan en el departamento
de Norte de Santander.
AREA_2.0 0.011 El modelo también
considera que hay mayor
riesgo en la población que
habita en el “Resto (Centro
poblado)” que en la
cabecera municipal o las
áreas rurales.
TAMANO_HOGAR 0.010 El modelo caracteriza que
los hogares que tienen 7
integrantes o más son más
propensos a tener
prevalencia de hambre
oculta.
COD_DEPTO_18.0 0.009 El modelo caracteriza con
mayor riesgo a quienes
habitan en el departamento
de Caquetá.
EDUCACION_JEFE_HOGAR
_2.0
0.007 El modelo caracteriza con
mayor riesgo a los hogares
cuyo jefe del hogar tiene una
educación “Entre primaria
79
completa y secundaria
incompleta (5-10 años)”
SEXO_JEFE_HOGAR_1.0 0.005 El modelo caracteriza con
mayor riesgo los hogares
cuyo rol de jefe de hogar es
asumido por un hombre.
80
7. VALIDACIÓN CON LOS EXPERTOS
En esta sección se recopilan los conceptos más relevantes emitidos por los expertos
en la materia. Para comenzar, es importante señalar que dada la complejidad del
fenómeno estudiado, muchas de los hallazgos pueden explicarse por medio de la
asociación de otros fenómenos conocidos en la sociedad. Sin embargo, hay otros
fenómenos hallados en el estudio que pueden no tener explicación y no
necesariamente se deben entender como erróneos o no válidos para la
caracterización del fenómeno. Por el contrario, se constituyen como hallazgos que
deberán ser estudiados posteriormente para comprobar o rechazar completamente
su incidencia en el fenómeno del hambre oculta.
7.1 Población de Mujeres Gestantes
En la población de mujeres gestantes la anemia por deficiencia de hierro (ADEF),
de acuerdo con el estudio, está asociado a factores socioeconómicos tales como
las características de la vivienda, ingresos económicos, factores alimentarios como
calidad de la dieta, factores de salud, por lo que ciertas enfermedades pueden
desencadenar esta deficiencia (parásitos) y otros factores como genéticos como la
raza aunque son menos frecuentes.
De acuerdo con las variables que muestra el árbol de decisión:
a) Aunque tener alcantarillado resulta un factor en el que hay más gestantes
con ADEF, en términos de proporción es mayor el evento en aquellas que
presentan déficit de alcantarillado, en ambos casos podría explicarse en la
medida en que, si bien esta es una característica de la vivienda, pueden en
ciertas mujeres gestantes tener relevancia es aspectos como los hábitos de
higiene, por ejemplo, el lavado de manos.
b) En cuanto a la variable de afiliación en Colombia se ha avanzado
notablemente en lograr cobertura universal. A pesar de ellos hay cerca de un
5% de la población sin afiliar al sistema general de salud. Nuevamente
aunque en términos absolutos hay más gestantes con ADEF con afiliación,
en proporción en 1 de cada 4 gestantes sin afiliación pueden presentar la
condición. Esto se debe a que contar con la afiliación al Sistema de
Seguridad Social en Salud no necesariamente garantiza la atención en salud
y más aún que ésta sea de calidad, por lo cual, no necesariamente al
pertenecer algún régimen garantiza que estén recibiendo la suplementación
con vitaminas y minerales que para esta población es obligatoria.
c) Frente a los resultados de edad, tiene gran relevancia que identifique a las
mujeres menores de 16.5 años con mayor probabilidad de tener ADEF ya
81
que este grupo edad por lo general presentan embarazos de alto riesgo, en
la medida que aún el cuerpo femenino no está preparado para el embarazo
y menos aún tiene las reservas suficientes de hierro que se requieren para
este proceso.
d) En relación a los resultados por departamento, éstos pueden deberse a la
disponibilidad y consumo de alimentos que son de mayor o menor consumo
en cada uno de estos sitios, es decir pueden relacionarse con los patrones y
hábitos alimentarios de una persona y a la facilidad o no de adquirir cierto
tipos de alimentos.
e) Para el caso de cuartil de riqueza, estos resultados se relacionan
directamente con la calidad de la alimentación, es decir, parte de la
deficiencia en el crecimiento y la deficiencia de vitaminas y minerales se
explica porque no es suficiente con garantizar las calorías (evitar desnutrición
aguda) sino que se debe llevar una alimentación saludable (CESA:
Completa, Equilibrada, Suficiente y Adecuada).
f) Finalmente para los resultados de paredes y pisos se relacionan con las
condiciones de la vivienda, aunque son contradictorios en especial lo
relacionado con las paredes de bareque pero puede probablemente deberse
a la proporción en cada categoría.
7.2 Población de Primera Infancia
La anemia por deficiencia de hierro (ADEF) en niños es un evento de alto impacto,
no sólo en la edad que tengan, sino que tiene efectos a lo largo de la vida de estos
individuos en la medida que se ha limitado su desarrollo cerebral y por ende las
capacidades que puede llegar a expresarse en las etapas posteriores.
De acuerdo a lo anterior, al revisar el resultado en que la variable edad es clave en
identificar que a menor edad del niño o niña tiene más riesgo de presentar ADEF,
lo cual, se relaciona con la práctica de lactancia materna e inicio de la alimentación
complementaria, siendo estas características muy importantes en el aporte del
hierro a través del consumo de alimentos.
En cuanto a las fuentes de agua, el modelo muestra que hay mayor probabilidad de
presentar el evento cuando el agua no es potable, lo cual es explicable en la medida
que se preparan alimentos con agua que no tiene las condiciones adecuadas, lo
que implica que puede tener parásitos y estos a su vez puede causar anemia.
Frente a los resultados relacionados con el estado de salud, de ser más propensos
quienes no han estado hospitalizados en el último año podría explicarse que
aquellos que han tenido esta condición pueden haber recibido suplementación y
82
fortificación con micronutrientes. Así mismo, quienes han presentado diarrea en los
últimos quince días tienen mayor probabilidad de presentar ADEF debido a que los
eventos pueden relacionarse con la presencia de parásitos, adicionalmente cuando
se presenta diarrea también disminuye el apetito y por lo tanto se afecta el consumo
de alimentos.
Para el caso de la variable de cuartil de riqueza, dos resultados relevantes: El
primero, que a menor edad mayor probabilidad si estás en los primeros cuartiles, es
decir condiciones de vivienda desfavorables y baja capacidad adquisitiva para la
compra de alimentos. El segundo, que en edades mayores está relacionado con los
cuartiles más altos, lo que puede explicarse con la calidad de la alimentación que
se adquiere en la familia.
En relación a la variable de número de integrantes por hogar tiene sentido que sea
más probable en hogares varios miembros, debido a que la comida debe repartirse
en un mayor número de personas. En cuanto a los resultados de nivel educativo
del jefe de hogar, se pueden explicar a través de la evidencia disponible para el
caso de desnutrición crónica en menores de cinco años, en donde la presencia del
evento es inversamente proporcional al nivel educativo de la madre.
83
8. CONCLUSIONES Y TRABAJOS FUTUROS
A continuación, se presentan los principales hallazgos y conclusiones de la
investigación:
a) Las diferentes dimensiones presentadas y estudiadas a lo largo de esta
investigación tales como las dimensiones geográficas, sociales, condiciones
del hogar, y económicas son tanto o más relevantes en el desarrollo del
fenómeno de la desnutrición oculta que la dimensión exclusivamente
individual o clínico de la enfermedad.
b) En la población de las mujeres gestantes, el presente estudio muestra que la
enfermedad de desnutrición oculta tiene una especial prevalencia en:
i. Las mujeres gestantes que aún no cuentan con acceso al sistema
general de salud.
ii. Las mujeres gestantes cuyo hogar no cuenta con acceso al servicio
de alcantarillado.
iii. Las mujeres gestantes cuyo hogar tiene deficiencias de infraestructura
especialmente cuyos pisos no sean de baldosas, vinilo, tableta o
ladrillo, caucho, otros materiales sintéticos.
iv. Las mujeres gestantes cuyos hogares se ubican en los cuartiles de
riqueza más altos.
c) En la población de la primera infancia, el presente estudio muestra que la
enfermedad de desnutrición oculta tiene una especial prevalencia en:
i. Los niños que viven en los departamentos del Caquetá y Norte de
Santander y cuyo hogar se encuentra ubicado en los cuartiles de
riqueza más bajos (1 y 2) cuya edad es menor que 2.5 años.
ii. Los niños que no viven en la capital de la república, cuyos padres
pertenecen al régimen contributivo y cuyo hogar se encuentra ubicado
en los cuartiles de riqueza más altos (3 y 4) y su edad es menor que
2.5 años.
iii. Los niños cuyo hogar tiene como fuente de agua primaria para
preparar alimentos acueducto comunal o veredal y no cuentan o
reportan servicio de recolección de basuras y son menores de 2.5
años.
iv. Los niños cuyo hogar tiene como fuente de agua primaria para
preparar alimentos pozo sin bomba, jagüey, su hogar cuenta con
servicio eléctrico y son mayores de 3.5 años.
v. Aunque no se pudo comprobar con la muestra, se muestra una
asociación de riesgo en los niños cuyo hogar está conformado por más
de siete (7) personas.
84
vi. Aunque no se pudo comprobar en la muestra, hay una asociación del
fenómeno con los niños que no permanecen al cuidado de su entorno
familiar más cercano. Es decir, hay mayor riesgo de prevalencia de la
enfermedad en los niños que son cuidados por familiares distantes o
incluso por terceros.
d) Pese a que, de acuerdo con la muestra la población estudiada cuenta con
una cobertura del sistema general del sistema nacional de salud superior al
90%, es importante que las entidades gubernamentales trabajen en mejorar
la calidad del sistema para que los usuarios en general puedan acceder
oportunamente a las campañas de prevención y tratamiento.
e) La metodología propuesta a lo largo de esta investigación permite realizar
una nueva aproximación por medio de las herramientas provistas por la
ciencia de datos para comprender, caracterizar y enfocar los recursos para
la atención y prevención del fenómeno del hambre oculta en Colombia.
8.1 Trabajos futuros
A partir del resultado de esta investigación, se proponen las siguientes iniciativas
para el descubrimiento de patrones y nuevos hallazgos que permitan proponer
estrategias adicionales en contra de la desnutrición por micronutrientes. De
antemano, es importante que el gobierno o las entidades designadas para ello
continúen realizando esfuerzos por recopilar la mayor cantidad de información
posible de manera estructurada para proveer materia prima para los estudios
propuestos:
a) El estudio actual no incluye información sobre los hábitos de consumo de
alimentos, el cual, es una variable considerada fundamental en el desarrollo
En la desnutrición por micronutrientes. Por lo tanto, nuevos estudios que
centren su atención sobre la frecuencia y calidad de la ingesta de alimentos
en las poblaciones objetivo pueden generar un gran valor a la hora de
proponer estrategias complementarias a suplementación.
b) El estudio actual no incluye dentro de sus dimensiones socioeconómicas
otras variables como:
i. Disponibilidad de alimentos o centros de acopio.
ii. Robustez de la infraestructura y comunicaciones (Vías de acceso,
aeropuertos, puertos)
iii. Indicadores económicos tales como índice de precios al consumidor
(IPC), tasas de cambio representativas del mercado o indicadores de
la canasta familiar presentes en la Bolsa Mercantil de Colombia.
En ese sentido, dichas dimensiones pueden tener relaciones significativas
con el desarrollo de la desnutrición y la desnutrición por deficiencia de
85
micronutrientes, por lo que estudios posteriores pueden generar visiones
complementarias.
c) Dado que el propósito de este estudio se centró en la explicación de la
incidencia en el fenómeno estudiado, se prefirieron algoritmos cuyo
funcionamiento resultara fácilmente explicable. Desde el punto de vista de la
creación de modelos predictivos pueden explorarse otros algoritmos más
sofisticados como, por ejemplo, las redes neurales que permitan mayores
niveles de precisión sobre la identificación de población en riesgo.
86
BIBLIOGRAFÍA [1] «El hambre en el mundo lleva tres años sin disminuir y la obesidad sigue creciendo».
https://www.who.int/es/news-room/detail/15-07-2019-world-hunger-is-still-not-going-
down-after-three-years-and-obesity-is-still-growing-un-report (accedido jun. 29, 2020).
[2] «El “Hambre Oculta”, un grave problema de salud pública en América Latina y el
Caribe | World Food Programme», Programa Mundial de Alimentos.
https://es.wfp.org/noticias/el-hambre-oculta-un-grave-problema-de-salud-publica-en-
america-latina-y-el-caribe (accedido mar. 20, 2020).
[3] FAO, OPS, WFP y UNICEF, «Panorama de la seguridad alimentaria y nutricional en
América Latina y el Caribe 2018. Santiago.» 2018.
[4] J. W. Tukey, «The Future of Data Analysis», en Breakthroughs in Statistics: Methodology and Distribution, S. Kotz y N. L. Johnson, Eds. New York, NY: Springer
New York, 1992, pp. 408-452.
[5] W. Cleveland, «Data Science: An Action Plan for Expanding the Technical Areas of
the Field of Statistics», International Statistical Review / Revue Internationale de
Statistique, vol. 69, mar. 2001, doi: 10.1111/j.1751-5823.2001.tb00477.x.
[6] «WHO | Haemoglobin concentrations for the diagnosis of anaemia and assessment of
severity», WHO. http://www.who.int/vmnis/indicators/haemoglobin/en/ (accedido may
31, 2020).
[7] N. González Hernández, S. Rodriguez González, y A. Arriola, «Hambre Oculta», 1,
vol. 8, p. 109, abr. 2017.
[8] «Malnutrición: no se trata solamente de hambre», Organización Mundial de la Salud,
oct. 25, 2017. https://www.who.int/es/news-room/commentaries/detail/malnutrition-it-
s-about-more-than-hunger (accedido mar. 20, 2020).
[9] «Malnutrición», Organización Mundial de la Salud, feb. 16, 2018.
https://www.who.int/es/news-room/fact-sheets/detail/malnutrition (accedido mar. 20,
2020).
[10] «El hambre oculta nos afecta a todos», El hambre oculta nos afecta a todos, ago. 11,
2019. https://twnews.co/co-news/el-hambre-oculta-nos-afecta-a-todos (accedido mar.
20, 2020).
[11] «Organización de las Naciones Unidas para la Alimentación y la
Agricultura: Aunque en Colombia se reduce, el hambre aumenta en el mundo: informe
ONU sobre hambre y malnutrición | FAO en Colombia | Organización de las Naciones
Unidas para la Alimentación y la Agricultura», FAO, jul. 15, 2019.
http://www.fao.org/colombia/noticias/detail-events/es/c/1202301 (accedido mar. 20,
2020).
[12] «OMS | Carencia de micronutrientes», WHO.
http://www.who.int/nutrition/topics/ida/es/ (accedido mar. 20, 2020).
[13] M. S. Rahman, M. Mushfiquee, M. S. Masud, y T. Howlader, «Association between
malnutrition and anemia in under-five children and women of reproductive age:
Evidence from Bangladesh Demographic and Health Survey 2011», PLOS ONE, vol.
14, n.o 7, p. e0219170, jul. 2019, doi: 10.1371/journal.pone.0219170.
[14] M. C. et al., «Anemia: An indicator for malnutrition in the elderly», Annals of
hematology, vol. 80, pp. 295-8, 2001, doi: 10.1007/s002770100287.
[15] W. Yang et al., «Anemia, malnutrition and their correlations with socio-
demographic characteristics and feeding practices among infants aged 0-18 months in
87
rural areas of Shaanxi province in northwestern China: a cross-sectional study.», BMC
Public Health, vol. 12, p. 1127, dic. 2012, doi: 10.1186/1471-2458-12-1127.
[16] J. E. Ewusie, J. Beyene, C. Ahiadeke, y J. S. Hamid, «Malnutrition in Pre-school
Children across Different Geographic Areas and Socio-Demographic Groups in
Ghana.», Matern Child Health J, vol. 21, n.o 4, pp. 797-808, abr. 2017, doi:
10.1007/s10995-016-2173-z.
[17] A. IBM, «Analytics Solutions Unified Method», mar. 2016, [En línea]. Disponible
en: ftp://ftp.software.ibm.com/software/data/sw-library/services/ASUM.pdf.
[18] «Encuesta Nacional de Situación Nutricional (ENSIN)».
https://www.minsalud.gov.co/salud/publica/epidemiologia/Paginas/encuesta-nacional-
de-situacion-nutricional-ensin.aspx (accedido may 25, 2020).
[19] «OMS | Concentraciones de ferritina para evaluar el estado de nutrición en hierro en
las poblaciones.», WHO. http://www.who.int/vmnis/indicators/ferritin/es/ (accedido
may 31, 2020).
[20] N. S. Chok, «Pearson’s Versus Spearman’s and Kendall’s Correlation Coefficients
for Continuous Data», sep. 2010.
[21] R. K. Prematunga, «Correlational analysis», Australian Critical Care, vol. 25, n.o 3,
pp. 195-199, ago. 2012, doi: 10.1016/j.aucc.2012.02.003.
[22] S. García, A. Fernández, y F. Herrera, «Enhancing the effectiveness and
interpretability of decision tree and rule induction classifiers with evolutionary training
set selection over imbalanced problems», Applied Soft Computing, vol. 9, n.o 4, pp.
1304-1314, sep. 2009, doi: 10.1016/j.asoc.2009.04.004.