tesis de grado sistema analítico para la identificación y

87
TESIS DE GRADO Sistema Analítico para la Identificación y Prevención Temprana del Hambre Oculta en Colombia DIEGO FERNANDO ESCOBAR TRUJILLO Asesores: MARÍA DEL PILAR VILLAMIL GIRALDO ANDRÉS DARIO MORENO BARBOSA JOHN CALVO MARTINEZ UNIVERSIDAD DE LOS ANDES MAESTRÍA EN INGENIERÍA DE INFORMACIÓN BOGOTA D.C. JUNIO, 2020

Upload: others

Post on 12-Nov-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TESIS DE GRADO Sistema Analítico para la Identificación y

TESIS DE GRADO

Sistema Analítico para la Identificación y Prevención Temprana del Hambre

Oculta en Colombia

DIEGO FERNANDO ESCOBAR TRUJILLO

Asesores:

MARÍA DEL PILAR VILLAMIL GIRALDO

ANDRÉS DARIO MORENO BARBOSA

JOHN CALVO MARTINEZ

UNIVERSIDAD DE LOS ANDES

MAESTRÍA EN INGENIERÍA DE INFORMACIÓN

BOGOTA D.C.

JUNIO, 2020

Page 2: TESIS DE GRADO Sistema Analítico para la Identificación y

2

Dedicatoria:

A Dios, fuente y autor de todo bien, quien ha inspirado en el corazón humano el

desarrollo de esta obra y tantas otras más para el bien de cada uno de sus hijos.

¡A Él sea la honra, el honor, y la gloria por los siglos de los siglos!

Page 3: TESIS DE GRADO Sistema Analítico para la Identificación y

3

Agradecimientos:

A mis padres Nubia Trujillo y Hernando Escobar, por cuya humildad, esfuerzo y

apoyo incondicional, me han permitido recorrer este camino y dar siempre lo mejor

de mí. A Ángela Mancipe, cuya inspiración y palabras de aliento llegaron en el

momento en que más lo necesitaba.

A mis asesores de tesis, John, Andrés y especialmente María del Pilar que con su

conocimiento y paciencia direccionaron este esfuerzo a buen término. A Elisa

Cadena, quien con una apertura única y gran experticia en la temática estuvo

siempre atenta a resolver mis inquietudes.

Y a todas las personas que, de alguna u otra manera durante este proceso han

contribuido a ser una mejor versión de mí: Compañeros de estudios, maestros,

administrativos, simplemente ¡Gracias!,

Page 4: TESIS DE GRADO Sistema Analítico para la Identificación y

4

Contenido 1. INTRODUCCIÓN ............................................................................................................ 6

1.2 Problema .................................................................................................................. 6

1.3 Objetivos .................................................................................................................. 7

2 CONTEXTO .................................................................................................................... 8

2.1 Ciencia de Datos ...................................................................................................... 8

2.2 Desnutrición Oculta.................................................................................................. 9

2.3 Diagnóstico del hambre oculta .............................................................................. 11

3 ESTADO DEL ARTE DE LA DESNUTRICIÓN POR MICRONUTRIENTES ............... 13

3.1 Observaciones sobre los estudios analizados y diferencias sobre el enfoque de

esta investigación ............................................................................................................. 18

4 ESTUDIO DEL HAMBRE OCULTA EN COLOMBIA ................................................... 20

4.1 Escenario Analítico ................................................................................................ 20

4.2 Fuentes de datos ................................................................................................... 21

4.3 Segmentación de la población .............................................................................. 22

4.4 Selección de variables de interés .......................................................................... 22

4.5 Definición de desnutrición por deficiencia de hierro en la población objetivo ...... 26

4.6 Metodología de estudio ......................................................................................... 27

4.7 Discusión e interpretación de los resultados de los modelos ............................... 28

5 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE MUJERES

GESTANTES. ....................................................................................................................... 29

5.1 Caracterización de la población ............................................................................ 29

5.2 Análisis descriptivo ................................................................................................ 31

5.3 Análisis de correlaciones ....................................................................................... 35

5.4 Regresión lineal ..................................................................................................... 37

5.5 Árbol de decisión ................................................................................................... 40

5.6 Consolidación de las variables identificadas en los modelos ............................... 43

5.7 Incidencia de las variables identificadas en el árbol de decisión ......................... 45

6 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE PRIMERA

INFANCIA. ............................................................................................................................ 51

6.1 Caracterización de la población ............................................................................ 51

6.2 Análisis descriptivo ................................................................................................ 53

6.3 Análisis de correlaciones ....................................................................................... 61

6.4 Regresión lineal ..................................................................................................... 63

Page 5: TESIS DE GRADO Sistema Analítico para la Identificación y

5

6.5 Árbol de decisión ................................................................................................... 65

6.6 Consolidación de las variables identificadas en los modelos ............................... 69

6.7 Incidencia de las variables identificadas en el árbol de decisión ......................... 71

7. VALIDACIÓN CON LOS EXPERTOS .......................................................................... 80

7.1 Población de Mujeres Gestantes........................................................................... 80

7.2 Población de Primera Infancia ............................................................................... 81

8. CONCLUSIONES Y TRABAJOS FUTUROS ............................................................... 83

8.1 Trabajos futuros ..................................................................................................... 84

BIBLIOGRAFÍA ..................................................................................................................... 86

Page 6: TESIS DE GRADO Sistema Analítico para la Identificación y

6

1. INTRODUCCIÓN

El hambre es una de las guerras en que la humanidad está lejos de ganar. A pesar

de los avances en el cultivo, producción y distribución de alimentos millones de

personas aún pasan hambre [1]. Muchas organizaciones y gobiernos han trabajado

con logros significativos en diversas estrategias para que el alimento llegue a más

personas, sin embargo, la magnitud de la problemática sigue sobrepasando todo

esfuerzo.

No siendo suficientemente enorme la tarea de erradicar el hambre en el mundo,

asoma un nuevo enemigo que se ha denominado “hambre oculta” [2]. Si bien ya

están ampliamente documentados los efectos en la salud y en la sociedad de una

población que pasa hambre de manera aguda o crónica, aún está por cuantificarse

el impacto real en la sociedad de las poblaciones que padecen hambre oculta, por

lo que desde ya requiere una especial atención por parte de los líderes de la

sociedad. El hambre oculta se caracteriza por la deficiencia de uno o más

micronutrientes y se ha intentado abordar a través de las mismas estrategias

utilizadas para la lucha contra el hambre pero dado que tiene características muy

particulares, estos esfuerzos para combatirlos resultan aún más ineficaces.

La presente investigación propone un nuevo enfoque basado en la ciencia de datos

que permita identificar los rasgos de la población en riesgo de padecer hambre

oculta. Este nuevo enfoque intenta ir un paso más allá de analizar la relación entre

una determinada variable y la prevalencia del fenómeno sino que intenta explicar

cómo desde un contexto socioeconómico pueden encontrarse grupos poblacionales

en riesgo que puedan ser sujeto de programas gubernamentales que permitan

intervenir y mitigar el impacto del hambre oculta en Colombia.

Por tanto, la serie de técnicas y análisis de resultados que se proponen a lo largo

de la investigación buscan direccionar de una mejor manera los recursos destinados

para abordar el problema del hambre oculta en el contexto social del país, con la

premisa general que son una herramienta más para seguir vigentes en una lucha

contra el hambre que aún se tiene pendiente por vencer.

1.2 Problema

Al igual que la desnutrición aguda o crónica, el hambre oculta está asociada a un

conjunto de variables multifactoriales cuya complejidad es ciertamente alta y

requieren un tratamiento integral lo que dificulta su adecuada gestión por parte de

los organismos y gobiernos que se proponen luchar contra estas patologías [3].

Page 7: TESIS DE GRADO Sistema Analítico para la Identificación y

7

Por otra parte, las estrategias convencionales usadas para la lucha contra la

desnutrición en todas sus manifestaciones, si bien han mostrado resultados

esperanzadores, a hoy lucen insuficientes debido a que precisamente se enfocan

en el componente clínico de la enfermedad y su tratamiento específico relegando a

un segundo plano otros componentes que pueden tener una incidencia significativa

sobre la enfermedad.

Por tanto, en el contexto de la realidad social y cultural de Colombia el problema

radica en proveer una herramienta a los entes gubernamentales que les permita

identificar cuáles son las variables que más inciden sobre el fenómeno del hambre

oculta y así permitirles direccionar con una alta efectividad los recursos necesarios

para su intervención, a su vez que se permita identificar sectores de población

particularmente en riesgo minimizando la magnitud de la problemática y su impacto

en el país.

1.3 Objetivos

La presente investigación plantea los siguientes objetivos:

Objetivo General:

Identificar las condiciones socioeconómicas más relevantes de los sectores de la

población con mayor riesgo de exposición al hambre oculta por deficiencia de hierro.

Objetivos específicos:

a) Identificar las fuentes de datos más representativas para la construcción de

un modelo analítico.

b) Caracterizar y segmentar la población objetivo más relevante para el estudio

de la prevalencia del fenómeno del hambre oculta.

c) Identificar y comprender la relevancia de las características socioeconómicas

en el desarrollo del fenómeno del hambre oculta a través de modelos

estadísticos, descriptivos o analíticos.

Page 8: TESIS DE GRADO Sistema Analítico para la Identificación y

8

2 CONTEXTO

Para comprender el desarrollo de presente la investigación es necesario tener

presente dos conceptos fundamentales: Ciencia de datos y Hambre Oculta. A

continuación se describe cada uno de ellos y posteriormente se mostrará cómo se

relacionan estrechamente con el fin de explicar con las herramientas dispuestas en

la ciencia de datos el fenómeno del hambre oculta en Colombia.

2.1 Ciencia de Datos

En la medida en que las tecnologías de la información se han adentrado más en la

cotidianidad y se ha hecho posible recopilar y procesar cada vez más y mejor

información, se ha hecho evidente que es un recurso de una utilidad excepcional

para analizar, interpretar y emprender acciones sobre fenómenos de una

complejidad muy alta que quizás, en otras etapas de la historia de la humanidad, no

se hubieran imaginado.

Este potencial ha emergido por medio de diversas disciplinas que han ido aportando

conocimiento a la sociedad inicialmente de manera individual, como por ejemplo,

las matemáticas, la estadística, la programación y la informática. Por tanto, no pasó

mucho tiempo para que la combinación de esas diversas disciplinas comenzaran a

ser asociadas y agrupadas bajo un nuevo término, denominado “Ciencia de datos”

que a su vez se definió como “Procedimientos para analizar datos, técnicas para

interpretar los resultados de dichos procedimientos, formas de planificar la

recopilación de datos para hacer su análisis más fácil, más preciso o acertado, y

toda la maquinaria y los resultados de las estadísticas matemáticas que se aplican

al análisis de datos.” [4]

Ha sido tan relevante el desempeño de la Ciencia de Datos para la resolución de

problemas complejos, que en el 2001 se propuso como una nueva disciplina

independiente involucrando adicionalmente la computación con datos, a través de

seis áreas técnicas concretas: investigaciones multidisciplinarias, modelos y

métodos para datos, computación con datos, pedagogía, evaluación de

herramientas, y teoría. [5]

Es por esta razón que para el desarrollo de esta investigación se involucran

especialmente esas áreas de la ciencia de datos:

Programación: Por medio de un lenguaje de programación, en este caso

Python, se codifica una serie de instrucciones de tal manera que sean

interpretables por el equipo de cómputo. De esta manera, se consigue

Page 9: TESIS DE GRADO Sistema Analítico para la Identificación y

9

realizar una gran cantidad de cálculos en muy poco tiempo que de otra

manera no sería posible realizar.

Estadística: La estadística consiste en una serie de herramientas que

permiten analizar e interpretar un conjunto de datos determinado. A través

de estas herramientas es posible evaluar y establecer la validez de un

resultado de manera objetiva, siendo especialmente útil para concretar las

acciones a tomar sobre los datos.

Comunicación: Desde la perspectiva de la ciencia de datos, es una

habilidad que permite el trabajo armónico entre diferentes equipos o

disciplinas. Su valor radica precisamente en que no basta con las habilidades

estrictamente técnicas para tratar el fenómeno sino también con habilidades

blandas que permitan socializar los resultados y crear acciones que puedan

ser ejecutados por otros actores de la sociedad.

Conocimiento de dominio: Hace referencia a la experiencia específica en

un campo o disciplina en la sociedad. Su importancia radica en que, junto a

las habilidades analíticas, permiten entender el fenómeno a la luz de los

resultados obtenidos y proponer acciones consecuentes con la realidad del

entorno sujeto de estudio.

2.2 Desnutrición Oculta

La desnutrición crónica por ausencia de micronutrientes o hambre oculta es una

enfermedad caracterizada por la ingesta inadecuada de vitaminas y minerales cuya

carencia supone un grave riesgo para la salud especialmente en niños menores de

cinco (5) años y mujeres en estado de gestación [6]. A diferencia de otras formas

de desnutrición, el hambre oculta no presenta los síntomas o signos evidentes

relacionados con una pobre alimentación por lo que su diagnóstico frecuentemente

es tardío y se realiza cuando las consecuencias son particularmente graves.

El término hambre oculta surge precisamente porque esta enfermedad puede

presentarse en pacientes que cumplen una o varias de las siguientes condiciones:

a) No presentan signos clásicos de desnutrición, como por ejemplo, delgadez.

b) Cuentan con acceso a diversos alimentos sin restricciones de carácter

geográfico, económicas o dietarios superando incluso las porciones de

alimento diario recomendados.

c) Inclusive pueden presentar signos de obesidad.

Y aun así presentar deficiencias de micronutrientes que pueden derivar más

adelante en problemas más serios para la salud e inclusive la muerte. De hecho, la

desnutrición y el hambre oculta contribuyen a aumentar la tasa de morbilidad de

Page 10: TESIS DE GRADO Sistema Analítico para la Identificación y

10

niños contribuyendo con hasta un tercio de las muertes infantiles, una cifra alta si

se compara con otras patologías de carácter infectocontagioso como, por ejemplo,

la malaria y la tuberculosis [7]. Esto sugiere que, en gran parte de los casos de

hambre oculta, los pacientes cuentan con un buen índice de masa corporal y una

talla adecuada (Signos clásicos de desnutrición) dificultando así su temprana

identificación y tratamiento antes de derivar en problemas más serios para la salud.

Los micronutrientes abarcan un total de 17 minerales, 14 vitaminas, 2 ácidos grasos,

17 aminoácidos, hierro, yodo y calcio [7] y aunque es claro que la deficiencia de

cualquiera de éstos componentes es diagnosticado como el desarrollo de un

proceso de desnutrición por deficiencia de micronutrientes o hambre oculta son

particularmente las vitaminas A, B, y D, y los minerales Hierro, Yodo y Zinc aquellos

que han sido catalogadas como las más relevantes para la salud pública y

relacionados directamente con diversidad de patologías entre las que se destacan

la emaciación, retraso del crecimiento, sobrepeso u obesidad, y otras enfermedades

no transmisibles relacionadas con la alimentación.

A pesar de que las vitaminas y minerales estén presentes en verduras, legumbres,

carnes y derivados lácteos, una gran cantidad de personas en todo el mundo

presenta un consumo por debajo de lo recomendado. Por lo tanto, se estima que

más de 2 mil millones de personas en todo el mundo pueden presentar hambre

oculta [2]. En ese mismo sentido, el hambre oculta no hace distinción entre los

países en vía de desarrollo y aquellos considerados como el primer mundo puesto

que impacta a todos en mayor o menor proporción debido a diversos factores

económicos y sociales afectando, de acuerdo con la Organización Mundial de la

Salud, a casi una de cada tres personas en el mundo [8].

Para el año 2016 se estimó que 1900 millones de adultos tenían sobrepeso o eran

obesos, mientras que 462 millones de personas tenían insuficiencia ponderal. 52

millones de niños menores de 5 años presentaban emaciación, 17 millones

padecían emaciación grave, y 155 millones sufrían de retraso del crecimiento,

mientras que 41 millones tenían sobrepeso o eran obesos. Alrededor del 45% de

las muertes de menores de 5 años tenían que ver con la desnutrición. En su mayoría

se registraron en los países de ingresos bajos y medianos. Al mismo tiempo, en

esos países están aumentando las tasas de sobrepeso y obesidad en la niñez [9].

En Colombia la situación, aunque ha presentado alguna mejoría, no es

particularmente alentadora. De acuerdo con la Encuesta Nacional de la Situación

Nutricional en Colombia (ENSIN) adelantado por el Instituto Nacional de Salud, solo

en menores de 5 años, 25 de cada 100 niños presenta anemia, en tanto que se

estima que aproximadamente la mitad de estos casos de anemia están relacionados

Page 11: TESIS DE GRADO Sistema Analítico para la Identificación y

11

con la deficiencia de Hierro [10]; El país también redujo una de las manifestaciones

del hambre oculta como lo es la anemia en mujeres en edad reproductiva, al pasar

del 22,1% en el año 2012, al 21,1% en el año 2016 [11].

2.3 Diagnóstico del hambre oculta

El hambre oculta puede catalogarse en tres fases de acuerdo con su estado de

evolución:

a) Primera fase: Esta es la fase más compleja y menos diagnosticada. En tanto

que otros indicadores de salud relacionados con la alimentación pueden

estar correctos, como el peso y la talla, se caracteriza por falta de hierro que

puede derivar en algunos problemas que podrían pasar desapercibidos:

Dificultad para aprender, dificultad para recordar o solucionar problemas.

Sin embargo, la falta de hierro es especialmente crítico en el periodo de la

gestación y en la primera infancia (De cero a cinco años de edad) puesto que

en estas etapas es cuando más conexiones de carácter neurológico se

desarrollan en el cerebro humano. Es por esto, que la deficiencia de hierro

podría afectar gravemente y de por vida las capacidades cognitivas del

paciente afectado.

b) Segunda fase: Esta etapa de la enfermedad es frecuentemente

diagnosticada. Es caracterizada por la prevalencia de anemia que a menudo

conlleva a consultas médicas producto de mareos, debilidad y dolor de

cabeza. Si bien la anemia puede diagnosticarse por varias causas, puede

asociarse rápidamente al hambre oculta por la deficiencia de hierro o

ferropenia [12].

Sin embargo, es importante anotar que si bien, la deficiencia de hierro es el

indicador más veraz y efectivo para el diagnóstico clínico puede no ser el

único mineral o vitamina en carencia.

c) Tercera fase: Diagnóstico exacto por prevalencia de otras patologías. En

esta etapa, el hambre oculta se hace manifiesta en el paciente producto de

enfermedades causadas por la ausencia de micronutrientes específicos. Por

ejemplo, se requerirán exámenes más detallados para evaluar patologías

como la ceguera nocturna asociada a deficiencia de vitamina A; la

enfermedad de Beriberi asociada a la deficiencia de vitamina B1; escorbuto

relacionado con la deficiencia de vitamina C.

Page 12: TESIS DE GRADO Sistema Analítico para la Identificación y

12

En estos casos, también se debe analizar cuidadosamente que estas

patologías estén efectivamente relacionadas con la deficiencia en el

consumo de determinados vitaminas y minerales.

Page 13: TESIS DE GRADO Sistema Analítico para la Identificación y

13

3 ESTADO DEL ARTE DE LA DESNUTRICIÓN POR MICRONUTRIENTES

Para el desarrollo de esta investigación, se realizó una indagación sobre cómo se ha abordado la problemática de la desnutrición en el mundo a partir de herramientas de ciencia de datos y tecnologías de información y pos supuesto sobre la desnutrición del hambre oculta. Si bien la desnutrición por deficiencia de micronutrientes no es una enfermedad relativamente nueva, no se hallaron muchos estudios que articulen su prevalencia desde el punto de vista del análisis de los factores que inciden en el mismo. En la otra orilla, si existe una gran cantidad de contenido valioso de carácter más bien médico y/o clínico acerca de la desnutrición entendida como las deficiencias de peso y talla y su relación con la anemia, así como la prevalencia de anemia respecto a otras patologías, como por ejemplo, la parasitosis. A continuación, se muestran los estudios hallados más relevantes desde el punto de vista de ciencia de datos. Para cada uno de los estudios descritos se analiza detenidamente los siguientes aspectos: segmentación o clasificación de la población, fuentes de datos, metodología y resultados.

India: En India, se realizó un estudio [13] para investigar la asociación de la desnutrición con la anemia mediante la realización de análisis separados de niños menores de cinco años y mujeres en edad reproductiva utilizando datos los datos representativos de la encuesta nacional demográfica y de salud de Bangladesh de 2011. Los autores partieron de un análisis descriptivo de la información y estimaron la asociación entre la exposición al fenómeno y el resultado utilizando la prueba de Cochran-Mantel-Haenszel. Finalmente, estimaron por separado (Para los niños menores de cinco años y mujeres en edad reproductiva) modelos de regresión multivariables que se ajustaron simultáneamente para varias variables confusoras. Como resultado concluyeron una asociación entre la anemia, la desnutrición y particularmente las condiciones económicas y educativas de la madre, por lo que sugieren políticas basadas en la evidencia para combatir la anemia y las deficiencias nutricionales simultáneamente bajo un mismo programa. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción

Objetivo del estudio Investigar la asociación de la desnutrición con la anemia mediante la realización de análisis separados de niños menores de cinco años y mujeres en edad reproductiva utilizando los datos representativos de la encuesta nacional demográfica y de salud de Bangladesh de 2011.

Población objetivo Niños de edad entre 6 y 59 meses.

Mujeres en edad reproductiva

Datos Encuesta nacional demográfica y de salud de Bangladesh de 2011. Cuenta con datos de toda la

Page 14: TESIS DE GRADO Sistema Analítico para la Identificación y

14

población clasificada en 14 estratos basados en 7 divisiones administrativas y áreas urbano-rurales. La encuesta recopila información sobre salud, nutrición e historia demográfica para hombres, mujeres y niños. En particular, se recopilaron datos sobre anemia de mujeres en edad reproductiva y niños en el grupo de edad de 6 a 59 meses a partir de un subconjunto cada tercer hogar visitado, obteniendo a partir de muestras de sangre los niveles de hemoglobina (Hb) (g / dl).

También se tomaron estudios previos socioeconómicos para examinar si los factores sociodemográficos están asociados con anemia. Estos estudios identificaron el estado socioeconómico del hogar, la inseguridad alimentaria, y ubicación geográfica como factores de riesgo.

Metodología Análisis descriptivo de la información.

Estimación de la asociación entre la exposición y el resultado mientras se controla por un único factor de confusión mediante el cálculo de las razones de probabilidades ajustadas utilizando la prueba de Cochran-Mantel-Haenszel en el análisis estratificado.

Se estiman las asociaciones entre las exposiciones y los resultados se estiman por separado para niños menores de cinco años y mujeres en edad reproductiva ajustando modelos de regresión multivariables que se ajustan simultáneamente para varias variables confusoras.

Resultados En general, la prevalencia de anemia fue notablemente alta tanto entre los niños con retraso en el crecimiento como entre las mujeres con un IMC bajo en comparación con sus contrapartes normales. Se requieren políticas basadas en la evidencia dirigidas a los grupos vulnerables para combatir la anemia y las deficiencias nutricionales simultáneamente bajo el mismo programa tales como:

Mejorar el empoderamiento y educación de la mujer.

Campañas de concientización y prevención social para reconocer tempranamente la enfermedad.

Suiza: En la Clínica de la Universidad Geriátrica de Basilea se realizó un estudio [14] para analizar la prevalencia de anemia y su asociación con el estado nutricional en población geriátrica hospitalizada utilizando datos de las historias clínicas de los pacientes. Los autores realizaron un análisis estadístico a través del método de Pearson Chi cuadrado para hallar las relaciones entre variables categóricas y a través del método Prueba U de Mann-Whitney para hallar las relaciones entre las variables continuas. Finalmente se realizó un modelo basado en regresión logística

Page 15: TESIS DE GRADO Sistema Analítico para la Identificación y

15

multivariada para determinar qué factores se asociaron significativamente con la anemia. Como resultado, concluyeron una asociación de la anemia con marcadores de desnutrición muy significativa a pesar del tamaño de reducido de la muestra. En este caso, no se tenían marcadores de ferritina en todos los pacientes, por lo que se cree que el impacto de esta variable está subvalorado. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción

Objetivo del estudio Analizar la prevalencia de anemia y su asociación con el estado nutricional en población geriátrica hospitalizada.

Población objetivo Personas de la tercera edad hospitalizadas en el Basel Geriatric University Clinic desde 65 años. La edad media de la población objetivo es de 85 años.

Datos Historias clínicas: Se consideraron los pacientes hospitalizados por las siguientes sintomatologías: Desmayos, confusión, enfermedades graves y pérdida de independencia en las actividades diarias.

Muestras de sangre de todos los pacientes internados.

Metodología Estadístico: Los resultados de los datos obtenidos se presentaron como la mediana y rangos de valores. A través del método de chi-cuadrado de Pearson se hallaron las relaciones entre variables categóricas y a través del método Prueba U de Mann-Whitney se comprobaron las relaciones entre las variables continuas.

Se construyó un modelo basado en regresión logística multivariada con entrada variable paso a paso utilizó para determinar qué factores se asociaron significativamente con la anemia.

Resultados El principal hallazgo es una asociación de la anemia con marcadores de desnutrición muy significativa a pesar del tamaño de reducido de la muestra. Los datos obtenidos de anemia, desnutrición, la deficiencia de hierro y la inflamación crónica fueron utilizados según la disponibilidad de acuerdo con el protocolo de ingreso a hospitalización y ciertamente pueden ser criticados. Los niveles de ferritina no se determinaron en la mitad de los pacientes y, por lo tanto, la definición de deficiencia de hierro es incierto. Con base en estas premisas probablemente el estudio está subestimando en lugar de sobreestimar el impacto de deficiencia de hierro.

China: En el noroeste de China se realizó un estudio [15] para proporcionar datos para desarrollar un enfoque basado en políticas que permita controlar la anemia y la

Page 16: TESIS DE GRADO Sistema Analítico para la Identificación y

16

desnutrición infantil en las zonas rurales de Shaanxi provincia en el noroeste de China. El estudio se centró en la población de niños de 0 a 18 meses y a partir de un cuestionario elaborado específicamente para el estudio se recopiló información sociodemográfica así como prácticas de alimentación infantil. Los autores utilizaron técnicas estadísticas como el método de Wilcoxon para probar las diferencias de la ingesta dietética y las concentraciones séricas de hierro, zinc y vitamina A entre lactantes anémicos y lactantes no anémicos. Posteriormente realizaron la prueba de Pearson Chi Cuadrado para examinar las relaciones entre desnutrición, características sociodemográficas, patrones de alimentación y anemia. Finalmente construyeron un modelo de regresión logística utilizando el grupo de infantes no anémicos como referencia. Como resultado, la prevalencia de anemia en lactantes rurales se asoció con el peso al nacer, el número de hermanos, la educación de la madre, los ingresos familiares, el número de personas por habitación y los hábitos alimenticios. Estos hallazgos sugieren la necesidad urgente de una política nutricional infantil más efectiva y un programa integral que incluya el cuidado materno, la salud infantil y la educación nutricional. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción

Objetivo del estudio Proporcionar datos para desarrollar un enfoque basado en políticas que permita controlar la anemia y la desnutrición infantil en las zonas rurales de Shaanxi provincia en el noroeste de China.

Población objetivo Niños de 0 a 18 meses en 28 aldeas rurales de 2 condados de Shaanxi.

Datos Cuestionario estructurado para recopilar información sociodemográfica sobre el hogar, así como entrevistas acerca de las prácticas de alimentación infantil.

Tres días consecutivos de registro de la alimentación de los niños para medir los hábitos alimenticios calculando los nutrientes ingeridos totales.

Se recolectaron muestras de sangre de 2 ml entre 55 lactantes como sub muestra.

Metodología Estadístico: Todas las variables fueron categorizadas antes del análisis. Se utilizó la prueba de los rangos con signo de Wilcoxon para probar las diferencias de la ingesta dietética y las concentraciones séricas de hierro, zinc y vitamina A entre anémicos y lactantes no anémicos.

A través del método de chi-cuadrado de Pearson se examinaron las relaciones entre desnutrición, características sociodemográficas, patrones de alimentación y anemia.

Se construyó un modelo de regresión logística utilizando el grupo de infantes no anémicos como referencia.

Resultados La prevalencia de anemia en lactantes rurales se asoció con el peso al nacer, el número de hermanos, la educación de la madre, los ingresos familiares, el número de personas por

Page 17: TESIS DE GRADO Sistema Analítico para la Identificación y

17

habitación y los hábitos alimenticios. Programas de educación sanitaria centrados en la lactancia materna y las prácticas de alimentación complementaria podrían ser estrategias críticas y prácticas para prevenir la anemia y desnutrición en niños pequeños. Estos hallazgos sugieren la necesidad urgente de una política nutricional infantil más efectiva y un programa integral que incluya el cuidado materno, la salud infantil y la educación nutricional.

Ghana: En Ghana, se realizó un estudio [16] para examinar la prevalencia y los determinantes de desnutrición en niños menores de 5 años en la población ghanesa. Para ello, se utilizaron los datos demográficos recopilados en la encuesta de salud (GDHS) de Ghana 2008 y los datos de niños obtenidos del archivo del Servicio de Estadística de Ghana (GSS). Por medio de técnicas estadísticas, como por ejemplo, Pearson Chi Cuadrado, los autores estimaron y compararon entre los subgrupos la prevalencia general de desnutrición así como de retraso en el crecimiento, emaciación y bajo peso. También construyeron modelos de regresión logística univariada utilizados para investigar la asociación entre cada uno de los factores de riesgo individualmente con las tres formas principales de desnutrición. Se realizó también modelos de regresión logística multivariable para identificar determinantes independientes de la desnutrición infantil en la población ghanesa. Como resultado, este estudio subrayó el efecto de la educación de la madre, la pobreza y la edad del niño sobre el estado nutricional de los niños ghaneses menores de 5 años. También mostró la asociación de la desnutrición infantil con cuidados infantiles inadecuados y prácticas de alimentación en general insalubres. La siguiente tabla condensa los aspectos más relevantes del estudio: Característica Descripción

Objetivo del estudio Examinar la prevalencia y los determinantes de desnutrición en niños menores de 5 años en la población ghanesa.

Población objetivo Niños de 0 a 5 años en Ghana en 5 subgrupos (0 a 11 meses, 12 a 23 meses, 24 a 35 meses, 36 a 47 meses y 48 a 59 meses)

Datos Datos demográficos y encuesta de salud (GDHS) de Ghana 2008.

Recodificación de datos de niños obtenido del archivo del Servicio de Estadística de Ghana (GSS).

Metodología Estadístico: A través del método de chi-cuadrado de Pearson se estimó y comparó entre los subgrupos la prevalencia general de desnutrición, así como de retraso en el crecimiento, emaciación y bajo peso.

La regresión logística univariada se utilizó para investigar la asociación entre cada uno de los factores de riesgo individualmente con las tres formas principales de desnutrición.

Page 18: TESIS DE GRADO Sistema Analítico para la Identificación y

18

La regresión logística multivariable también se utilizó para identificar determinantes independientes de la desnutrición infantil en la población ghanesa. Las estimaciones se presentaron como probabilidades de relaciones (OR) con los correspondientes intervalos de confianza.

Resultados Este estudio subrayó el efecto de la educación de la madre, la pobreza y la edad del niño sobre el estado nutricional de los niños ghaneses menores de 5 años. También mostró la asociación de la desnutrición infantil con cuidados infantiles inadecuados y prácticas de alimentación en general insalubres. Los grupos particulares que requieren mayor atención son niños que acababan de ser introducidos a una alimentación complementaria y aquellos que acababan de finalizar la etapa de la lactancia. La identificación de los factores de riesgo asociados con la desnutrición infantil en Ghana también ayuda a la asignación de los recursos pertinentes de acuerdo con las necesidades específicas de los subgrupos, áreas y características sociodemográficas analizadas.

3.1 Observaciones sobre los estudios analizados y diferencias sobre el enfoque de

esta investigación

Los estudios recopilados tienen en común que, para lograr su objetivo, estudian y analizan las relaciones entre el fenómeno de la desnutrición y/o la prevalencia de anemia y otras variables del entorno estudiado. Igualmente utilizan estadística descriptiva, regresión lineal o algunas técnicas de comprobación de hipótesis para corroborar las fortalezas de dichas relaciones identificadas. Por sus características, el primer estudio es el más similar a la presente investigación en cuanto a la envergadura, población objetivo y métodos utilizados salvo por las siguientes distinciones:

a) Esta investigación se centra en la desnutrición por deficiencia de hierro (Hambre oculta), por lo tanto:

i. A diferencia de los estudios presentados que abordan características ampliamente aceptadas como relacionadas a la desnutrición aguda o crónica como, por ejemplo, los niveles de índice masa muscular (IMC por sus siglas en inglés) y los niveles de hemoglobina, esta investigación excluye las variables relacionadas con el peso y la talla e incluye los niveles de hierro como indicadores de deficiencia de micronutrientes.

ii. Se incluyen variables relacionadas con el estado actual del individuo, de tal manera que pueda analizarse si las condiciones de anemia por deficiencia de hierro pueden deberse a la manifestación clínica de otras enfermedades presentes y/o otros problemas de salud preexistentes.

Page 19: TESIS DE GRADO Sistema Analítico para la Identificación y

19

iii. No se incluyen los patrones o hábitos de consumo de alimentos debido a que restringiría la información disponible.

b) Esta investigación no busca solamente entender la fortaleza de la relación entre las diferentes variables sino explicar de manera concreta cómo se da la relación. Por esta razón, se utilizan otras técnicas de ciencia de datos para explicar la incidencia de las variables tales como la construcción de modelos basados en árboles de decisión.

c) Esta investigación utiliza variables establecidas del acuerdo al contexto social de Colombia, como por ejemplo, la medida de riqueza de los hogares estudiados que es obtenido a través de un indicador basado en cuartiles de riqueza.

Page 20: TESIS DE GRADO Sistema Analítico para la Identificación y

20

4 ESTUDIO DEL HAMBRE OCULTA EN COLOMBIA En esta sección se detallará el estudio realizado sobre el fenómeno del hambre

oculta en Colombia describiendo cuáles son los datos utilizados, la población

objetivo seleccionada, las variables propuestas para el desarrollo de la

investigación, la definición del fenómeno del hambre oculta a partir de los datos

seleccionados y por último las técnicas aplicadas para el procesamiento de

información.

Para comprender el paso a paso de la investigación, los pasos pueden ilustrarse en

el siguiente diagrama basado en la metodología ASUM-DM propuesta por IBM [17]:

Ilustración 1 - Metodología ASUM-DM

4.1 Escenario Analítico

A continuación se muestra el escenario analítico, sobre el cual, se plantea la

investigación:

Page 21: TESIS DE GRADO Sistema Analítico para la Identificación y

21

Ilustración 2 - Escenario Analítico

Por tanto, la presente investigación se constituye como una herramienta adicional

para el Ministerio de Salud con el fin que pueda implementar acciones que generen

impacto sobre la sociedad colombiana.

4.2 Fuentes de datos

Etapa del proceso de acuerdo con la metodología: Analizar.

Para la realización del estudio se utilizó como fuente de datos la Encuesta Nacional

de Situación Nutricional para el año 2015. Es una encuesta nacional realizada por

muestreo que permite la recolección de datos de forma organizada y metódica de

hogares y sus integrantes, utilizando procedimientos definidos para la compilación

de la información recolectada, tomando medidas corporales y muestras biológicas.

Su desarrollo está a cargo del Instituto Colombiano de Bienestar Familiar - ICBF, el

Ministerio de Salud y Protección Social, el Departamento Administrativo para la

Prosperidad Social - PS, el Instituto Nacional de Salud – INS - y la Organización

Panamericana de la Salud-OPS/OMS [18].

Es importante anotar que a la fecha de esta investigación no se cuenta con la

información de la ENSIN para el año 2020 toda vez que:

Si bien se han publicado resultados relevantes de la encuesta, no se ha

finalizado la exploración detallada de los datos obtenidos a partir del año

Page 22: TESIS DE GRADO Sistema Analítico para la Identificación y

22

2015.

En línea con el punto anterior, el gobierno nacional no ha tomado acciones

que permitan suponer que en una encuesta ENSIN 2020 se obtengan

resultados significativamente diferentes, por lo que de momento no ha

tomado la determinación de realizar nuevamente dicho estudio.

En relación a la pandemia declarada por la OMS por la enfermedad COVID-

19, el gobierno nacional ha declarado la emergencia sanitaria. En este

sentido, es razonable que los recursos económicos se asignen a la

preparación y atención de la pandemia en lugar de destinarse al

levantamiento de nueva información proveniente de la ENSIN.

4.3 Segmentación de la población

Etapa del proceso de acuerdo con la metodología: Analizar.

ENSIN recoge información de distintas poblaciones a lo largo y ancho del territorio

colombiano. Sin embargo, entendiendo que la complejidad del fenómeno de la

desnutrición y del hambre oculta es alta y caracterizar sus causas puede variar

significativamente de un grupo poblacional a otro se optó, con el apoyo de los

expertos en segmentar la población en dos grupos de interés:

Madres gestantes: El periodo de gestación es particularmente importante en

el análisis de fenómeno del hambre oculta puesto que es una condición

particular que predispone a la madre a la anemia por deficiencia de hierro.

Por supuesto, que una condición de esta naturaleza que no se maneje

adecuadamente durante este periodo puede tener consecuencias en el

desarrollo del bebé en el vientre materno y para la madre misma, siendo muy

relevante para la salud pública focalizar y tratar médicamente a aquellas

mamás en riesgo.

Primera infancia: El periodo comprendido entre los 0 y 5 años de edad es el

más importante en la formación y desarrollo físico de cualquier niño. Cuadros

crónicos de desnutrición y hambre oculta en este periodo de tiempo pueden

tener graves consecuencias de salud a corto y largo plazo, siendo

fundamental identificar y tratar adecuadamente a los niños en riesgo.

4.4 Selección de variables de interés

Etapa del proceso de acuerdo con la metodología: Diseñar.

La encuesta ENSIN trae una gran cantidad de información relevante para el estudio de los

hábitos de nutrición en el país. Por tanto, es necesario filtrar aquellas variables que se

consideren más relevantes para el fenómeno en estudio con base en (a) el conocimiento

Page 23: TESIS DE GRADO Sistema Analítico para la Identificación y

23

experto, en este caso por parte del Ministerio de Salud y (b) en estudios similares realizados

en otros países. Producto de dicha selección se obtuvo:

Variable Descripción

Dimensión: Caracterización del Individuo

PERSONA Identificador del individuo en los datos. Esta variable

se elimina para su ingreso en los modelos.

HEMOGLOBINA Nivel de hemoglobina (g/dL) ajustada por altura

sobre el nivel del mar.

FERRITINA Nivel de ferritina (μg/L)

EDAD Edad del sujeto de estudio.

Dimensión: Estado de salud del individuo

EMBARAZADA Si la persona sujeto de estudio se encuentra en

gestación o no.

PROBLEMAS_SALUD Indica si la persona tuvo síntomas de problemas de

salud en los últimos 15 días.

PROBLEMAS_SALUD_DIARREA Indica si la persona tuvo diarrea en los últimos 15

días.

DIAGNOSTICADO Indica si la persona ha sido diagnosticado(a) de

alguna enfermedad en el último año.

HOSPITALIZADO Indica si la persona tuvo algún problema de salud

que haya implicado hospitalización en el último año.

Dimensión: Condiciones del hogar

TAMANO_HOGAR Indica el tamaño del hogar por categorías.

1. Unipersonal

2. 2 a 4 personas

3. 5 a 6 personas

4. 7 personas o mas

NO_COCINA Indica si el hogar en el que vive cuenta con

infraestructura para cocinar alimentos.

NO_ACUEDUCTO Indica si el hogar en el que vive cuenta con

infraestructura y servicio de acueducto.

NO_ALCANTARILLADO Indica si el hogar en el que vive cuenta con

infraestructura y servicio de alcantarillado.

AGUA_PREPARAR Indica la fuente primaria del agua del hogar que se

utiliza para lavar y/o preparar los alimentos.

-1. Otro

1. Acueducto público

2. Acueducto comunal o veredal

3. Pozo con bomba

4. Pozo sin bomba, jagüey

5. Aguas lluvias

6. Manantial, nacimiento

7. Río, quebrada

Page 24: TESIS DE GRADO Sistema Analítico para la Identificación y

24

8. Pila pública

9. Carro tanque

10. Aguatero

11. Agua embotellada o en bolsa

12. Donación

NO_ENERGIA Indica si el hogar en el que vive cuenta con

infraestructura y servicio de energía eléctrica.

NO_RECOLECCION Indica si el hogar en el que vive cuenta con servicio

de recolección de basuras.

PAREDES Indica el tipo de material con el cual están

construidas las paredes del hogar en el que habita:

-1. Otro

1. Bahareque revocado

2. Bahareque sin revocar

3. Madera burda, tabla, tablón

4. Guadua, caña, esterilla, otro vegetal

5. Bloque, ladrillo, piedra, madera pulida

6. Material prefabricado

7. Tierra pisada, adobe

8. Zinc, tela, cartón, latas, desechos, plásticos.

9. Sin paredes

PISOS Indica el tipo de material con el cual están

construidos los pisos del hogar en el que habita:

-1. Otro

1. Madera pulida y lacada, parqué

2. Mármol

3. Alfombra o tapete de pared a pared

4. Baldosas, vinilo, tableta o ladrillo, caucho, otros

materiales sintéticos

5. Madera burda, madera en mal estado, tabla o

tablón

6. Cemento o gravilla

7. Tierra o arena

Dimensión: Ubicación Geográfica

COD_DEPTO Código de departamento en el que habita la

persona.

AREA Indica el tipo de área en el cual habita la persona:

1. Cabecera municipal

2. Resto (Centro poblado )

3. Resto (Rural disperso)

Dimensión: Condiciones Socioeconómicas

ACTIVIDAD_MES_PASADO Indica la actividad en que ocupó la mayor parte del

tiempo del mes pasado.

-1. Otra actividad

Page 25: TESIS DE GRADO Sistema Analítico para la Identificación y

25

1. Trabajando

2. Buscando trabajo

3. Estudiando

4. Oficios del hogar

5. Incapacitado permanente para trabajar

6. Sin actividad

7. Rentista

8. Jubilado/ pensionado

NIVEL_TRABAJO Indica el rol que la persona tiene en su trabajo.

-1. Otro

1. Obrero o empleado de empresa particular

2. Obrero o empleado del gobierno

3. Empleado doméstico

4. Jornalero o peón

5. Trabajador por cuenta propia

6. Patrón o empleador

7. Trabajador de su propia finca en arriendo o

aparcería

8. Trabajador familiar sin remuneración

9. Trabajador sin remuneración en empresa o

negocios de otros hogares.

CON_QUIEN_PERMANECE Indica dónde o con quién permanece durante la

mayor parte del tiempo entre semana.

-1. Otro

1. Asiste a un hogar comunitario, guardería, jardín

o centro de desarrollo infantil

2. Con su padre o madre en la casa

3. Con su padre o madre en el trabajo

4. Con empleada o niñera en la casa

5. Al cuidado de un pariente de 18 años o más

diferente a los abuelos en la casa

6. Al cuidado de un pariente de 18 años o más

diferente a los abuelos en OTRA casa

7. Al cuidado de un pariente menor de 18 años en

la casa

8. Al cuidado de un pariente menor de 18 años en

OTRA casa

9. Al cuidado de los abuelos en la casa

10. Al cuidado de los abuelos en OTRA casa

11. En un sitio para el cuidado de menores (jornada

adicional o alterna, talleres, etc)

12. En casa solo

TIPO_HOGAR_ASISTE Indica a qué tipo de establecimiento (hogar

Page 26: TESIS DE GRADO Sistema Analítico para la Identificación y

26

comunitario, guardería, jardín o centro de desarrollo

infantil) asiste el individuo.

1. Hogar comunitario de ICBF

2. Hogar infantil o jardín de ICBF

3. Centro de Desarrollo Infantil de ICBF

4. Guardería, salacuna, preescolar o jardín oficial

5. Guardería, salacuna, preescolar o jardín privado

AFILIADO Indica si la persona está afiliado(a) a alguna entidad

de seguridad social en salud. (EPS-Contributiva,

EPS-Subsidiada, régimen de excepción).

-3. Ns/Nr

1. Si

2. No

REGIMEN Indica a cuál de los siguientes regímenes en salud

está afiliado la persona.

-3. Ns/Nr

1. EPS contributiva

2. EPS subsidiada

3. Regímenes especiales (Fuerzas, Armadas,

Ecopetrol, universidades, públicas, magisterio)

CUARTIL_RIQUEZA Indica el cuartil de riqueza armonizado calculado

solo para la base 2015.

1. primer cuartil

2. segundo cuartil

3. tercero cuartil

4. cuarto cuartil

SEXO_JEFE_HOGAR Indica el sexo de quien fue identificado como jefe del

hogar.

EDUCACION_JEFE_HOGAR Indica el nivel de escolaridad del jefe del hogar.

1. Menos de primaria completa (0-4 años)

2. Entre primaria completa y secundaria incompleta

(5-10 años)

3. Entre secundaria completa y superior incompleta

(11-15 años)

4. Superior completa y más (16-24 años)

En total se seleccionaron 30 variables que serán discriminadas en función de la

población objetivo seleccionado (Gestantes o primera infancia) que involucran

distintos componentes socioeconómicos de la persona.

4.5 Definición de desnutrición por deficiencia de hierro en la población objetivo

Etapa del proceso de acuerdo con la metodología: Diseñar.

Page 27: TESIS DE GRADO Sistema Analítico para la Identificación y

27

Para cada grupo de interés, se definieron los siguientes umbrales de hemoglobina

[6] y ferritina [19] para diferenciar las personas que padecen deficiencia de

micronutrientes por deficiencia de hierro, que es una de las manifestaciones más

frecuentes de hambre oculta, de las que no padecen dicha enfermedad:

Población Nivel de Hemoglobina

(g/dL) ajustada por altura

sobre el nivel del mar.

Nivel de Ferritina (μg/L)

Mujeres Gestantes 11 20

Primera infancia 11 12

4.6 Metodología de estudio

Etapa del proceso de acuerdo con la metodología: Configurar y Construir.

Para el análisis de las variables seleccionadas se estableció el siguiente esquema:

Para cada grupo de interés seleccionado (Gestantes y primera infancia) se estudia:

Análisis descriptivo: El análisis descriptivo incluye un estudio cuantitativo de

los patrones que rodean cada variable seleccionada respecto a la

hemoglobina (de manera independiente), la ferritina (de manera

independiente) y la combinación de las dos, hemoglobina y ferritina teniendo

en cuenta su definición de nivel bajo (Anemia por deficiencia de hierro).

Análisis de correlaciones: El análisis de correlaciones incluye un estudio de

la fortaleza de la relación de cada variable según sus características respecto

a la hemoglobina (de manera independiente), la ferritina (de manera

Page 28: TESIS DE GRADO Sistema Analítico para la Identificación y

28

independiente) y la combinación de las dos, hemoglobina y ferritina teniendo

en cuenta su definición de nivel bajo (Anemia por deficiencia de hierro). Para

las correlaciones se utiliza:

Variables Métodos

Numérica con Numérica Spearman [20]

Categórica con Categórica Chi Cuadrado / V Crammer [21]

Categórica (2 niveles) con Numérica

Se utiliza la correlación punto-biserial (0 – 1) (Equivalente a la correlación de Pearson).

Categórica (>2 niveles) con Numérica*

Se debe usar la correlación ETA (raíz cuadrada del R2 de la regresión multifactorial)

Modelo de regresión lineal: Modelo matemático que permite aproximar la

relación entre una variable dependiente Y respecto a un conjunto de variables

determinadas X. En el contexto del estudio se utiliza para determinar las

variables que más incidencia tienen sobre el fenómeno de desnutrición por

hambre oculta.

Modelo de Clasificación Basado en Árboles de Decisión (Predictivo): De

acuerdo con la naturaleza de las variables (En su mayoría categóricas), se

propuso utilizar como modelo predictivo la clasificación basada en árboles de

decisión. Este modelo, cuenta con la ventaja de permitir una interpretación

de la importancia de las variables que se están teniendo en cuenta para

tomar las decisiones.

4.7 Discusión e interpretación de los resultados de los modelos

Etapa del proceso de acuerdo con la metodología: Operar y optimizar.

Finalmente, el último paso está dado por el análisis de los resultados de los modelos

construidos intentando describir adecuadamente la interacción entre las variables.

Si bien, por la complejidad del fenómeno estudiado no se esperan reglas de negocio

infalibles que permitan identificar con certeza a las poblaciones en riesgo, es

fundamental el apoyo de los expertos en la problemática quienes orientarán

adecuadamente los resultados de la investigación.

Page 29: TESIS DE GRADO Sistema Analítico para la Identificación y

29

5 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE

MUJERES GESTANTES. Para abordar el estudio, es necesario identificar y segmentar la población de

mujeres gestantes entre mujeres con desnutrición por deficiencia de hierro y

aquellas que no padecen desnutrición por deficiencia de micronutrientes. A

continuación, se detalla cómo se realiza esta clasificación y los criterios establecidos

para tal efecto.

5.1 Caracterización de la población

A partir de los datos recopilados el estudio busca identificar las características

generales de la población de mujeres gestantes con el fin de establecer la variable

objetivo que permitirá elaborar el modelo, por tal razón es importante analizar las

siguientes preguntas:

¿Cuántas mujeres gestantes padecen anemia?

¿Cuántas mujeres gestantes padecen deficiencia de hierro?

¿Cuántas mujeres gestantes padecen anemia y deficiencia de hierro?

Por medio de un análisis descriptivo, en la encuesta ENSIN se cuenta con un total

de 1234 registros correspondientes a mujeres gestantes que se pueden clasificar

de la siguiente manera:

Si Si (%) No No (%) Total

Mujeres Gestantes con Anemia 337 27% 897 73% 1234

Mujeres Gestantes con Deficiencia de Hierro 744 60% 490 40% 1234

Mujeres Gestantes con Anemia y Deficiencia

de Hierro

249 20% 985 80% 1234

Para identificar las proporciones en la población, se muestran los siguientes

gráficos:

Page 30: TESIS DE GRADO Sistema Analítico para la Identificación y

30

Ilustración 3 - Distribución de Mujeres Gestantes con Anemia

Ilustración 4 - Distribución de mujeres gestantes con deficiencia de hierro

337; 27%

897; 73%

Mujeres Gestantes con Anemia

Si No

744; 60%

490; 40%

Mujeres Gestantes con Deficiencia de Hierro

Si No

Page 31: TESIS DE GRADO Sistema Analítico para la Identificación y

31

Ilustración 5 - Distribución de mujeres gestantes con anemia y deficiencia de hierro

Es importante anotar que el 60% de las mujeres en estado de gestación se

encuentra con deficiencia de hierro. Esta condición es propia del embarazo y por lo

general se presenta antes que se manifiesten valores bajo de hemoglobina

(anemia).

Es por esta razón que las mujeres en estado de gestación son consideradas una

población en riesgo. El grupo de interés seleccionado se centra en las mujeres

gestantes con anemia y deficiencia de hierro, esto significa que la desnutrición por

hambre oculta se encuentra en un estado más avanzado, que de acuerdo con los

datos disponibles representan el 20% (249 mujeres) de la población disponible.

5.2 Análisis descriptivo

El análisis descriptivo se realizó por cada variable usando como variable objetivo la

hemoglobina y ferritina de manera independiente. En las variables en las que el

promedio más bajo de hemoglobina coincidieron en una o más categorías de

respuesta con el promedio más bajo de ferritina se constituyó como un hallazgo.

En este sentido las variables más relevantes son:

Variable Tamaño del hogar:

Respecto a la Hemoglobina Respecto a la Ferritina

249; 20%

985; 80%

Mujeres Gestantes con Anemia y Deficiencia de Hierro

Si No

Page 32: TESIS DE GRADO Sistema Analítico para la Identificación y

32

Los hogares unipersonales son aquellos

que tienen niveles de hemoglobina

significativamente por encima de la media.

Los hogares más grandes, tienen

promedios semejantes. Sin embargo, en la

medida en que los hogares crecen el

percentil del 25% es más bajo.

Se observa que los hogares unipersonales

son aquellos que tienen niveles de ferritina

significativamente por encima de la media.

Los hogares más grandes, tienen

promedios semejantes.

Variable Problemas de Salud:

Respecto a la Hemoglobina Respecto a la Ferritina

Resulta contradictorio que la categoría (2.

No) resulta ligeramente más baja en su

media que quienes han tenido problemas

de saludo en los últimos 15 días.

Resulta contradictorio que la categoría (2.

No) resulta ligeramente más baja en su

media que quienes han tenido problemas

de saludo en los últimos 15 días.

Aunque se podría considerar contradictoria, es una variable indicativa de la

ocurrencia del fenómeno.

Variable Problemas de Salud Diarrea:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 33: TESIS DE GRADO Sistema Analítico para la Identificación y

33

Resulta contradictorio que la categoría (2.

No) resulta ligeramente más baja en su

media que quienes han tenido problemas

de saludo en los últimos 15 días.

Resulta contradictorio que la categoría (2.

No) resulta ligeramente más baja en su

media que quienes han tenido problemas

de saludo en los últimos 15 días.

Aunque se podría considerar contradictoria, es una variable indicativa de la

ocurrencia del fenómeno.

Variable Hospitalizado

Respecto a la Hemoglobina Respecto a la Ferritina

Se observa una diferencia en la media

entre quienes han sido hospitalizados en

el último año respecto a los que no.

Se observa una diferencia en la media

entre quienes han sido hospitalizados en

el último año respecto a los que no.

Variable Régimen

Respecto a la Hemoglobina Respecto a la Ferritina

Page 34: TESIS DE GRADO Sistema Analítico para la Identificación y

34

Se observa una pequeña tendencia en la

media a disminuir según el régimen,

siendo la categoría (3. Regímenes

especiales) tiene la media más baja.

Se observa una pequeña tendencia en la

media a disminuir según el régimen,

siendo la categoría (3. Regímenes

especiales) tiene la media más baja.

Variable Departamento

Respecto a la Hemoglobina Respecto a la Ferritina

Departamentos con media más baja:

47 Magdalena

27 Chocó

44 La Guajira

99 Vichada

52 Nariño

Departamentos con media más baja:

47 Magdalena

88 San Andrés

23 Córdoba

18 Caquetá

70 Sucre

Coincide en primer lugar el departamento del Magdalena.

Variable Cuartil Riqueza

Respecto a la Hemoglobina Respecto a la Ferritina

Se observa una tendencia que a menor El cuartil 2 cuenta con la media más baja.

Page 35: TESIS DE GRADO Sistema Analítico para la Identificación y

35

cuartil de riqueza, más baja es la media de

los niveles de hemoglobina.

Particularmente en los cuartiles 1 y 2.

Por otra parte, el cuartil 3 y el 4 son los

más altos.

Aunque en la ferritina no sigue exactamente el mismo patrón de tendencia en los

cuartiles, si se destaca la coincidencia en el cuartil 2 como uno de los más bajos en

ambas perspectivas.

Variable Educación Jefe del Hogar

Respecto a la Hemoglobina Respecto a la Ferritina

Llama la atención que las categorías (1.

Menos de primaria completa (0-4 años)) y

(3. Entre secundaria completa y superior

incompleta (11-15 años)) tienen la media

más baja de hemoglobina.

Llama la atención que las categorías (3.

Entre secundaria completa y superior

incompleta (11-15 años)) y (4. Superior

completa y más (16-24 años)) tienen la

media más baja de ferritina.

Aunque en la ferritina no sigue exactamente el mismo patrón de tendencia de la

educación de jefe del hogar respecto a la ferritina, si se destaca la coincidencia en

la categoría (3. Entre secundaria completa y superior incompleta (11-15 años))

como uno de los más bajos en ambas perspectivas.

En síntesis, el análisis descriptivo muestra una influencia de variables de diferentes

dimensiones, siendo particularmente relevantes las condiciones propias del estado

de salud de la mujer tales como si ha tenido problemas de salud en el último año y

si ha tenido problemas de diarrea, pero también una incidencia importante de otras

dimensiones con las condiciones económicas proyectadas en las condiciones del

hogar y el cuartil de riqueza.

5.3 Análisis de correlaciones

El análisis de correlaciones se realizó:

Page 36: TESIS DE GRADO Sistema Analítico para la Identificación y

36

Por cada variable respecto a la hemoglobina y ferritina de manera

independiente. En las variables en las que el coeficiente de Pearson y ETA

es superior al 10% se constituye como una correlación en el estudio.

Por cada variable respecto a la variable “anemia hierro” que se construye a

partir de la caracterización de la población de acuerdo con los umbrales

descritos en la sección 5.4. En las variables en las que el coeficiente de

Pearson y ETA es superior al 10% se constituye como una correlación en el

estudio. En el caso de las variables analizadas con el método de Chi2, se

constituyen como correlación aquellas que tenga una significancia mayor al

95%. (p < 0.05).

Cuando una variable, se constituyó como “correlacionada” en dos o más variables

(Respecto a la hemoglobina, o la ferritina o la variable combinada anemia hierro) se

constituye como un hallazgo en el estudio. A continuación se muestran los

hallazgos:

(*) Destaca las variables que se seleccionan como relevantes para el estudio.

Cifras truncadas a cinco (5) decimales.

Variable Objetivo Hemoglobina

Objetivo Ferritina Objetivo Anemia Hierro

HEMOGLOBINA* No aplica Pearson: 0.15917 Pearson: -0.59325

FERRITINA* Pearson: 0.15917 No aplica Pearson: -0.27087

TAMANO_HOGAR Pearson: -0.02179 Pearson: 0.00963 Pearson: 0.04841

EDAD Pearson: 0.0387094 Pearson: 0.0559021 Pearson: -0.03184

ACTIVIDAD_MES_PASADO

eta: 0.10537 eta: 0.09030 Chi: 8.88253 p: 0.26120

NIVEL_TRABAJO eta: 0.06809 eta: 0.03617 Chi: 1.88181 p: 0.93024

PROBLEMAS_SALUD Biserial (Pearson): 0.05698

Biserial (Pearson): 0.06866

Chi: 1.32406 p: 0.24986

PROBLEMAS_SALUD_DIARREA

Biserial (Pearson): 0.01536

Biserial (Pearson): 0.05915

Chi: 0.00707 p: 0.93297

DIAGNOSTICADO Biserial (Pearson): -0.00908

Biserial (Pearson): -0.02698

Chi: 1.08308 p: 0.29800

HOSPITALIZADO Biserial (Pearson): -0.05232

Biserial (Pearson): -0.01462

Chi: 3.87418 p: 0.04903

AFILIADO eta: 0.00902 eta: 0.02297 Chi: 1.82863 p: 0.40078

REGIMEN eta: 0.06423 eta: 0.02991 Chi: 2.61906 p: 0.45415

Page 37: TESIS DE GRADO Sistema Analítico para la Identificación y

37

COD_DEPTO* eta: 0.33464 eta: 0.13216 Chi: 69.73705 p: 0.00012

AREA eta: 0.01094 eta: 0.02155 Chi: 1.63645 p: 0.20081

CUARTIL_RIQUEZA Pearson: 0.11213 Pearson: 0.01065 Pearson: -0.08914

NO_COCINA Biserial (Pearson): -0.01708

Biserial (Pearson): -0.00503

Chi: 0.59988 p: 0.43862

NO_ACUEDUCTO Biserial (Pearson): -0.06304

Biserial (Pearson): 0.01124

Chi: 1.91274 p: 0.16665

NO_ALCANTARILLADO* Biserial (Pearson): -0.14165

Biserial (Pearson): -0.01107

Chi: 20.84162 p: 4.98868e-06

NO_ENERGIA Biserial (Pearson): -0.05941

Biserial (Pearson): -0.04776

Chi: 7.80790 p: 0.00520

NO_RECOLECCION Biserial (Pearson): -0.05292

Biserial (Pearson): -0.03617

Chi: 1.71766 p: 0.18999

PAREDES eta: 0.12177 eta: 0.04775 Chi: 11.07422 p: 0.19752

PISOS* eta: 0.10937 eta: 0.04459 Chi: 15.28483 p: 0.00921

AGUA_PREPARAR eta: 0.15096 eta: 0.08597 Chi: 19.05660 p: 0.08717

SEXO_JEFE_HOGAR Biserial (Pearson): -0.01123

Biserial (Pearson): 0.0219928

Chi: 0.06983 p: 0.79157

EDUCACION_JEFE_HOGAR

eta: 0.05326 eta: 0.06083 Chi: 3.50206 p: 0.32049

5.4 Regresión lineal

La regresión lineal se utilizó con dos objetivos:

Identificar las variables más relevantes en la tarea de clasificación.

Construir un primer modelo de clasificación.

En este caso, la regresión se hizo directamente contra la variable “anemia hierro”

que se construye a partir de la caracterización de la población de acuerdo con los

umbrales descritos en la sección 5.4. Se utilizaron los siguientes mejores

parámetros hallados:

Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de

Page 38: TESIS DE GRADO Sistema Analítico para la Identificación y

38

entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba

o control del modelo (30%).

C: 0.4181.

Peso de las clases (class_weight): balanced.

Iteraciones máximas (max_iter): 10.

Estrategia de penalización (penalti): L1

Kernel (solver): Liblinear

Métrica para encontrar la mejor calificación: Exhaustividad (Recall).

A continuación, se muestra la importancia relativa de las variables identificadas en

la regresión:

Ilustración 6 - Importancia relativa de las variables en el modelo de regresión lineal de mujeres gestantes

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Page 39: TESIS DE GRADO Sistema Analítico para la Identificación y

39

Mujeres en etapa de

gestación que SI

presentan desnutrición

por ausencia de

micronutrientes (hierro).

24% 55% 73

Mujeres en etapa de

gestación que NO

presentan desnutrición

por ausencia de

micronutrientes (hierro).

84% 57% 298

Promedio Balanceado

del Modelo (Weighted

AVG)

72% 56% 371

De acuerdo con los resultados la regresión lineal para la población de mujeres

gestantes nos da como resultados:

Del total de los registros que el modelo clasifica como “SI presenta

desnutrición por ausencia de micronutrientes (hierro)”, el 24% en la realidad

sí corresponde a esta condición.

Del total de los registros disponibles para el modelo que en realidad “SI

presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de

regresión clasificó correctamente el 55%.

Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la

métrica de exactitud para evaluar el desempeño del modelo. Esto debido a que el

algoritmo se inclinará preferentemente por la clase mayoritaria (Quienes nos

padecen la enfermedad) y por ende tendrá un porcentaje de éxito mayor que no

corresponde al objeto del estudio (Identificar a quienes sí padecen la enfermedad).

En la regresión lineal, el algoritmo muestra una fuerte relación con la variable “Nivel

de trabajo” en sus distintas categorías que muestran una asociación entre la

ocupación y la jerarquía del cargo que desempeña la persona respecto a la

prevalencia del hambre oculta. Desde la dimensión de las características de

infraestructura del hogar, toma relevancia la presencia o no de cocina y desde la

dimensión de las condiciones individuales la prevalencia de problemas de salud y

la edad. En ese sentido, respecto al análisis descriptivo, la regresión también resalta

la importancia de ciertas condiciones de infraestructura del hogar pero deja

manifiesto algunos aspectos novedosos como precisamente, el tamaño del hogar.

Page 40: TESIS DE GRADO Sistema Analítico para la Identificación y

40

5.5 Árbol de decisión

El árbol de decisión se utilizó con tres objetivos:

Identificar las variables más relevantes en la tarea de clasificación.

Construir un segundo modelo de clasificación.

Utilizar un algoritmo más adecuado para las características de los datos

(Ampliamente categóricos).

En este caso, el modelo del árbol de decisión se construyó utilizando como variable

objetivo “anemia hierro” que se construye a partir de la caracterización de la

población de acuerdo con los umbrales descritos en la sección 5.4. Se utilizaron los

siguientes mejores parámetros hallados:

Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de

entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba

o control del modelo (30%).

Índice de medida de impureza: Gini

Profundidad: 5

Peso de las clases (class_weight): balanced.

Métrica para encontrar la mejor calificación: Exhaustividad (Recall).

Se construyeron modelos alternos utilizando técnicas de preparación de los

datos para mejorar el desempeño del algoritmo en cuanto al balance de las

clases:

o Submuestreo (Undersampling): Técnica en la cual se reduce la

cantidad de registros de la clase mayoritaria, seleccionando de forma

aleatoria registros de tal manera que no sobrepasen en número a la

cantidad de registros de la clase minoritaria [22].

o Sobremuestreo (Oversampling): Técnica en la cual se aumenta la

cantidad de registros de la clase minoritaria, generando copias

sintéticas de los registros de tal manera que sea igual a la cantidad de

registros de la clase mayoritaria [22].

A continuación, se muestra la importancia relativa de las variables identificadas en

el árbol de decisión:

Datos originales:

Variable Importancia Relativa

NO_ALCANTARILLADO 0.238

AFILIADO_1.0 0.152

Page 41: TESIS DE GRADO Sistema Analítico para la Identificación y

41

EDAD 0.109

COD_DEPTO_25.0 0.079

COD_DEPTO_63.0 0.071

COD_DEPTO_8.0 0.071

COD_DEPTO_50.0 0.069

COD_DEPTO_18.0 0.064

NO_RECOLECCION_nan 0.050

PAREDES_8.0 0.041

PISOS_7.0 0.034

COD_DEPTO_54.0 0.021

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Mujeres en etapa de

gestación que SI

presentan desnutrición

por ausencia de

micronutrientes (hierro).

28% 38% 73

Mujeres en etapa de

gestación que NO

presentan desnutrición

por ausencia de

micronutrientes (hierro).

83% 76% 298

Promedio Balanceado

del Modelo (Weighted

AVG)

72% 68% 371

Submuestreo:

Variable Importancia Relativa

PISOS_7.0 0.174

EDAD 0.164

COD_DEPTO_63.0 0.123

COD_DEPTO_15.0 0.122

COD_DEPTO_25.0 0.091

COD_DEPTO_97.0 0.087

PISOS_5.0 0.055

AGUA_PREPARAR_1.0 0.053

COD_DEPTO_81.0 0.049

Page 42: TESIS DE GRADO Sistema Analítico para la Identificación y

42

COD_DEPTO_52.0 0.047

EDUCACION_JEFE_HOGAR_2.0 0.020

CUARTIL_RIQUEZA 0.014

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Mujeres en etapa de

gestación que SI

presentan desnutrición

por ausencia de

micronutrientes (hierro).

20% 88% 73

Mujeres en etapa de

gestación que NO

presentan desnutrición

por ausencia de

micronutrientes (hierro).

80% 12% 298

Promedio Balanceado

del Modelo (Weighted

AVG)

68% 27% 371

Sobremuestreo:

Variable Importancia Relativa

NO_ALCANTARILLADO 0.312

AFILIADO_1.0 0.103

EDAD 0.102

COD_DEPTO_8.0 0.102

COD_DEPTO_25.0 0.085

COD_DEPTO_18.0 0.069

CUARTIL_RIQUEZA 0.058

PAREDES_2.0 0.055

PAREDES_8.0 0.049

COD_DEPTO_50.0 0.044

PISOS_4.0 0.022

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Page 43: TESIS DE GRADO Sistema Analítico para la Identificación y

43

Población Precisión Exhaustividad Soporte

Mujeres en etapa de

gestación que SI

presentan desnutrición

por ausencia de

micronutrientes (hierro).

30% 42% 73

Mujeres en etapa de

gestación que NO

presentan desnutrición

por ausencia de

micronutrientes (hierro).

84% 76% 298

Promedio Balanceado

del Modelo (Weighted

AVG)

74% 69% 371

El modelo que mostró mejor resultados es el realizado con la técnica de

sobremuestreo. De acuerdo con estos resultados se tiene:

Del total de los registros que el modelo clasifica como “SI presenta

desnutrición por ausencia de micronutrientes (hierro)”, el 30% en la realidad

sí corresponde a esta condición.

Del total de los registros disponibles para el modelo que en realidad son “SI

presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de

clasificación basado en árboles con sobremuestreo clasificó correctamente

el 42%.

Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la

métrica de exactitud para evaluar el desempeño del modelo incluyo aplicando las

técnicas de sobremuestreo o submuestreo.

5.6 Consolidación de las variables identificadas en los modelos

Dado que el propósito del estudio es identificar las variables que inciden sobre el

fenómeno del hambre oculta en la población de las mujeres gestantes, a

continuación se resume por cada modelo las variables más relevantes en la

caracterización del fenómeno:

En el resultado analítico se calificó el número de ocurrencias por variable entre el

análisis descriptivo y las correlaciones con el fin de resumir la información. A

continuación se muestra en orden de relevancia las variables que más inciden de

acuerdo con el análisis efectuado:

Page 44: TESIS DE GRADO Sistema Analítico para la Identificación y

44

Top Características -

Analítico

Top Características – Regresión Top Características -

Árbol

COD_DEPTO

HOSPITALIZADO

CUARTIL_RIQUE

ZA

PISOS

AGUA_PREPARA

R

NIVEL_TRABAJO

ACTIVIDAD_MES_PASADO

PROBLEMAS_SALUD

NO_COCINA

HOSPITALIZADO

TAMANO_HOGAR

EDAD

DIAGNOSTICADO

PROBLEMAS_SALUD_DIARR

EA

AFILIADO

CUARTIL_RIQUEZA

NO_ALCANTARILLADO

NO_ENERGIA

NO_ACUEDUCTO

NO_ALCANTARILLA

DO

AFILIADO_1.0

EDAD

COD_DEPTO_8.0

COD_DEPTO_25.0

COD_DEPTO_18.0

CUARTIL_RIQUEZA

PAREDES_2.0

PAREDES_8.0

COD_DEPTO_50.0

PISOS_4.0

A continuación se relacionan las variables que inciden en el fenómeno de acuerdo

con su coincidencia en los modelos realizados:

Variable Desc. Reg. Árb. Desc. y

Reg.

Desc. y

Árb.

Reg. y

Árb.

Desc.,

Reg.

y Árb.

COD_DEPTO X

HOSPITALIZADO X

CUARTIL_RIQUEZA X

PISOS X

AGUA_PREPARAR X

NIVEL_TRABAJO X

ACTIVIDAD_MES_PASADO X

PROBLEMAS_SALUD X

NO_COCINA X

TAMANO_HOGAR X

EDAD X

DIAGNOSTICADO X

PROBLEMAS_SALUD_DIARREA X

AFILIADO X

NO_ALCANTARILLADO X

NO_ENERGIA X

NO_ACUEDUCTO X

PAREDES X

Page 45: TESIS DE GRADO Sistema Analítico para la Identificación y

45

PISOS X

Convenciones:

Desc. = Presente solo en el análisis descriptivo.

Reg. = Presente solo en la regresión lineal.

Arb. = Presente solo en el modelo de árbol de decisión.

Desc. y Reg. = Presente en el modelo descriptivo y en la regresión.

Desc. y Arb = Presente en el modelo descriptivo y en el árbol de decisión.

Desc, Reg. Y Arb = Presente en el modelo descriptivo, regresión y en el árbol

de decisión.

En términos generales se observa que las variables recopiladas por el modelo

basado en árboles de decisión absorbe de una manera u otra las variables

identificadas en los análisis descriptivo. No obstante la regresión sí toma en cuenta

nueve (9) variables como importantes que no se reflejan en los demás análisis. En

ese sentido, solo hay una variable que prevalece en los tres modelos denominada

CUARTIL_RIQUEZA.

Por tal motivo, se analizarán las variables a continuación a partir del árbol de

decisión.

5.7 Incidencia de las variables identificadas en el árbol de decisión

En las secciones anteriores, por medio de las técnicas de estadística descriptiva,

regresión y un modelo basado en árboles de decisión se determinaron las variables

que pueden estar incidiendo o no en el desarrollo del fenómeno. En esta sección se

estudiará a partir de los árboles de decisión cómo es la incidencia de estas variables

en el fenómeno.

A continuación se muestra el árbol de decisión de las madres gestantes:

Page 46: TESIS DE GRADO Sistema Analítico para la Identificación y

46

Ilustración 7 - Árbol de decisión para el modelo de las mujeres gestantes

Para el análisis se tienen en cuentan los nodos finales donde la clase positiva (Con

desnutrición para ausencia de micronutrientes) es mayor que la clase minoritaria

(Sin desnutrición por ausencia de micronutrientes) con una impureza GINI igual a 0.

Si bien el algoritmo permite establecer reglas de negocio para explicar el fenómeno,

debe tenerse en cuenta que la aplicación de manera individual de una determinada

regla no describe fulminantemente el fenómeno sino que debe considerarse como

las piezas clave que en conjunto permiten describir el fenómeno.

En este caso se tienen las siguientes reglas:

a) SI (AFILIADO_1.0 es 0) Y (COD_DEPTO_8.0 es 0) Y

(NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a sufrir de

hambre oculta.

La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no

tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de

Atlántico y no son afiliadas al sistema general de salud tienen mayor susceptibilidad

a la desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 2 mujeres gestantes que sí tienen desnutrición por deficiencia de hierro

y 26 que no.

b) SI (COD_DEPTO_25 es 1) Y (AFILIADO es 1) Y (COD_DEPTO_8.0 es 0) Y

(NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a sufrir de

hambre oculta.

Page 47: TESIS DE GRADO Sistema Analítico para la Identificación y

47

La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no

tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de

Atlántico y se encuentran afiliadas al sistema general de salud y viven en el

departamento de Cundinamarca tienen mayor susceptibilidad a la desnutrición por

deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 1 mujer gestante que sí tiene desnutrición por deficiencia de hierro y 26

que no.

c) SI (PISOS_4.0 es 0) Y (COD_DEPTO_8.0 es 0) Y (NO_ALCANTARILLADO

es 0) ENTONCES tiene mayor riesgo a sufrir de hambre oculta.

Desde el punto de vista de negocio, la regla se puede interpretar de la siguiente

manera: Las mujeres gestantes que no tienen déficit de servicio de alcantarillado y

no se encuentran en el departamento de Atlántico y los pisos de su vivienda no son

de baldosas, vinilo, tableta o ladrillo, caucho, otros materiales sintéticos tienen

mayor susceptibilidad a la desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 75 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro

y 342 que no.

d) SI (CUARTIL_RIQUEZA es 3 o 4) Y (PISOS_4.0 es 1) Y (COD_DEPTO_8.0

es 0) Y (NO_ALCANTARILLADO es 0) ENTONCES tiene mayor riesgo a

sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que no

tienen déficit de servicio de alcantarillado y no se encuentran en el departamento de

Atlántico y los pisos de su vivienda son de baldosas, vinilo, tableta o ladrillo, caucho,

otros materiales sintéticos y se encuentran en el cuartil de riqueza superior (Tercero

o cuarto) tienen mayor susceptibilidad a la desnutrición por deficiencia de

micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 34 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro

y 186 que no.

e) SI (COD_DEPTO_18 es 1) Y (EDAD es menor que 34.5) Y

(NO_ALCANTARILLADO es 1) ENTONCES tiene mayor riesgo a sufrir de

Page 48: TESIS DE GRADO Sistema Analítico para la Identificación y

48

hambre oculta.

La regla se puede interpretar de la siguiente manera: Las mujeres gestantes que

tienen déficit de servicio de alcantarillado y son menores de 34.5 años de edad y

se encuentran en el departamento de Caquetá tienen mayor susceptibilidad a la

desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 0 mujeres gestantes que sí tiene desnutrición por deficiencia de hierro

y 8 que no.

La siguiente tabla muestra la importancia relativa de cada variable y su tendencia

en el análisis:

Variable Importancia Interpretación

NO_ALCANTARILLADO 0.312 El modelo está caracterizando como

mayoritariamente susceptibles a las

mujeres que no tienen déficit de

alcantarillado.

Sin déficit de alcantarillado

889 Mujeres Gestantes

o 739 Sin deficiencia

o 150 Con deficiencia

Con déficit de alcantarillado

345 Mujeres gestantes

o 246 Sin deficiencia

o 99 Con deficiencia

AFILIADO_1.0 0.103 El modelo está caracterizando como

susceptibles a las mujeres que no están

afiliadas al sistema general de salud.

Afiliados al sistema

1190 Mujeres Gestantes

o 952 Sin deficiencia

o 238 Con deficiencia

No afiliadas al sistema

44 Mujeres gestantes

o 33 Sin deficiencia

o 11 Con deficiencia

Page 49: TESIS DE GRADO Sistema Analítico para la Identificación y

49

EDAD 0.102 El modelo está caracterizando como

susceptibles a las mujeres menores de

34.5 años. En el modelo que tiene

mayor especificidad, caracteriza a las

mujeres menores de 16.5 años como

mayor riesgo.

COD_DEPTO_8.0 0.102 El modelo está caracterizando en

términos generales que quienes no

viven en el departamento del Atlántico

tienen mayor riesgo.

COD_DEPTO_25.0 0.085 El modelo está caracterizando en

términos generales que quienes viven

en el departamento de Cundinamarca

tienen mayor riesgo. Esto puede

deberse al balance de las muestras.

COD_DEPTO_18.0 0.069 El modelo está caracterizando en

términos generales a quienes viven en

el departamento del Caquetá como más

susceptible al fenómeno.

CUARTIL_RIQUEZA 0.058 Es llamativo encontrar que el modelo

está caracterizando como población en

riesgo quienes están en los cuartiles 3

y 4 (que son los más altos)

precisamente como mayor riesgo de

padecer desnutrición por deficiencia de

hierro.

PAREDES_2.0 0.055 El modelo tiende a caracterizar como

mujeres con mayor riesgo a quienes

habitan en viviendas cuyas paredes no

son de bahareque sin revocar.

PAREDES_8.0 0.049 El modelo tiende a caracterizar como

mujeres con mayor riesgo a quienes

habitan en viviendas cuyas paredes no

son de zinc, tela, cartón, latas,

desechos, plásticos.

COD_DEPTO_50.0 0.044 El modelo está caracterizando en

términos generales que quienes no

viven en el departamento del Meta

tienen mayor riesgo.

PISOS_4.0 0.022 El modelo está caracterizando las

Page 50: TESIS DE GRADO Sistema Analítico para la Identificación y

50

viviendas cuyos pisos no son de

Baldosas, vinilo, tableta o ladrillo,

caucho, otros materiales sintéticos

como los que más presentan riesgo.

Page 51: TESIS DE GRADO Sistema Analítico para la Identificación y

51

6 CARACTERIZACIÓN DEL HAMBRE OCULTA EN LA POBLACIÓN DE

PRIMERA INFANCIA. Para abordar la segunda parte del estudio, es necesario identificar y segmentar la

población de primera infancia entre niños con desnutrición por deficiencia de por

deficiencia de hierro y aquellos que no padecen desnutrición por deficiencia de

micronutrientes. A continuación, se detalla cómo se realiza esta clasificación y los

criterios establecidos para tal efecto.

6.1 Caracterización de la población

A partir de los datos recopilados, el estudio busca identificar las características

generales de la población de mujeres gestantes con el fin de establecer la variable

objetivo que permitirá elaborar el modelo, por tal razón es importante analizar las

siguientes preguntas:

¿Cuántos niños padecen anemia?

¿Cuántos niños padecen deficiencia de hierro?

¿Cuántos niños padecen anemia y deficiencia de hierro?

Por medio de un análisis descriptivo, en la encuesta ENSIN se cuenta con un total

de 9425 registros correspondientes a niños que se pueden clasificar de la siguiente

manera:

Si Si (%) No No (%) Total

Niños con Anemia 1506 15.98% 7919 84.02% 9425

Niños con Deficiencia de Hierro 1304 13.84% 8121 86.16% 9425

Niños con Anemia y Deficiencia de Hierro 381 4.04% 9044 95.96% 9425

Para identificar las proporciones en la población, se muestran los siguientes

gráficos:

Page 52: TESIS DE GRADO Sistema Analítico para la Identificación y

52

Ilustración 8 - Distribución de Primera Infancia con Anemia

Ilustración 9 - Distribución de Primera Infancia con Deficiencia de Hierro

Ilustración 10 - Distribución de Primera Infancia con Anemia y Deficiencia de Hierro

1506; 16%

7919; 84%

Primera Infancia con Anemia

Si No

1304; 14%

8121; 86%

Primera infancia con deficiencia de hierro

Si No

381; 4%

9044; 96%

Primera Infancia con anemia y deficiencia de hierro

Si No

Page 53: TESIS DE GRADO Sistema Analítico para la Identificación y

53

Es importante anotar que para efectos del estudio, el 4% de niños con anemia por

deficiencia de hierro se ha seleccionado como variable objetivo del estudio. Lo

anterior por considerarlo una fase más avanzada de la enfermedad que resulta

fácilmente diagnosticable en esta etapa. No obstante, dentro de la definición de

hambre oculta puede tratarse la primera infancia con deficiencia de hierro (14% de

la población) como población que padece la enfermedad.

6.2 Análisis descriptivo

El análisis descriptivo se realizó por cada variable utilizando como variable objetivo

la hemoglobina y ferritina de manera independiente. En las variables en las que el

promedio más bajo de hemoglobina coincidieron en una o más categorías de

respuesta con el promedio más bajo de ferritina se constituyó como un hallazgo.

En este sentido las variables más relevantes son:

Variable Edad

Respecto a la Hemoglobina Respecto a la Ferritina

Hay una tendencia muy clara en los niños.

A menor edad, la media de hemoglobina es

más baja, por lo que a menor edad son más

vulnerables.

Hay una tendencia muy clara en los niños.

A menor edad, la media de ferritina es más

baja, por lo que a menor edad son más

vulnerables.

Variable Sexo:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 54: TESIS DE GRADO Sistema Analítico para la Identificación y

54

Se observa que la media de hemoglobina

es ligeramente inferior en los niños

respecto a las niñas.

Se observa que la media de ferritina es

significativamente más baja en los niños

respecto a las niñas.

Variable Con Quien Permanece:

Respecto a la Hemoglobina Respecto a la Ferritina

Se observa que las actividades (6. Al

cuidado de un pariente de 18 años o más

diferente a los abuelos en OTRA casa) y (7.

Al cuidado de un pariente menor de 18

años en la casa) son aquellos que tienen

una media de niveles de hemoglobina más

bajo que el resto de las categorías.

Se observa que las actividades (7. Al

cuidado de un pariente menor de 18 años

en la casa) y (4. Con empleada o niñera)

son aquellos que tienen una media de

niveles de ferritina más bajo que el resto de

las categorías.

Esta variable se consideró relevante por la coincidencia en la actividad (7. Al

cuidado de un pariente menor de 18 años en la casa).

Variable Tipo Hogar Asiste:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 55: TESIS DE GRADO Sistema Analítico para la Identificación y

55

Se observa que la actividad (3. Centro de

Desarrollo Infantil de ICBF) es aquel que

tiene una media de niveles de

hemoglobina más bajo que el resto de las

categorías en tanto que la categoría (5.

Guardería, sala cuna, preescolar o jardín

privado) es la que tiene una media más

baja.

Se observa que las actividades (1. Hogar

comunitario de ICBF) y (3. Centro de

Desarrollo Infantil de ICBF) son aquellos

que tienen una media de niveles de ferritina

más bajo que el resto de las categorías.

Esta variable se consideró relevante por la coincidencia en la actividad (3. Centro

de Desarrollo Infantil de ICBF).

Variable Problemas de Salud Diarrea:

Respecto a la Hemoglobina Respecto a la Ferritina

La categoría (1. Sí) resulta ligeramente

más baja en su media que quienes no han

tenido problemas de saludo en los últimos

15 días.

La categoría (1. Sí) resulta ligeramente

más baja en su media que quienes no han

tenido problemas de salud diarrea en los

últimos 15 días.

Variable Afiliado:

Page 56: TESIS DE GRADO Sistema Analítico para la Identificación y

56

Respecto a la Hemoglobina Respecto a la Ferritina

Se observa una diferencia notable entre

quienes no están afiliados al sistema de

salud (2) en su media respecto a los que sí

(1).

Se observa una diferencia notable entre

quienes no están afiliados al sistema de

salud (2) en su media respecto a los que sí

(1).

Variable Régimen:

Respecto a la Hemoglobina Respecto a la Ferritina

Se observa una pequeña tendencia en la

media a disminuir según el régimen, siendo

la categoría (2. EPS subsidiada) y (3.

Regímenes especiales) tiene la media más

baja.

Se observa una pequeña tendencia en la

media a disminuir según el régimen, siendo

la categoría (2. EPS subsidiada) y (1. EPS

contributiva) tiene la media más baja

Esta variable se consideró relevante por la coincidencia en la categoría (2. EPS

subsidiada).

Variable Departamento

Respecto a la Hemoglobina Respecto a la Ferritina

Departamentos con media más baja: Departamentos con media más baja:

Page 57: TESIS DE GRADO Sistema Analítico para la Identificación y

57

27 Chocó

97 Vaupés

44 La Guajira

91 Amazonas

52 Nariño

88 San Andrés

44 La Guajira

47 Magdalena

23 Córdoba

70 Sucre

Coincide en el top 5 el departamento de la Guajira.

Variable Área:

Respecto a la Hemoglobina Respecto a la Ferritina

Hay una ligera diferencia entre la media de

la cabecera municipal (Más alta) respecto al

centro poblado.

Hay una ligera diferencia entre la media de

la cabecera municipal (Más alta) respecto

al centro poblado.

Variable Cuartil Riqueza:

Respecto a la Hemoglobina Respecto a la Ferritina

Hay una tendencia muy marcada en la

media de los niveles de hemoglobina a

medida que aumentan los cuartiles.

Hay una tendencia muy marcada en la

media de los niveles de ferritina a medida

que aumentan los cuartiles.

Page 58: TESIS DE GRADO Sistema Analítico para la Identificación y

58

Variable No Cocina:

Respecto a la Hemoglobina Respecto a la Ferritina

La media más baja está en los niños que

tienen déficit en la cocina.

La media más baja está en los niños que

tienen déficit en la cocina.

Variable No alcantarillado:

Respecto a la Hemoglobina Respecto a la Ferritina

La media más baja está en los niños cuyo

hogar tiene déficit de alcantarillado.

La media más baja está en los niños cuyo

hogar tiene déficit de alcantarillado.

Variable No energía:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 59: TESIS DE GRADO Sistema Analítico para la Identificación y

59

La media más baja está en los niños cuyo

hogar presenta déficit de energía.

La media más baja está en los niños cuyo

hogar presenta déficit de energía.

Variable No recolección:

Respecto a la Hemoglobina Respecto a la Ferritina

La media más baja está en los niños cuyo

hogar tiene déficit de recolección de

basuras.

La media más baja está en los niños cuyo

hogar tiene déficit de recolección de

basuras.

Variable Paredes:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 60: TESIS DE GRADO Sistema Analítico para la Identificación y

60

Las categorías (9. Sin paredes) y (3. Madera

burda, tabla, tablón) son las que cuentan con

los valores más bajos en las medias de

hemoglobina.

Las categorías (9. Sin paredes) y (2.

Bahareque sin revocar) son las que

cuentan con los valores más bajos en las

medias de hemoglobina

Esta variable se seleccionó por la coincidencia en la categoría (9. Sin paredes).

Variable Agua Preparar:

Respecto a la Hemoglobina Respecto a la Ferritina

Las categoría (5. Aguas lluvias), (4. Pozo

sin bomba, jagüey) y (7. Río, quebrada)

cuenta con los valores más bajos en las

medias de hemoglobina.

Las categorías (10. Aguatero), (9. Carro

tanque) y (4. Pozo sin bomba, jagüey)

cuenta con los valores más bajos en las

medias de hemoglobina

Esta variable se seleccionó por la coincidencia en la categoría (4. Pozo sin bomba,

jagüey).

Variable Educación Jefe Hogar:

Respecto a la Hemoglobina Respecto a la Ferritina

Page 61: TESIS DE GRADO Sistema Analítico para la Identificación y

61

Llama la atención que entre menor la

educación del jefe del hogar, menor es la

media de hemoglobina.

Aunque la diferencia es muy leve, llama la

atención que entre menor la educación del

jefe del hogar, menor es la media de

ferritina.

En síntesis, el análisis descriptivo muestra una influencia de variables de diferentes

dimensiones, siendo particularmente relevantes las condiciones propias del niño

como su edad y sexo, las condiciones de cuidado del niño como por ejemplo, con

quién pasa la mayoría del tiempo (Entre más lejano el parentesco, mayor riesgo) y

si cuenta o no con la posibilidad de asistir a algún tipo de hogar de asistencia

comunitaria. También, ocupa un lugar destacado algunas condiciones

socioeconómicas del hogar del niño, tales como su cuartil de riqueza, régimen de

afiliación al Sistema General de Salud, departamento y las condiciones de servicios

públicos domiciliarios.

6.3 Análisis de correlaciones

El análisis de correlaciones se realizó:

Por cada variable respecto a la hemoglobina y ferritina de manera

independiente. En las variables en las que el coeficiente de Pearson y ETA

es superior al 10% se constituye como una correlación en el estudio.

Por cada variable respecto a la variable “anemia hierro” que se construye a

partir de la caracterización de la población de acuerdo con los umbrales

descritos en la sección 5.4. En las variables en las que el coeficiente de

Pearson y ETA es superior al 10% se constituye como una correlación en el

estudio. En el caso de las variables analizadas con el método de Chi2, se

constituyen como correlación aquellas que tenga una significancia mayor al

95%. (p < 0.05).

Cuando una variable, se constituyó como “correlacionada” en dos o más variables

Page 62: TESIS DE GRADO Sistema Analítico para la Identificación y

62

(Respecto a la hemoglobina, o la ferritina o la variable combinada anemia hierro) se

constituye como un hallazgo en el estudio. A continuación se muestran los

hallazgos:

(*) Destaca las variables que se seleccionan como relevantes para el estudio.

Cifras truncadas a cinco (5) decimales.

Variable Objetivo Hemoglobina

Objetivo Ferritina Objetivo Anemia Hierro

HEMOGLOBINA No aplica Pearson: 0.06738 Pearson: -0.33610

FERRITINA Pearson: 0.06738 No aplica Pearson: -0.17978

TAMANO_HOGAR Pearson: -0.06964 Pearson: -0.00306 Pearson: 0.02717

EDAD* Pearson: 0.287966 Pearson: 0.140916 Pearson: -0.174998

SEXO Biserial (Pearson): -0.03329

Biserial (Pearson): -0.03368

Chi: 3.94221 p: 0.04708

CON_QUIEN_PERMANECE*

eta: 0.17327 eta: 0.08149 Chi: 68.62966 p: 5.77482e-10

TIPO_HOGAR_ASISTE*

eta: 0.11806 eta: 0.05966 Chi: 36.95650 p: 1.83884e-07

PROBLEMAS_SALUD Biserial (Pearson): -0.03239

Biserial (Pearson): 0.07301

Chi: 8.74918 p: 0.00309

PROBLEMAS_SALUD_DIARREA

Biserial (Pearson): -0.08703

Biserial (Pearson): -0.00470

Chi: 9.19221 p: 0.00243

DIAGNOSTICADO Biserial (Pearson): -0.01833

Biserial (Pearson): 0.01494

Chi: 1.98042 p: 0.15934

HOSPITALIZADO Biserial (Pearson): -0.03675

Biserial (Pearson): -0.00674

Chi: 22.17326 p: 2.491183e-06

AFILIADO eta: 0.05906 eta: 0.01842 Chi: 8.15340 p: 0.01696

REGIMEN* eta: 0.10273 eta: 0.02810 Chi: 24.53167 p: 1.93440e-05

COD_DEPTO* eta: 0.33147 eta: 0.11784 Chi: 130.27580 p: 8.188064e-14

AREA eta: 0.05213 eta: 0.02287 Chi: 13.55095 p: 0.00023

CUARTIL_RIQUEZA Pearson: 0.170461 Pearson: 0.0354878 Pearson: -0.0566158

NO_COCINA Biserial (Pearson): -0.04632

Biserial (Pearson): -0.01925

Chi: 4.97914 p: 0.02565

NO_ACUEDUCTO* Biserial (Pearson): -0.12536

Biserial (Pearson): 0.01622

Chi: 20.67324 p: 5.44719e-06

NO_ALCANTARILLADO*

Biserial (Pearson): -0.16112

Biserial (Pearson): -0.01383

Chi: 38.44994 p: 5.617606e-10

Page 63: TESIS DE GRADO Sistema Analítico para la Identificación y

63

NO_ENERGIA* Biserial (Pearson): -0.12294

Biserial (Pearson): -0.00710

Chi: 15.09360 p: 0.00010

NO_RECOLECCION* Biserial (Pearson): -0.12969

Biserial (Pearson): -0.02107

Chi: 4.31997 p: 0.03766

PAREDES* eta: 0.18675 eta: 0.04630 Chi: 38.67334 p: 1.31924e-05

PISOS* eta: 0.19095 eta: 0.05003 Chi: 41.85205 p: 1.96667e-07

AGUA_PREPARAR* eta: 0.22670 eta: 0.06509 Chi: 67.35087 p: 9.99284e-10

SEXO_JEFE_HOGAR Biserial (Pearson): 0.00090

Biserial (Pearson) 0.00119

Chi: 0.36896 p: 0.54356

EDUCACION_JEFE_HOGAR

eta: 0.06500 eta: 0.02577 Chi: 4.92939 p: 0.17704

6.4 Regresión lineal

La regresión lineal se utilizó con dos objetivos:

Identificar las variables más relevantes en la tarea de clasificación.

Construir un primer modelo de clasificación.

En este caso, la regresión se hizo directamente contra la variable “anemia hierro”

que se construye a partir de la caracterización de la población de acuerdo con los

umbrales descritos en la sección 5.4. Se utilizaron los siguientes mejores

parámetros hallados:

Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de

entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba

o control del modelo (30%).

C: 0.0171.

Peso de las clases (class_weight): balanced.

Iteraciones máximas (max_iter): 10.

Estrategia de penalización (penalti): L1

Kernel (solver): Liblinear

Métrica para encontrar la mejor calificación: Exhaustividad (Recall).

A continuación, se muestra la importancia relativa de las variables identificadas en

la regresión:

Page 64: TESIS DE GRADO Sistema Analítico para la Identificación y

64

Ilustración 11 - Importancia relativa de las variables en el modelo de regresión lineal de primera infancia

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Primera infancia que SI

presenta desnutrición

por ausencia de

micronutrientes (hierro).

10% 70% 137

Primera infancia que NO

presenta desnutrición

por ausencia de

micronutrientes (hierro).

98% 68% 2691

Promedio balanceado

del modelo (Weighted

AVG)

94% 68% 2828

De acuerdo con los resultados la regresión lineal para la población de primera

infancia nos da como resultados:

Del total de los registros que el modelo clasifica como “SI presenta

desnutrición por ausencia de micronutrientes (hierro)”, el 10% en la realidad

sí corresponde a esta condición.

Del total de los registros disponibles para el modelo que en realidad “SI

Page 65: TESIS DE GRADO Sistema Analítico para la Identificación y

65

presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de

regresión clasificó correctamente el 70%.

Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la

métrica de exactitud para evaluar el desempeño del modelo. Esto debido a que el

algoritmo se inclinará preferentemente por la clase mayoritaria (Quienes no

padecen la enfermedad) y por ende tendrá un porcentaje de éxito mayor que no

corresponde al objeto del estudio (Identificar a quienes sí padecen la enfermedad).

En la regresión lineal, es claro que el tamaño del hogar tiene la relevancia más alta

para determinar el riesgo de exposición al hambre oculta. En efecto, a mayor es el

tamaño del hogar, se muestra una asociación más alta a la prevalencia de la

enfermedad especialmente cuando se compone de 7 integrantes o más.

Igualmente, el cuartil de riqueza sigue siendo un determinante relevante siendo

particularmente destacados los cuartiles más bajos (1 y 2). Otra condición

particularmente de la regresión lineal y que es consecuente con el análisis

descriptivo es que existe cierto riesgo asociado a padecer al fenómeno de acuerdo

con quién está al frente del cuidado del niño.

6.5 Árbol de decisión

El árbol de decisión se utilizó con tres objetivos:

Identificar las variables más relevantes en la tarea de clasificación.

Construir un segundo modelo de clasificación.

Utilizar un algoritmo más adecuado para las características de los datos

(Ampliamente categóricos).

En este caso, el modelo del árbol de decisión se construyó utilizando como variable

objetivo “anemia hierro” que se construye a partir de la caracterización de la

población de acuerdo con los umbrales descritos en la sección 5.4. Se utilizaron los

siguientes mejores parámetros hallados:

Se dividió el conjunto de datos en dos: Un grupo para realizar la fase de

entrenamiento de los datos (70%) y otro grupo para realizar la fase de prueba

o control del modelo (30%).

Índice de medida de impureza: Gini

Profundidad: 5

Peso de las clases (class_weight): balanced.

Métrica para encontrar la mejor calificación: Exhaustividad (Recall).

Se construyeron modelos alternos utilizando técnicas de preparación de los

Page 66: TESIS DE GRADO Sistema Analítico para la Identificación y

66

datos para mejorar el desempeño del algoritmo en cuanto al balance de las

clases:

o Submuestreo (Undersampling): Técnica en la cual se reduce la

cantidad de registros de la clase mayoritaria, seleccionando de forma

aleatoria registros de tal manera que no sobrepasen en número a la

cantidad de registros de la clase minoritaria [22].

o Sobremuestreo (Oversampling): Técnica en la cual se aumenta la

cantidad de registros de la clase minoritaria, generando copias

sintéticas de los registros de tal manera que sea igual a la cantidad de

registros de la clase mayoritaria [22].

A continuación, se muestra la importancia relativa de las variables identificadas en

el árbol de decisión:

Datos originales:

Variable Importancia Relativa

EDAD 0.716

AGUA_PREPARAR_5.0 0.075

AGUA_PREPARAR_4.0 0.045

AREA_1.0 0.040

CUARTIL_RIQUEZA 0.028

AGUA_PREPARAR_2.0 0.025

HOSPITALIZADO_0.0 0.018

COD_DEPTO_54.0 0.016

PROBLEMAS_SALUD_DIARREA_0.0 0.016

EDUCACION_JEFE_HOGAR_1.0 0.013

REGIMEN_1.0 0.009

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Primera infancia que SI

presenta desnutrición

por ausencia de

micronutrientes (hierro).

11% 55% 137

Primera infancia que NO

presenta desnutrición

por ausencia de

97% 77% 2691

Page 67: TESIS DE GRADO Sistema Analítico para la Identificación y

67

micronutrientes (hierro).

Promedio balanceado

del modelo (Weighted

AVG)

93% 76% 2828

Submuestreo:

Variable Importancia Relativa

EDAD 0.583

AGUA_PREPARAR_5.0 0.100

NO_ALCANTARILLADO 0.057

AGUA_PREPARAR_4.0 0.044

CON_QUIEN_PERMANECE_2.0 0.041

PAREDES_5.0 0.038

COD_DEPTO_23.0 0.034

AGUA_PREPARAR_3.0 0.034

COD_DEPTO_52.0 0.026

CON_QUIEN_PERMANECE_7.0 0.022

TAMANO_HOGAR 0.021

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Primera infancia que SI

presenta desnutrición

por ausencia de

micronutrientes (hierro).

9% 64% 137

Primera infancia que NO

presenta desnutrición

por ausencia de

micronutrientes (hierro).

97% 68% 2691

Promedio balanceado

del modelo (Weighted

AVG)

93% 68% 2691

Sobremuestreo:

Variable Importancia Relativa

Page 68: TESIS DE GRADO Sistema Analítico para la Identificación y

68

EDAD 0.585

AGUA_PREPARAR_5.0 0.059

NO_RECOLECCION_nan 0.037

AGUA_PREPARAR_4.0 0.035

HOSPITALIZADO_1.0 0.025

CUARTIL_RIQUEZA 0.025

NO_ENERGIA 0.024

EDUCACION_JEFE_HOGAR_3.0 0.020

AGUA_PREPARAR_6.0 0.020

AGUA_PREPARAR_2.0 0.019

REGIMEN_2.0 0.017

SEXO_1.0 0.017

TIPO_HOGAR_ASISTE_1.0 0.017

HOSPITALIZADO_0.0 0.016

PROBLEMAS_SALUD_DIARREA_0.0 0.015

COD_DEPTO_11.0 0.015

COD_DEPTO_54.0 0.013

AREA_2.0 0.011

TAMANO_HOGAR 0.010

COD_DEPTO_18.0 0.009

EDUCACION_JEFE_HOGAR_2.0 0.007

SEXO_JEFE_HOGAR_1.0 0.005

Una vez ejecutado el modelo para evaluar la capacidad de clasificación de los datos

de prueba se obtuvieron los siguientes resultados:

Población Precisión Exhaustividad Soporte

Primera infancia que SI

presenta desnutrición

por ausencia de

micronutrientes (hierro).

12% 55% 137

Primera infancia que NO

presenta desnutrición

por ausencia de

micronutrientes (hierro).

97% 80% 2691

Promedio balanceado

del modelo (Weighted

AVG)

93% 79% 2828

El modelo que mostró mejor resultados es el realizado con la técnica de

Page 69: TESIS DE GRADO Sistema Analítico para la Identificación y

69

sobremuestreo. De acuerdo con estos resultados se tiene:

Del total de los registros que el modelo clasifica como “SI presenta

desnutrición por ausencia de micronutrientes (hierro)”, el 12% en la realidad

sí corresponde a esta condición.

Del total de los registros disponibles para el modelo que en realidad son “SI

presenta desnutrición por ausencia de micronutrientes (hierro)”, el modelo de

clasificación basado en árboles con sobremuestreo clasificó correctamente

el 55%.

Nota: Dado que el conjunto de datos se encuentra desbalanceado, no se utiliza la

métrica de exactitud para evaluar el desempeño del modelo incluyo aplicando las

técnicas de sobremuestreo o submuestreo.

6.6 Consolidación de las variables identificadas en los modelos

Dado que el propósito del estudio es identificar las variables que inciden sobre el

fenómeno del hambre oculta en la población de la primera infancia, a continuación

se resume por cada modelo las variables más relevantes en la caracterización del

fenómeno:

En el resultado analítico se calificó el número de ocurrencias por variable entre el

análisis descriptivo y las correlaciones con el fin de resumir la información. A

continuación se muestra en orden de relevancia las variables que más inciden de

acuerdo con el análisis efectuado:

Top Características -

Analítico

Top Características -

Regresión

Top Características - Árbol

EDAD

COD_DEPTO

CON_QUIEN_PERM

ANECE

TIPO_HOGAR_ASIS

TE

REGIMEN

NO_ALCANTARILLA

DO

NO_ENERGIA

NO_RECOLECCION

PAREDES

AGUA_PREPARAR

TAMANO_HOGAR

CON_QUIEN_PERM

ANECE

CUARTIL_RIQUEZA

SEXO

NO_ENERGIA

NO_COCINA

EDAD

NO_ALCANTARILLA

DO

NO_ACUEDUCTO

AGUA_PREPARAR_5.0

NO_RECOLECCION_nan

AGUA_PREPARAR_4.0

HOSPITALIZADO_1.0

CUARTIL_RIQUEZA

NO_ENERGIA

EDUCACION_JEFE_HOGA

R_3.0

AGUA_PREPARAR_6.0

AGUA_PREPARAR_2.0

REGIMEN_2.0

SEXO_1.0

TIPO_HOGAR_ASISTE_1.0

HOSPITALIZADO_0.0

PROBLEMAS_SALUD_DIA

Page 70: TESIS DE GRADO Sistema Analítico para la Identificación y

70

RREA_0.0

COD_DEPTO_11.0

COD_DEPTO_54.0

AREA_2.0

TAMANO_HOGAR

COD_DEPTO_18.0

EDUCACION_JEFE_HOGA

R_2.0

SEXO_JEFE_HOGAR_1.0

A continuación se relacionan las variables que inciden en el fenómeno de acuerdo

con su coincidencia en los modelos realizados:

Variable Desc. Reg. Árb. Desc. y

Reg.

Desc. y

Árb.

Reg. y

Árb.

Desc.,

Reg.

y Árb.

EDAD X

COD_DEPTO X

CON_QUIEN_PERMANECE X

TIPO_HOGAR_ASISTE X

REGIMEN X

NO_ALCANTARILLADO X

NO_ENERGIA

NO_RECOLECCION X

PAREDES X

AGUA_PREPARAR X

TAMANO_HOGAR X

CUARTIL_RIQUEZA X

SEXO X

NO_COCINA X

NO_ACUEDUCTO X

HOSPITALIZADO X

EDUCACION_JEFE_HOGAR X

PROBLEMAS_SALUD_DIARREA X

SEXO_JEFE_HOGAR X

NO_ENERGIA X

Convenciones:

Desc. = Presente solo en el análisis descriptivo.

Reg. = Presente solo en la regresión lineal.

Arb. = Presente solo en el modelo de árbol de decisión.

Desc. y Reg. = Presente en el modelo descriptivo y en la regresión.

Desc. y Arb = Presente en el modelo descriptivo y en el árbol de decisión.

Page 71: TESIS DE GRADO Sistema Analítico para la Identificación y

71

Desc, Reg. Y Arb = Presente en el modelo descriptivo, regresión y en el árbol

de decisión.

En términos generales se observa que las variables recopiladas por el modelo

basado en árboles de decisión absorbe de una manera u otra las variables

identificadas en los análisis descriptivos y de regresión puesto que en la medida en

que el árbol de decisión intenta realizar abstraer los rasgos de la información (Con

el riesgo de sobre ajustarse) puede recorrer la totalidad de las variables disponibles.

Por otra parte, solo hay una variable que prevalece en los tres modelos denominada

NO_ENERGIA.

Por tal motivo, se analizarán las variables a continuación a partir del árbol de

decisión.

6.7 Incidencia de las variables identificadas en el árbol de decisión

En las secciones anteriores, por medio de las técnicas de estadística descriptiva,

regresión y un modelo basado en árboles de decisión se determinaron las variables

que pueden estar incidiendo o no en el desarrollo del fenómeno. En esta sección se

estudiará a partir de los árboles de decisión cómo es la incidencia de estas variables

en el fenómeno.

A continuación se muestra el árbol de decisión construido bajo el modelo de

oversampling para la primera infancia:

Ilustración 12 - Rama izquierda del árbol de decisión para la primera infancia

Page 72: TESIS DE GRADO Sistema Analítico para la Identificación y

72

Ilustración 13 - Rama izquierda del árbol de decisión para la primera infancia

Para el análisis se tienen en cuentan los nodos finales donde la clase positiva (Con

desnutrición para ausencia de micronutrientes) es mayor que la clase minoritaria

(Sin desnutrición por ausencia de micronutrientes) con una impureza GINI igual a 0.

Si bien el algoritmo permite establecer reglas de negocio para explicar el fenómeno,

debe tenerse en cuenta que la aplicación de manera individual de una determinada

regla no describe fulminantemente el fenómeno sino que debe considerarse como

las piezas clave que en conjunto permiten describir el fenómeno.

En este caso se tienen las siguientes reglas:

a) SI (COD_DEPTO_18 es 1) y (COD_DEPTO_54 es 0) y (CUARTIL_RIQUEZA

es 1 o 2) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES tiene mayor riesgo a

sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que viven en el

departamento del Caquetá, que no viven en el departamento Norte de Santander y

cuyo hogar se encuentra en el Cuartil de Riqueza 1 o 2 y que son menores a 1.5

años tienen mayor susceptibilidad a la desnutrición por deficiencia de

micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se encontró

1 niño que sí tienen desnutrición por deficiencia de hierro y 23 que no.

b) SI (COD_DEPTO_54 es 1) y (CUARTIL_RIQUEZA es 1 o 2) y (EDAD < 1.5)

y (EDAD < 2.5) ENTONCES tiene mayor riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que viven en el

departamento de Norte de Santander, cuyo hogar se encuentra en el Cuartil de

Page 73: TESIS DE GRADO Sistema Analítico para la Identificación y

73

Riqueza 1 o 2 y que son menores de 1.5 años tienen mayor susceptibilidad a la

desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos con esta condición no se encontraron niños que sí

tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 32 niños

que no padecen desnutrición oculta.

c) SI (COD_DEPTO_11 es 0) y (REGIMEN_2 es 0) y (CUARTIL_RIQUEZA es

3 o 4) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES tiene mayor riesgo a sufrir

de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que no viven el

en Bogotá D.C. y cuyo régimen de salud corresponde a EPS contributiva o

Regímenes especiales (Fuerzas, Armadas, Ecopetrol, universidades, públicas,

magisterio) y cuyo hogar está caracterizado el cuartil de riqueza 3 o 4 y que son

menores de 1.5 años tienen mayor susceptibilidad a la desnutrición por deficiencia

de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 143 que

no.

d) SI (PROBLEMAS_SALUD_DIARREA_0 es 1) y (REGIMEN_2 es 1) y

(CUARTIL_RIQUEZA es 3 o 4) y (EDAD < 1.5) y (EDAD < 2.5) ENTONCES

tiene mayor riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que no

presentaron problemas de salud relacionados con diarrea en los últimos 15 días,

cuyo régimen de afiliación es EPS subsidiada, y cuyo hogar está caracterizado

el cuartil de riqueza 3 o 4 y que son menores de 1.5 años tienen mayor

susceptibilidad a la desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos con esta condición no se encontraron niños que sí

tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 26 niños

que no padecen desnutrición oculta.

e) SI (HOSPITALIZADO_0 es 0) y (TIPO_HOGAR_ASISTE_1 es 0) y

(NO_RECOLECCION_nan es 0) y (EDAD > 1.5) y (EDAD < 2.5)

ENTONCES tiene mayor riesgo a sufrir de hambre oculta.

Page 74: TESIS DE GRADO Sistema Analítico para la Identificación y

74

La regla se puede interpretar de la siguiente manera: Los niños que han sido

hospitalizados en el último año y que no asisten a un Hogar comunitario de ICBF

y cuyo hogar puede tener o no servicio de recolección de basuras y son menores

de 2.5 años pero mayores que 1.5 tienen mayor susceptibilidad a la desnutrición

por deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 164 que

no.

f) SI (HOSPITALIZADO_1 es 0) y (AGUA_PREPARAR_2 es 1) y

(NO_RECOLECCION_nan es 1) y (EDAD > 1.5) y (EDAD < 2.5)

ENTONCES tiene mayor riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que no han sido

hospitalizados en el último año y cuya fuente de agua para preparar alimentos

es el acueducto comunal o veredal y cuyo hogar no reporta información sobre la

disponibilidad del servicio de recolección de basuras y son menores de 2.5 años

pero mayores que 1.5 tienen mayor susceptibilidad a la desnutrición por deficiencia

de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se

encontraron 2 niños que sí tienen desnutrición por deficiencia de hierro y 130 que

no.

g) SI (NO_ENERGIA es 0) y (AGUA_PREPARAR_4 es 1) y (EDAD > 3.5) y

(AGUA_PREPARAR_5 es 0) y (EDAD > 2.5) ENTONCES tiene mayor

riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños cuyo hogar no

tiene déficit de energía y cuya fuente de agua para preparar alimentos es un

pozo sin bomba, jagüey y no tienen disponible como fuente de agua para

preparar alimentos aguas lluvias y son mayores de 3.5 años tienen mayor

susceptibilidad a la desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos se evidenció que con esta condición se encontró

1 niño que sí tienen desnutrición por deficiencia de hierro y 83 que no.

h) SI (TAMANO_HOGAR > 3.5) y (EDUCACION_JEFE_HOGAR_2 es 0) y

(EDAD <= 4.5) y (AGUA_PREPARAR_5 es 1) y (EDAD > 2.5) ENTONCES

Page 75: TESIS DE GRADO Sistema Analítico para la Identificación y

75

tiene mayor riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños cuyo hogar están

conformados por 7 personas o más, cuyo jefe del hogar tiene un nivel de

educación distinta a entre primaria completa y secundaria incompleta (5-10

años) y cuya fuente de agua para preparar alimentos es aguas lluvias y son

mayores de 2.5 años pero menores 4.5 tienen mayor susceptibilidad a la

desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos con esta condición no se encontraron niños que sí

tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 47 niños

que no padecen desnutrición oculta.

i) SI (PROBLEMAS_SALUD_DIARREA_0 es 1) y

(EDUCACION_JEFE_HOGAR_2 es 1) y (EDAD <= 4.5) y

(AGUA_PREPARAR_5 es 1) y (EDAD > 2.5) ENTONCES tiene mayor

riesgo a sufrir de hambre oculta.

La regla se puede interpretar de la siguiente manera: Los niños que no han

padecido problemas de salud por diarrea en los últimos 15 días y la educación

del jefe del hogar es entre primaria completa y secundaria incompleta (5-10

años) y su fuente de agua para preparar alimentos es Agua lluvias y su edad es

mayor que 2.5 años pero menor que 4.5 tienen mayor susceptibilidad a la

desnutrición por deficiencia de micronutrientes.

En la comprobación de los datos con esta condición no se encontraron niños que sí

tienen desnutrición por deficiencia de hierro y por el contrario se hallaron 14 niños

que no padecen desnutrición oculta.

La siguiente tabla muestra la importancia relativa de cada variable y su tendencia

en el análisis:

Variable Importancia Interpretación

EDAD 0.585 El modelo está

caracterizando la edad como

el factor de riesgo más

prevalente en el fenómeno.

En efecto, a menor edad el

niño es más vulnerable a la

Page 76: TESIS DE GRADO Sistema Analítico para la Identificación y

76

desnutrición y por ende a la

deficiencia de

micronutrientes.

AGUA_PREPARAR_5.0 0.059 El modelo intenta

caracterizar la fuente de

agua de preparar “Agua

lluvia” como un posible

riesgo asociado a la

prevalencia de hambre

oculta.

NO_RECOLECCION_nan 0.037 En el caso de los servicios

de recolección de basuras el

algoritmo asocia

rápidamente a los hogares

que no manifestaron

explícitamente si cuentan o

no con el servicio.

AGUA_PREPARAR_4.0 0.035 El modelo intenta

caracterizar la fuente de

agua de preparar “Pozo sin

bomba, jagüey” como un

posible riesgo asociado a la

prevalencia de hambre

oculta.

HOSPITALIZADO_1.0 0.025 El modelo caracteriza a

quienes no han sido

hospitalizados en el último

año como aquellos con

mayor prevalencia del

fenómeno.

CUARTIL_RIQUEZA 0.025 De acuerdo con el modelo

en las menores edades

(menores de 2.5 años) se

asocia a los cuartiles más

bajos (1y 2) en tanto que en

las edades mayores el

algoritmo caracteriza los

cuartiles más altos (3 y 4)

como los de mayor riesgo.

NO_ENERGIA 0.024 El modelo caracteriza los

Page 77: TESIS DE GRADO Sistema Analítico para la Identificación y

77

hogares sin déficit de

energía como los más

propensos a desarrollar el

fenómeno.

EDUCACION_JEFE_HOGAR

_3.0

0.020 En general, el modelo

intenta caracterizar a

quienes tienen un nivel de

educación distinto a “Entre

secundaria completa y

superior incompleta (11-15

años)” como los más

propensos a padecer de

hambre oculta.

AGUA_PREPARAR_6.0 0.020 El modelo asocia la fuente

de agua para preparar

“Manantial, nacimiento”

como uno de los factores de

riesgo.

AGUA_PREPARAR_2.0 0.019 El modelo asocia la fuente

de agua para preparar

“Manantial, nacimiento”

como uno de los factores de

riesgo.

REGIMEN_2.0 0.017 El modelo asocia las

personas con régimen de

salud “EPS subsidiada” a

ser menos propensos a la

prevalencia del hambre

oculta.

SEXO_1.0 0.017 El modelo caracteriza a las

niñas como población

especialmente vulnerable al

fenómeno del hambre

oculta.

TIPO_HOGAR_ASISTE_1.0 0.017 El modelo caracteriza a los

niños que no asisten a un

hogar comunitario de ICBF

como más propensos al

hambre oculta.

HOSPITALIZADO_0.0 0.016 El modelo caracteriza a

Page 78: TESIS DE GRADO Sistema Analítico para la Identificación y

78

quienes no han sido

hospitalizados en el último

año como aquellos con

mayor prevalencia del

fenómeno.

PROBLEMAS_SALUD_DIAR

REA_0.0

0.015 El algoritmo caracteriza a los

niños que han sufrido

episodios de diarrea en los

últimos 15 días con mayor

tendencia a sufrir deficiencia

de micronutrientes.

COD_DEPTO_11.0 0.015 El modelo caracteriza con

mayor riesgo a quienes no

se encuentran en Bogotá

D.C.

COD_DEPTO_54.0 0.013 El modelo caracteriza con

mayor riesgo a quienes

habitan en el departamento

de Norte de Santander.

AREA_2.0 0.011 El modelo también

considera que hay mayor

riesgo en la población que

habita en el “Resto (Centro

poblado)” que en la

cabecera municipal o las

áreas rurales.

TAMANO_HOGAR 0.010 El modelo caracteriza que

los hogares que tienen 7

integrantes o más son más

propensos a tener

prevalencia de hambre

oculta.

COD_DEPTO_18.0 0.009 El modelo caracteriza con

mayor riesgo a quienes

habitan en el departamento

de Caquetá.

EDUCACION_JEFE_HOGAR

_2.0

0.007 El modelo caracteriza con

mayor riesgo a los hogares

cuyo jefe del hogar tiene una

educación “Entre primaria

Page 79: TESIS DE GRADO Sistema Analítico para la Identificación y

79

completa y secundaria

incompleta (5-10 años)”

SEXO_JEFE_HOGAR_1.0 0.005 El modelo caracteriza con

mayor riesgo los hogares

cuyo rol de jefe de hogar es

asumido por un hombre.

Page 80: TESIS DE GRADO Sistema Analítico para la Identificación y

80

7. VALIDACIÓN CON LOS EXPERTOS

En esta sección se recopilan los conceptos más relevantes emitidos por los expertos

en la materia. Para comenzar, es importante señalar que dada la complejidad del

fenómeno estudiado, muchas de los hallazgos pueden explicarse por medio de la

asociación de otros fenómenos conocidos en la sociedad. Sin embargo, hay otros

fenómenos hallados en el estudio que pueden no tener explicación y no

necesariamente se deben entender como erróneos o no válidos para la

caracterización del fenómeno. Por el contrario, se constituyen como hallazgos que

deberán ser estudiados posteriormente para comprobar o rechazar completamente

su incidencia en el fenómeno del hambre oculta.

7.1 Población de Mujeres Gestantes

En la población de mujeres gestantes la anemia por deficiencia de hierro (ADEF),

de acuerdo con el estudio, está asociado a factores socioeconómicos tales como

las características de la vivienda, ingresos económicos, factores alimentarios como

calidad de la dieta, factores de salud, por lo que ciertas enfermedades pueden

desencadenar esta deficiencia (parásitos) y otros factores como genéticos como la

raza aunque son menos frecuentes.

De acuerdo con las variables que muestra el árbol de decisión:

a) Aunque tener alcantarillado resulta un factor en el que hay más gestantes

con ADEF, en términos de proporción es mayor el evento en aquellas que

presentan déficit de alcantarillado, en ambos casos podría explicarse en la

medida en que, si bien esta es una característica de la vivienda, pueden en

ciertas mujeres gestantes tener relevancia es aspectos como los hábitos de

higiene, por ejemplo, el lavado de manos.

b) En cuanto a la variable de afiliación en Colombia se ha avanzado

notablemente en lograr cobertura universal. A pesar de ellos hay cerca de un

5% de la población sin afiliar al sistema general de salud. Nuevamente

aunque en términos absolutos hay más gestantes con ADEF con afiliación,

en proporción en 1 de cada 4 gestantes sin afiliación pueden presentar la

condición. Esto se debe a que contar con la afiliación al Sistema de

Seguridad Social en Salud no necesariamente garantiza la atención en salud

y más aún que ésta sea de calidad, por lo cual, no necesariamente al

pertenecer algún régimen garantiza que estén recibiendo la suplementación

con vitaminas y minerales que para esta población es obligatoria.

c) Frente a los resultados de edad, tiene gran relevancia que identifique a las

mujeres menores de 16.5 años con mayor probabilidad de tener ADEF ya

Page 81: TESIS DE GRADO Sistema Analítico para la Identificación y

81

que este grupo edad por lo general presentan embarazos de alto riesgo, en

la medida que aún el cuerpo femenino no está preparado para el embarazo

y menos aún tiene las reservas suficientes de hierro que se requieren para

este proceso.

d) En relación a los resultados por departamento, éstos pueden deberse a la

disponibilidad y consumo de alimentos que son de mayor o menor consumo

en cada uno de estos sitios, es decir pueden relacionarse con los patrones y

hábitos alimentarios de una persona y a la facilidad o no de adquirir cierto

tipos de alimentos.

e) Para el caso de cuartil de riqueza, estos resultados se relacionan

directamente con la calidad de la alimentación, es decir, parte de la

deficiencia en el crecimiento y la deficiencia de vitaminas y minerales se

explica porque no es suficiente con garantizar las calorías (evitar desnutrición

aguda) sino que se debe llevar una alimentación saludable (CESA:

Completa, Equilibrada, Suficiente y Adecuada).

f) Finalmente para los resultados de paredes y pisos se relacionan con las

condiciones de la vivienda, aunque son contradictorios en especial lo

relacionado con las paredes de bareque pero puede probablemente deberse

a la proporción en cada categoría.

7.2 Población de Primera Infancia

La anemia por deficiencia de hierro (ADEF) en niños es un evento de alto impacto,

no sólo en la edad que tengan, sino que tiene efectos a lo largo de la vida de estos

individuos en la medida que se ha limitado su desarrollo cerebral y por ende las

capacidades que puede llegar a expresarse en las etapas posteriores.

De acuerdo a lo anterior, al revisar el resultado en que la variable edad es clave en

identificar que a menor edad del niño o niña tiene más riesgo de presentar ADEF,

lo cual, se relaciona con la práctica de lactancia materna e inicio de la alimentación

complementaria, siendo estas características muy importantes en el aporte del

hierro a través del consumo de alimentos.

En cuanto a las fuentes de agua, el modelo muestra que hay mayor probabilidad de

presentar el evento cuando el agua no es potable, lo cual es explicable en la medida

que se preparan alimentos con agua que no tiene las condiciones adecuadas, lo

que implica que puede tener parásitos y estos a su vez puede causar anemia.

Frente a los resultados relacionados con el estado de salud, de ser más propensos

quienes no han estado hospitalizados en el último año podría explicarse que

aquellos que han tenido esta condición pueden haber recibido suplementación y

Page 82: TESIS DE GRADO Sistema Analítico para la Identificación y

82

fortificación con micronutrientes. Así mismo, quienes han presentado diarrea en los

últimos quince días tienen mayor probabilidad de presentar ADEF debido a que los

eventos pueden relacionarse con la presencia de parásitos, adicionalmente cuando

se presenta diarrea también disminuye el apetito y por lo tanto se afecta el consumo

de alimentos.

Para el caso de la variable de cuartil de riqueza, dos resultados relevantes: El

primero, que a menor edad mayor probabilidad si estás en los primeros cuartiles, es

decir condiciones de vivienda desfavorables y baja capacidad adquisitiva para la

compra de alimentos. El segundo, que en edades mayores está relacionado con los

cuartiles más altos, lo que puede explicarse con la calidad de la alimentación que

se adquiere en la familia.

En relación a la variable de número de integrantes por hogar tiene sentido que sea

más probable en hogares varios miembros, debido a que la comida debe repartirse

en un mayor número de personas. En cuanto a los resultados de nivel educativo

del jefe de hogar, se pueden explicar a través de la evidencia disponible para el

caso de desnutrición crónica en menores de cinco años, en donde la presencia del

evento es inversamente proporcional al nivel educativo de la madre.

Page 83: TESIS DE GRADO Sistema Analítico para la Identificación y

83

8. CONCLUSIONES Y TRABAJOS FUTUROS

A continuación, se presentan los principales hallazgos y conclusiones de la

investigación:

a) Las diferentes dimensiones presentadas y estudiadas a lo largo de esta

investigación tales como las dimensiones geográficas, sociales, condiciones

del hogar, y económicas son tanto o más relevantes en el desarrollo del

fenómeno de la desnutrición oculta que la dimensión exclusivamente

individual o clínico de la enfermedad.

b) En la población de las mujeres gestantes, el presente estudio muestra que la

enfermedad de desnutrición oculta tiene una especial prevalencia en:

i. Las mujeres gestantes que aún no cuentan con acceso al sistema

general de salud.

ii. Las mujeres gestantes cuyo hogar no cuenta con acceso al servicio

de alcantarillado.

iii. Las mujeres gestantes cuyo hogar tiene deficiencias de infraestructura

especialmente cuyos pisos no sean de baldosas, vinilo, tableta o

ladrillo, caucho, otros materiales sintéticos.

iv. Las mujeres gestantes cuyos hogares se ubican en los cuartiles de

riqueza más altos.

c) En la población de la primera infancia, el presente estudio muestra que la

enfermedad de desnutrición oculta tiene una especial prevalencia en:

i. Los niños que viven en los departamentos del Caquetá y Norte de

Santander y cuyo hogar se encuentra ubicado en los cuartiles de

riqueza más bajos (1 y 2) cuya edad es menor que 2.5 años.

ii. Los niños que no viven en la capital de la república, cuyos padres

pertenecen al régimen contributivo y cuyo hogar se encuentra ubicado

en los cuartiles de riqueza más altos (3 y 4) y su edad es menor que

2.5 años.

iii. Los niños cuyo hogar tiene como fuente de agua primaria para

preparar alimentos acueducto comunal o veredal y no cuentan o

reportan servicio de recolección de basuras y son menores de 2.5

años.

iv. Los niños cuyo hogar tiene como fuente de agua primaria para

preparar alimentos pozo sin bomba, jagüey, su hogar cuenta con

servicio eléctrico y son mayores de 3.5 años.

v. Aunque no se pudo comprobar con la muestra, se muestra una

asociación de riesgo en los niños cuyo hogar está conformado por más

de siete (7) personas.

Page 84: TESIS DE GRADO Sistema Analítico para la Identificación y

84

vi. Aunque no se pudo comprobar en la muestra, hay una asociación del

fenómeno con los niños que no permanecen al cuidado de su entorno

familiar más cercano. Es decir, hay mayor riesgo de prevalencia de la

enfermedad en los niños que son cuidados por familiares distantes o

incluso por terceros.

d) Pese a que, de acuerdo con la muestra la población estudiada cuenta con

una cobertura del sistema general del sistema nacional de salud superior al

90%, es importante que las entidades gubernamentales trabajen en mejorar

la calidad del sistema para que los usuarios en general puedan acceder

oportunamente a las campañas de prevención y tratamiento.

e) La metodología propuesta a lo largo de esta investigación permite realizar

una nueva aproximación por medio de las herramientas provistas por la

ciencia de datos para comprender, caracterizar y enfocar los recursos para

la atención y prevención del fenómeno del hambre oculta en Colombia.

8.1 Trabajos futuros

A partir del resultado de esta investigación, se proponen las siguientes iniciativas

para el descubrimiento de patrones y nuevos hallazgos que permitan proponer

estrategias adicionales en contra de la desnutrición por micronutrientes. De

antemano, es importante que el gobierno o las entidades designadas para ello

continúen realizando esfuerzos por recopilar la mayor cantidad de información

posible de manera estructurada para proveer materia prima para los estudios

propuestos:

a) El estudio actual no incluye información sobre los hábitos de consumo de

alimentos, el cual, es una variable considerada fundamental en el desarrollo

En la desnutrición por micronutrientes. Por lo tanto, nuevos estudios que

centren su atención sobre la frecuencia y calidad de la ingesta de alimentos

en las poblaciones objetivo pueden generar un gran valor a la hora de

proponer estrategias complementarias a suplementación.

b) El estudio actual no incluye dentro de sus dimensiones socioeconómicas

otras variables como:

i. Disponibilidad de alimentos o centros de acopio.

ii. Robustez de la infraestructura y comunicaciones (Vías de acceso,

aeropuertos, puertos)

iii. Indicadores económicos tales como índice de precios al consumidor

(IPC), tasas de cambio representativas del mercado o indicadores de

la canasta familiar presentes en la Bolsa Mercantil de Colombia.

En ese sentido, dichas dimensiones pueden tener relaciones significativas

con el desarrollo de la desnutrición y la desnutrición por deficiencia de

Page 85: TESIS DE GRADO Sistema Analítico para la Identificación y

85

micronutrientes, por lo que estudios posteriores pueden generar visiones

complementarias.

c) Dado que el propósito de este estudio se centró en la explicación de la

incidencia en el fenómeno estudiado, se prefirieron algoritmos cuyo

funcionamiento resultara fácilmente explicable. Desde el punto de vista de la

creación de modelos predictivos pueden explorarse otros algoritmos más

sofisticados como, por ejemplo, las redes neurales que permitan mayores

niveles de precisión sobre la identificación de población en riesgo.

Page 86: TESIS DE GRADO Sistema Analítico para la Identificación y

86

BIBLIOGRAFÍA [1] «El hambre en el mundo lleva tres años sin disminuir y la obesidad sigue creciendo».

https://www.who.int/es/news-room/detail/15-07-2019-world-hunger-is-still-not-going-

down-after-three-years-and-obesity-is-still-growing-un-report (accedido jun. 29, 2020).

[2] «El “Hambre Oculta”, un grave problema de salud pública en América Latina y el

Caribe | World Food Programme», Programa Mundial de Alimentos.

https://es.wfp.org/noticias/el-hambre-oculta-un-grave-problema-de-salud-publica-en-

america-latina-y-el-caribe (accedido mar. 20, 2020).

[3] FAO, OPS, WFP y UNICEF, «Panorama de la seguridad alimentaria y nutricional en

América Latina y el Caribe 2018. Santiago.» 2018.

[4] J. W. Tukey, «The Future of Data Analysis», en Breakthroughs in Statistics: Methodology and Distribution, S. Kotz y N. L. Johnson, Eds. New York, NY: Springer

New York, 1992, pp. 408-452.

[5] W. Cleveland, «Data Science: An Action Plan for Expanding the Technical Areas of

the Field of Statistics», International Statistical Review / Revue Internationale de

Statistique, vol. 69, mar. 2001, doi: 10.1111/j.1751-5823.2001.tb00477.x.

[6] «WHO | Haemoglobin concentrations for the diagnosis of anaemia and assessment of

severity», WHO. http://www.who.int/vmnis/indicators/haemoglobin/en/ (accedido may

31, 2020).

[7] N. González Hernández, S. Rodriguez González, y A. Arriola, «Hambre Oculta», 1,

vol. 8, p. 109, abr. 2017.

[8] «Malnutrición: no se trata solamente de hambre», Organización Mundial de la Salud,

oct. 25, 2017. https://www.who.int/es/news-room/commentaries/detail/malnutrition-it-

s-about-more-than-hunger (accedido mar. 20, 2020).

[9] «Malnutrición», Organización Mundial de la Salud, feb. 16, 2018.

https://www.who.int/es/news-room/fact-sheets/detail/malnutrition (accedido mar. 20,

2020).

[10] «El hambre oculta nos afecta a todos», El hambre oculta nos afecta a todos, ago. 11,

2019. https://twnews.co/co-news/el-hambre-oculta-nos-afecta-a-todos (accedido mar.

20, 2020).

[11] «Organización de las Naciones Unidas para la Alimentación y la

Agricultura: Aunque en Colombia se reduce, el hambre aumenta en el mundo: informe

ONU sobre hambre y malnutrición | FAO en Colombia | Organización de las Naciones

Unidas para la Alimentación y la Agricultura», FAO, jul. 15, 2019.

http://www.fao.org/colombia/noticias/detail-events/es/c/1202301 (accedido mar. 20,

2020).

[12] «OMS | Carencia de micronutrientes», WHO.

http://www.who.int/nutrition/topics/ida/es/ (accedido mar. 20, 2020).

[13] M. S. Rahman, M. Mushfiquee, M. S. Masud, y T. Howlader, «Association between

malnutrition and anemia in under-five children and women of reproductive age:

Evidence from Bangladesh Demographic and Health Survey 2011», PLOS ONE, vol.

14, n.o 7, p. e0219170, jul. 2019, doi: 10.1371/journal.pone.0219170.

[14] M. C. et al., «Anemia: An indicator for malnutrition in the elderly», Annals of

hematology, vol. 80, pp. 295-8, 2001, doi: 10.1007/s002770100287.

[15] W. Yang et al., «Anemia, malnutrition and their correlations with socio-

demographic characteristics and feeding practices among infants aged 0-18 months in

Page 87: TESIS DE GRADO Sistema Analítico para la Identificación y

87

rural areas of Shaanxi province in northwestern China: a cross-sectional study.», BMC

Public Health, vol. 12, p. 1127, dic. 2012, doi: 10.1186/1471-2458-12-1127.

[16] J. E. Ewusie, J. Beyene, C. Ahiadeke, y J. S. Hamid, «Malnutrition in Pre-school

Children across Different Geographic Areas and Socio-Demographic Groups in

Ghana.», Matern Child Health J, vol. 21, n.o 4, pp. 797-808, abr. 2017, doi:

10.1007/s10995-016-2173-z.

[17] A. IBM, «Analytics Solutions Unified Method», mar. 2016, [En línea]. Disponible

en: ftp://ftp.software.ibm.com/software/data/sw-library/services/ASUM.pdf.

[18] «Encuesta Nacional de Situación Nutricional (ENSIN)».

https://www.minsalud.gov.co/salud/publica/epidemiologia/Paginas/encuesta-nacional-

de-situacion-nutricional-ensin.aspx (accedido may 25, 2020).

[19] «OMS | Concentraciones de ferritina para evaluar el estado de nutrición en hierro en

las poblaciones.», WHO. http://www.who.int/vmnis/indicators/ferritin/es/ (accedido

may 31, 2020).

[20] N. S. Chok, «Pearson’s Versus Spearman’s and Kendall’s Correlation Coefficients

for Continuous Data», sep. 2010.

[21] R. K. Prematunga, «Correlational analysis», Australian Critical Care, vol. 25, n.o 3,

pp. 195-199, ago. 2012, doi: 10.1016/j.aucc.2012.02.003.

[22] S. García, A. Fernández, y F. Herrera, «Enhancing the effectiveness and

interpretability of decision tree and rule induction classifiers with evolutionary training

set selection over imbalanced problems», Applied Soft Computing, vol. 9, n.o 4, pp.

1304-1314, sep. 2009, doi: 10.1016/j.asoc.2009.04.004.