estado del arte ciencia de datos aplicado a ciencias de la

13
Estado del arte Ciencia de datos aplicado a Ciencias de la Salud Rodrigo Tapia McClung, Tania Gómez Fernández [email protected], [email protected] 21 julio 2021 Las ciencias de la salud es un campo de conocimiento que se conforma por un numeroso grupo de disciplinas relacionadas con la prestación de servicios y atención médica a humanos y animales. Este campo toma fundamentos de las ciencias puras y otras fuentes afines, que se aplican para mantener y mejorar la salud de los seres vivos. En la actualidad, las ramas de la ciencia de la salud son muy diversas y la inclusión de la tecnología dentro de sus fuentes afines ha permitido alcanzar desarrollos y mejoras en periodos de tiempo cada vez más cortos. Estos avances son visibles para la sociedad a través de diversos medios como aparatos, procedimientos e incluso protocolos que generan un impacto beneficioso en el cuidado de la salud. Por ejemplo, la detección de signos de enfermedad por medio de imágenes computarizadas en tiempo real, como rayos X o ultrasonidos, personalización de tratamientos o el registro detallado del historial clínico sobre el curso de una enfermedad, son una muestra de cómo la tecnología está cambiando la percepción pública sobre el cuidado de la salud, ofreciendo diagnósticos más certeros e incluso procedimientos menos invasivos. Mención aparte merecen las tecnologías relacionadas con los datos masivos, como la ciencia e ingeniería de datos, que se enfocan en las técnicas de adquisición, manejo, procesamiento y minería de datos, y especialmente el uso de algoritmos para análisis de datos a gran escala. Incluir estas herramientas de trabajo en las ciencias de la salud permite obtener información más detallada y oportuna del estado de los pacientes, el curso que tomará una enfermedad y la atención que debería recibir. La salud pública es un tema de importante relevancia social, porque los factores que la afectan, como los servicios sanitarios, hábitos de higiene, programas de vacunación, infraestructura hospitalaria, revisiones médicas periódicas, seguridad social, vigilancia y control de riesgos sanitarios, inciden directamente en la calidad de vida de las personas y, al mismo tiempo, en la salud pública. La ciencia de datos aplicada al cuidado de la salud está alcanzando nuevos horizontes. Hoy en día, las aplicaciones de ciencia de datos son tan diversas que van desde una aplicación de celular para seguimiento de signos vitales, pasando por desarrollos más complejos como el estudio especializado del genoma humano, enfermedades o desarrollo de fármacos e incluso generar un impacto significativo en la gestión del sistema de salud, por ejemplo, al reducir el tiempo de espera de los pacientes para recibir una cita. Estos avances en ciencias de la salud son el resultado de utilizar intensivamente una variedad de equipamiento moderno que generan una gran cantidad de datos relacionados con la salud. Esto

Upload: others

Post on 20-Oct-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Estado del arte Ciencia de datos aplicado a Ciencias de la Salud Rodrigo Tapia McClung, Tania Gómez Fernández [email protected], [email protected] 21 julio 2021 Las ciencias de la salud es un campo de conocimiento que se conforma por un numeroso grupo de disciplinas relacionadas con la prestación de servicios y atención médica a humanos y animales. Este campo toma fundamentos de las ciencias puras y otras fuentes afines, que se aplican para mantener y mejorar la salud de los seres vivos. En la actualidad, las ramas de la ciencia de la salud son muy diversas y la inclusión de la tecnología dentro de sus fuentes afines ha permitido alcanzar desarrollos y mejoras en periodos de tiempo cada vez más cortos. Estos avances son visibles para la sociedad a través de diversos medios como aparatos, procedimientos e incluso protocolos que generan un impacto beneficioso en el cuidado de la salud. Por ejemplo, la detección de signos de enfermedad por medio de imágenes computarizadas en tiempo real, como rayos X o ultrasonidos, personalización de tratamientos o el registro detallado del historial clínico sobre el curso de una enfermedad, son una muestra de cómo la tecnología está cambiando la percepción pública sobre el cuidado de la salud, ofreciendo diagnósticos más certeros e incluso procedimientos menos invasivos. Mención aparte merecen las tecnologías relacionadas con los datos masivos, como la ciencia e ingeniería de datos, que se enfocan en las técnicas de adquisición, manejo, procesamiento y minería de datos, y especialmente el uso de algoritmos para análisis de datos a gran escala. Incluir estas herramientas de trabajo en las ciencias de la salud permite obtener información más detallada y oportuna del estado de los pacientes, el curso que tomará una enfermedad y la atención que debería recibir. La salud pública es un tema de importante relevancia social, porque los factores que la afectan, como los servicios sanitarios, hábitos de higiene, programas de vacunación, infraestructura hospitalaria, revisiones médicas periódicas, seguridad social, vigilancia y control de riesgos sanitarios, inciden directamente en la calidad de vida de las personas y, al mismo tiempo, en la salud pública. La ciencia de datos aplicada al cuidado de la salud está alcanzando nuevos horizontes. Hoy en día, las aplicaciones de ciencia de datos son tan diversas que van desde una aplicación de celular para seguimiento de signos vitales, pasando por desarrollos más complejos como el estudio especializado del genoma humano, enfermedades o desarrollo de fármacos e incluso generar un impacto significativo en la gestión del sistema de salud, por ejemplo, al reducir el tiempo de espera de los pacientes para recibir una cita. Estos avances en ciencias de la salud son el resultado de utilizar intensivamente una variedad de equipamiento moderno que generan una gran cantidad de datos relacionados con la salud. Esto

pone sobre la mesa el escenario ideal para utilizar la ciencia de datos para ayudar significativamente en la toma de decisiones basada en información personalizada. Son muchas las publicaciones que mencionan la estadística y el uso de modelos estadísticos como la raíz de la ciencia de datos (Baro et al., 2005; Di Camillo et al., 2020), cuando en 1962 John Tukey escribió “The Future of Data Analysis”, enfatizando que la estadística había alcanzado un nivel de madurez con el cual el análisis de datos y los procedimientos estadísticos relacionados eran una ciencia empírica, y que posiblemente tendría mayor impacto con el crecimiento de los programas electrónicos y las computadoras (Mallows, 2006). La visión de Tukey sobre el análisis de datos es comprensible si consideramos el panorama tecnológico y las aportaciones intelectuales en otras disciplinas que había en esos momentos; especialmente en campos como investigación de operaciones, cómputo, desarrollo de hardware y software y la miniaturización tecnológica, por mencionar algunas (Tukey y Wilk, 1966). En la Figura 1 se muestra el panorama de avances tecnológicos e intelectuales que contribuyeron al desarrollo del análisis de datos hasta la disciplina que hoy conocemos como Ciencia de Datos. En conjunto estos avances contribuyeron a la maduración de la estadística como ciencia y, también, a que se extendiera su uso en otras aplicaciones. Décadas después, con la digitalización de la información, la accesibilidad de las computadoras y la presencia del internet, hubo cambio significativos en la percepción del valor de la información, y pronto empezó la conciencia colectiva sobre la importancia de la información obtenida a partir de los datos y sus implicaciones en otras tareas que hasta entonces eran difíciles de llevar a cabo, como monitorear patrones en tiempo real, detectar objetos en imágenes, atender muchos clientes simultáneamente y de forma remota, traducir textos, etc. Actualmente, cada vez son más las actividades cotidianas que se convierten en procesos “datificables” (Baro et al., 2005; Swan, 2013 ) y claramente es una tendencia en ascenso que depende de otras estructuras, como aparatos o sensores, que facilitan la captación de datos, programas para almacenamiento y procesamiento, digitalización y representación de información. Estas tecnologías, representan una oportunidad de desarrollo para otras disciplinas que adoptan algunos procesos y los incorporan a otros para mejorar o innovar aplicaciones propias de su ramo. Un ejemplo de esto podría ser la capacitación por medio de simuladores, monitoreo de fenómenos meteorológicos, cirugías asistidas por robots, obtención de imágenes del espacio, etc. En la Figura 2, se muestra el mapa con aplicaciones enfocadas a la generación de información a partir del análisis de datos, divididas por tipo de aplicación (analítica, visualización, inteligencia de negocios, monitoreo, etc.) y el campo en el que se utilizan (marketing, salud, recursos humanos, legal, etc.) que anualmente actualiza Matt Turck y la firma FirstMark (Turck, 2020). De momento, hemos visto que aunque el análisis de datos se concibió como una herencia de la estadística, es evidente que con el paso del tiempo adoptó conceptos, procedimientos y prácticas de otras ciencias hasta que se convirtió en un campo multidisciplinario: la Ciencia de Datos, que combina habilidades de computación, conocimientos matemáticos, estadísticos y, especialmente, experiencia y conocimiento en un ramo específico de otra disciplina. Así, podemos tener científicos de datos especializados en negocios, lingüística, música, salud, biología u otros campos. Naturalmente, los profesionales de ciencias de la salud también adoptaron la ciencia de datos como herramienta de trabajo en la búsqueda de soluciones para problemas de antaño y de la actualidad. Consideremos que factores como la explosión urbana, sobrepoblación, cambios en el medio ambiente, por mencionar algunos, pueden transformar un problema sencillo en una situación con varios niveles de complejidad que afectan directamente la salud de los individuos y la red de instituciones que proveen los servicios de salud.

Para este artículo se hace una breve revisión del estado del arte de la ciencia de datos aplicadas a la ciencia de la salud, y también el amplio rango de aplicaciones y tendencias que hay en la actualidad. La revisión bibliográfica que se presenta, comprende las principales aplicaciones de herramientas de ciencia de datos en diferentes ramos de ciencias de la salud. Podemos percibir que las aplicaciones son nutridas en complejidad.

Figura 1. Desarrollo de las Ciencias de la computación y la estadística hasta consolidar la Ciencia de datos [https://agenda.infn.it/event/19049/contributions/98115/attachments/66537/81428/Kuznetsov-Tuesday.pdf]

Figura 2. Panorama del ecosistema de aplicaciones para datos e inteligencia artificial en el 2020. Fuente: Matt Turck. Algunas de ellos son: Análisis de imágenes médicas El análisis de imágenes tiene un rol importante en el área de salud. De manera natural, utilizamos la vista y nuestras habilidades cognitivas para detectar patrones, colores, posiciones de objetos, etc. Un profesional de ciencias de la salud, requiere un entrenamiento especializado para discriminar entre un organismo sano y uno enfermo. La decisión correcta está vinculada en gran medida a criterios basados en la observación del paciente y su correspondencia con otros síntomas. La visión computarizada es una de las aplicaciones más populares en ciencia de datos, y más específicamente, del aprendizaje de máquina (machine learning). Se ha implementado en gran cantidad de problemas que requieren identificar o clasificar objetos y cuantificar indicadores relacionados al objeto mismo (Duncan y Ayache, 2000), obteniendo exitosos resultados en actividades relacionadas con detección anatómica de estructuras celulares, detección de tejidos, detección de enfermedades con asistencia de computadoras, entre otros (Shen et al, 2017; McInerney y Terzopoulos, 1996; De Bruijne, 2016; Pham et al., 2000). Por lo que el objetivo de este tipo de aplicaciones es extraer información de forma acertada y eficaz para mejorar el diagnóstico clínico (Anwar et al., 2018). Los recientes avances en el campo de la ingeniería biomédica hacen del análisis de imágenes médicas una de las áreas de investigación y desarrollo más importantes. Una de las razones de este avance, es la aplicación de técnicas de aprendizaje automático para el análisis de imágenes médicas. Esta rama de la medicina aún es joven y enfrenta desafíos de diferentes tipos ya que debido a la creciente cantidad de datos, es necesario ajustar los algoritmos de visualización y procesamiento de imágenes para resolver estos desafíos se han desarrollado algoritmos escalables y técnicas avanzadas de procesamiento gráfico (Scholl, 2011). Descubrimiento y refinamiento de fármacos El desarrollo de fármacos es un proceso complejo que se enfoca en la identificación de compuestos químicos para el uso clínico de sustancias (Saldívar-González, 2017). Se estima que, en promedio, se requiere una inversión de 800 millones de dólares y aproximadamente un lapso entre 10 y 15 años para obtener un fármaco. El tiempo y costo dependen de la cantidad de ensayos y etapas de desarrollo (Saldívar-González, 2017). Aunque el descubrimiento y desarrollo de medicamentos se ha hecho durante muchos años usando únicamente métodos experimentales, durante la década pasada, el acercamiento al “big data” por medio de bases de datos acerca de sustancias químicas, enfermedades, genética, toxicidad y otros campos de información clínica, permitió un entendimiento más amplio y profundo sobre el descubrimiento y desarrollo de fármacos (Ferrero et al., 2020). Asimismo, la inclusión de métodos de cómputo (también llamados in silico) permiten codificar con precisión modelos teóricos y son capaces de procesar grandes cantidades de información (Saldívar-González, 2017). En muchos casos, la aplicación de modelos generados in silico contribuye a entender los mecanismos de acción de los principios activos de los medicamentos o mejorar las propiedades de los mismos. Hoy en día, estos cambios en el procedimiento tradicional han permitido la identificación sistemática, acelerada y de alto rendimiento de nuevos fármacos o indicaciones para reutilizar fármacos existentes en degeneraciones de una enfermedad que se presenta en forma individual

para cada paciente (Workman y Antolin, 2019; Chen et al., 2018; Réda, Kaufmann y Delahaye-Duriez, 2020). Para botón de muestra, examinemos la cronología de algunos fármacos, como las vacunas, que influyen notablemente en la salud pública. En 1796, Edward Jenner creó la primera vacuna exitosa contra la viruela. Sin embargo, 164 años después, en 1950, los tratamientos con vacunas combatieron efectivamente la enfermedad hasta su erradicación en 1967 (Departamento de inmunización, vacunas y biológicos de la Organización Mundial de la Salud. (2006). La poliomielitis se descubrió en 1905. En 1908, se logró aislar el virus por primera vez y en 1955 se obtuvo una vacuna 80% - 90% efectiva, pero con efectos secundarios como la paralización (Departamento de inmunización, vacunas y biológicos de la Organización Mundial de la Salud. (2006). En 1960, 55 años después de aislar el virus, se obtuvo una vacuna efectiva contra la poliomielitis sin ese efecto secundario; y en 1994 se declaró erradicada por la Organización Panamericana de la Salud. En enero de 2020, el SARS-CoV-2 se propagó rápidamente en la población mundial y el 11 de marzo de 2020 la OMS declaró oficialmente que esta enfermedad alcanzó el grado de pandemia. Inmediatamente, los laboratorios se enfocaron en encontrar tratamientos paliativos para la enfermedad y luego, en desarrollar una vacuna. El 12 de diciembre de 2020, la vacuna desarrollada por Pfizer y BioNTech fue la primera en ser aprobada por el Reino Unido y la Administración de Medicamentos y Alimentos de Estados Unidos (FDA, por sus siglas en inglés). Así, en menos de un año se logró obtener una vacuna para combatir la propagación de la enfermedad. El creciente interés de las industrias en la tecnología de la información ha facilitado aún más el uso de big data para mejorar los avances en el desarrollo y uso de fármacos (Butte e Ito, 2012, Sheiner y Steimer, 2020). Sistemas de salud pública La salud pública y los servicios de salud pública están cambiando drásticamente con la inclusión de la tecnología. Sin duda, la presencia de las computadoras y los sistemas de cómputo modificaron el modo de organizar los servicios de salud, facilitando el entendimiento de las necesidades del negocio, como los servicios logísticos, el mantenimiento, la limpieza y otros que permiten el funcionamiento óptimo del servicio (Leung, 2011; Pastorino et al., 2019). La dinámica de los sistemas de salud pública se reconoce como un problema de alta complejidad porque hay varios elementos que interactúan simultáneamente. Estos elementos pueden ser emergentes o permanentes y, además, persisten en el tiempo o se adaptan a circunstancias cambiantes. Estas condiciones motivan el uso de tecnología que alivie la carga de trabajo derivada de la prestación de servicios de salud y, al mismo tiempo, mejore la experiencia y calidad del servicio para los pacientes (Vayena et al, 2015; Manogaran et al., 2017; Abinaya y Kumar, 2015). Recientemente, se han incluido procedimientos de ciencia de datos en el estudio de la dinámica de los sistemas de salud, como el análisis de redes y modelos basados en agentes, para comprender el funcionamiento del sistema en escenarios con condiciones críticas. Por ejemplo, en presencia de enfermedades altamente infecciosas, saturación del servicio, limitación en el presupuesto de tiempo, personal y material, enfermedades de largo plazo u otros tipos de emergencias sanitarias que incurran en estresar la dinámica del sistema de salud (Pastorino et al., 2019; Alloghani et al., 2018). COVID (diagnóstico, tratamiento, servicios de salud, manejo epidemiológico) Los efectos de la propagación del COVID-19 golpearon súbitamente las estructuras socioeconómicas a nivel mundial. El impacto se estima en cifras astronómicas de pérdidas de vidas, recursos y

empleos. En todo el mundo se desplegaron medidas sanitarias y económicas para detener el avance de la epidemia sin tener certeza sobre la duración del periodo de emergencia y las consecuencias de la pandemia sobre la población y los sistemas productivos. Durante la evolución de la pandemia, la ciencia, la innovación y el sector empresarial explotaron intensivamente la investigación en técnicas de ciencia de datos para detectar, mitigar, dar tratamiento y erradicar el COVID-19. Este trabajo masivo e intensivo se encaminó hacia diferentes campos de trabajo, como la investigación propia del COVID-19 y otras variantes del coronavirus, análisis y estudios de caso sobre pandemias anteriores y también sobre el antes y después de los efectos de la pandemia actual. Algunas aplicaciones de ciencia de datos se tomaron para diagnosticar la enfermedad, proponer métodos innovadores e implementar estrategias dirigidas a la salud pública y de mitigación. Ejemplos de estos enfoques incluyen el análisis de imágenes, el procesamiento de datos masivos, geoprocesamientos, monitoreo y rastreo, sistemas predictivos, diseños cognitivos, tecnología para dispositivos electrónicos y soluciones de telemedicina y difusión de información. Genómica La genómica estudia el ADN completo, es decir, toda la secuencia de genes que se encuentran en un organismo, en contraste con la genética, la cual estudia genes de forma individual. A finales de los 90s, se logró secuenciar el ADN humano y se inició una nueva carrera por el conocimiento de combinaciones de genes para entender las modificaciones del ADN que convergen en algún padecimiento genético, como el síndrome de Down, la hemofilia, la enfermedad de Huntington, la talasemia, entre otras. Aunado a esto, el entendimiento asociado al funcionamiento de las proteínas también amplió el conocimiento sobre enfermedades degenerativas como el Parkinson, el Alzheimer, el cáncer, el VIH, etc. Los estudios relacionados al plegamiento de proteínas y el comportamiento de los genes, utilizando métodos tradicionales podían tardar meses o incluso años, y ser bastante costosos. Sin embargo, con la inclusión de la ciencia de datos en, por ejemplo, tareas de clasificación, se han logrado avances a mediano costo. Por ejemplo, recientemente el método alpha fold se reconoció como un hito en la biomedicina, ya que combina técnicas de inteligencia artificial y medicina para identificar la estructura de las proteínas a partir de su secuencia de aminoácidos. Seguimiento y prevención de enfermedades ---- FALTA esta seccion Monitoreo de salud de los pacientes El análisis predictivo se convirtió en una tecnología relevante para extraer información útil de la avalancha de datos generados con aparatos de monitoreo. Además de servir para registrar el estado actual de salud del paciente, se utiliza para detectar posibles enfermedades o padecimientos futuros que deriven de su condición actual. De este modo, se combina el big data y el análisis predictivo en una solución analítica enfocada a la salud. Se proyecta que, eventualmente, con el desarrollo de la tecnología, el monitoreo de pacientes incorporará más sensores que detecten, registren y almacenen datos relevantes. Algunos avances encaminados al uso de esta tecnología pueden observarse en protésicos inteligentes, implantes con biosensores, sensores que se pueden vestir rutinariamente o materiales avanzados que se emplean en la industria médica, como prótesis para débiles visuales que detectan objetos en tiempo real, marcapasos con sensores compatibles con el organismo, etc. Estos avances, proporcionarán indicadores en tiempo real de los pacientes y los sistemas de salud, mejorando la calidad del servicio y agilizando la respuesta oportuna en caso de signos de enfermedad.

Se requiere una inversión financiera significativa para el desarrollo de sensores y otras tecnologías compatibles con la ciencia de datos. En 2018, el éxito obtenido a través de herramientas de análisis predictivo aplicado a la explosión masiva de información estructurada y no estructurada atrajo una inversión de $566.3 millones de dólares en la industria de la analítica de datos en Estados Unidos para el cuidado de la salud. Esto se debió al alcance de las soluciones que se obtuvieron por medio del procesamiento de datos. El uso de herramientas analíticas facilitará el cambio en la forma de tomar de decisiones sobre los pacientes, pasando de utilizar grandes volúmenes de información sin conexión aparente hacia la toma de decisiones justificada en el valor agregado de la información que se obtiene con ayuda del procesamiento de datos. Robots de alta precisión para cirugía (Computed Assisted Surgery, CAS) La cirugía asistida por computadora es un campo interdisciplinario de la medicina que actualmente está en pleno desarrollo y se considera que puede cambiar de manera positiva las técnicas de cirugía invasiva. Tradicionalmente, las decisiones médicas se fundamentan en el conocimiento y experiencia individual del cirujano; sin embargo, el desarrollo de imágenes médicas trajo nuevas oportunidades para el diagnóstico preciso de padecimientos, ya que sirve como evidencia contundente que justifica los juicios que se emiten sobre un diagnóstico. Estas imágenes médicas son ricas en información, pero son conjuntos de datos no estructurados que la mayor parte de las veces se inspeccionan visualmente sin integrarse directamente al flujo de trabajo de planeación quirúrgica. La ciencia de datos quirúrgica promete extraer información de estas entradas de datos y utilizar medidas y criterios objetivos para relacionar los tratamientos con las decisiones médicas. Las decisiones asistidas por datos (data-driven decisions) requieren un entrenamiento específico y profundo de casos que deben ser recolectados, estudiados y procesados para entrenar un sistema más robusto de información a partir del cual se evalúen los posibles cursos de la enfermedad y reduciendo significativamente el costo que conlleva someter al paciente a un tratamiento quirúrgico invasivo. No obstante, llegar a ese nivel de desarrollo requiere de una estructura administrativa que regule la adquisición de información y privacidad de los pacientes. Es claro que la ciencia de datos quirúrgica requiere profundos conocimientos de estadística, cómputo y medicina. Es un panorama que parece retador y son muchos los que confían en que podrá convertirse en una nueva especialidad interdisciplinaria que aporte nuevas herramientas a los tratamientos que se implementan en antes, durante y posterior a una cirugía. En nutrición, tenemos aplicaciones en Investigación nutricional Data-driven diets -Dietas basadas en datos, y dietas personalizadas Impactos públicos y privados Food as medicine approach Medidas antropométricas Biomarcadores Nutrigenomica Pruebas de salud intestinal Recientemente, se está incorporando la tecnología guiada por datos (data-driven technologies) para implementar mejoras en pequeña y gran escala en temas de nutrición y salud. Por ejemplo, a pequeña escala existen aplicaciones móviles de salud que facilitan la medición empírica de

indicadores de actividad física y salud. También existen aplicaciones dirigidas a proponer y cuantificar la ingesta alimenticia, regulando las porciones, frecuencia y tipos de alimentos que se recomienda al usuario con base en una serie de datos que el mismo usuario proporciona, aunque es difícil poder conocer de forma objetiva la efectividad de estas aplicaciones y si las dietas personalizadas por medio de la aplicación satisfacen las necesidades del usuario. (https://www.research.ibm.com/haifa/projects/imt/wdie/index.html) Otras aplicaciones de ciencia de datos, quizá menos tecnológicas, pero con gran impacto social, se enfocan en el estudio de problemas sociales. Algunos tan añejos como la desnutrición infantil y el periodo de maternidad. Actualmente, se sabe que hasta 800 mil infantes fallecen cada año debido al bajo peso alcanzado durante la gestación o la infancia. Así, existe el proyecto Nutrition for Growth (N4G), comprometido con la erradicación de la desnutrición. Está orientado a proponer políticas públicas basadas en datos demográficos para facilitar a los gobiernos locales la implementación de programas de salud que disminuyan la población en riesgo de desnutrición y para que las personas que la padecen puedan alcanzar su máximo potencial. Dentro de las acciones emprendidas, se incluye la encuesta para recolección de datos acerca de la dieta en edad maternal. Estos datos se emplean para monitorear el consumo alimenticio durante el periodo de maternidad y la infancia de diferentes poblaciones expuestas a diferentes escenarios de malnutrición, especialmente en localidades vulnerables como Mozambique, Nigeria y Madagascar. Con los resultados obtenidos, se pretende exponer al sistema de salud pública local las necesidades de la población y facilitar que se establezcan programas de salud que protejan a estos grupos de población en riesgo. Aquí concluimos nuestra breve revisión literaria sobre la ciencia de datos con aplicaciones en ciencias de la salud. Hay muchas vertientes de estudio quedaron fuera de esta revisión, ya que el panorama de avances y aplicaciones es cada vez más amplio y se desarrolla rápidamente. Aunado a esto, es evidente que en un futuro próximo será muy necesario que los profesionales de la salud adopten el manejo de tecnologías que optimicen las cargas de trabajo y mejoren los procedimientos, con el objetivo de mejorar la calidad de vida de los pacientes, optimizar tiempos y costos de servicio y facilitar el trabajo de las personas que se desempeñan en ese ramo. Esperamos que la comunidad interesada en la sostenibilidad global recoja estos conceptos y los impulse hacia las mejores aplicaciones posibles. Referencias Baro Emile, Degoul Samuel , Beuscart Régis , Chazard Emmanuel. (2015). “Toward a Literature-Driven Definition of Big Data in Healthcare”, BioMed Research International, vol. 2015, Article ID 639021, 9 pages. https://doi.org/10.1155/2015/639021 Di Camillo B., Nicosia G., Buffa F. and Lo B. (2020). “Guest Editorial Data Science in Smart Healthcare: Challenges and Opportunities,” in IEEE Journal of Biomedical and Health Informatics, vol. 24, no. 11, pp. 3041-3043, doi: 10.1109/JBHI.2020.3028398. Mallows, Colin. (2006). “Tukey's Paper After 40 Years”. Technometrics. 48. 319-325. https://doi.org/10.1198/004017006000000219 Tukey J. W. and Wilk M. B. (1966). Data analysis and statistics: an expository overview. In Proceedings of the November 7-10, 1966, fall joint computer conference (AFIPS '66 (Fall)). Association for Computing Machinery, New York, NY, USA, 695–709. DOI:https://doi.org/10.1145/1464291.1464366

Swan Melanie (2013).”The Quantified Self: Fundamental Disruption in Big Data Science and Biological Discovery” Big Data. Jun 2013.85-99.http://doi.org/10.1089/big.2012.0002 Published in Volume: 1 Issue 2: June 18, 2013 Turck Matt. (2020). “Resilience and Vibrancy: The 2020 Data & AI Landscape”. Recuperado de: https://mattturck.com/data2020/ Duncan J. S. y Ayache N. (2000). “Medical image analysis: progress over two decades and the challenges ahead,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 22, no. 1, pp. 85-106, doi: 10.1109/34.824822. Shen Dinggang, Wu Guorong y Suk Heung-Il. (2017). “Deep Learning in Medical Image Analysis” Annual Review of Biomedical Engineering Vol. 19:221-248 (Volume publication date June 2017) https://doi.org/10.1146/annurev-bioeng-071516-044442 McInerney Tim, Terzopoulos Demetri. (1996). “Deformable models in medical image analysis: a survey” Medical Image Analysis, Volumen 1, 1996,https://doi.org/10.1016/S1361-8415(96)80007-7 De Bruijne Marleen. (2016). “Machine learning approaches in medical image analysis: From detection to diagnosis” Medical Image Analysis, Volume 33, 2016, https://doi.org/10.1016/j.media.2016.06.032 Pham Dzung L., Xu Chenyang y Prince Jerry L. . (2000) “Current Methods in Medical Image Segmentation”. Vol. 2:315-337 (Volume publication date August 2000) https://doi.org/10.1146/annurev.bioeng.2.1.315 Anwar, S.M., Majid, M., Qayyum, A. et al. (2018). ”Medical Image Analysis using Convolutional Neural Networks: A Review.” J Med Syst 42, 226. https://doi.org/10.1007/s10916-018-1088-1 Scholl, I., Aach, T., Deserno, T.M. et al. (2011). “Challenges of medical image processing.” Comput Sci Res Dev 26, 5–13 (2011). https://doi.org/10.1007/s00450-010-0146-9 Saldívar-González Fernanda, Prieto-Martínez Fernando D., Medina-Franco José L. (2017). “Drug discovery and development: A computational approach”. Educ. quím vol.28 no.1 Ciudad de México ene. 2017 https://doi.org/10.1016/j.eq.2016.06.002 Departamento de inmunización, vacunas y biológicos de la Organización Mundial de la Salud. (2006).” State of the art of new vaccine research and development”. Immunization, vaccines and biologicals. Orden de pedimento: WHO/IBV/06.01 Ferrero, E., Brachat, S., Jenkins, J. L., Marc, P., Skewes-Cox, P., Altshuler, R. C., Gubser Keller, C., Kauffmann, A., Sassaman, E. K., Laramie, J. M., Schoeberl, B., Borowsky, M. L., & Stiefl, N. (2020). Ten simple rules to power drug discovery with data science. PLoS computational biology, 16(8), e1008126. https://doi.org/10.1371/journal.pcbi.1008126

Workman P., Antolin A. y Al-Lazikani B. (2019). ”Transforming cancer drug discovery with Big Data and AI”. Taylor & Francis. https://doi.org/10.1080/17460441.2019.1637414 Chen H., Engkvist O., Wang Y., Olivecrona M., Blaschke T. (2018). “The rise of deep learning in drug discovery”, Drug Discovery Today, Volumen 23, Número 6, 2018, https://doi.org/10.1016/j.drudis.2018.01.039 Réda C., Kaufmann E., Delahaye-Duriez A. (2020). “Machine learning applications in drug development”, Computational and Structural Biotechnology Journal, Volumen 18, https://doi.org/10.1016/j.csbj.2019.12.006. Butte A., Ito S. (2012). “Translational Bioinformatics: Data-driven Drug Discovery and Development”. Clinical Pharmacology & Therapeutics Editorial. https://doi.org/10.1038/clpt.2012.55 Sheiner L. B., Steimer J.-L. (2000) “Pharmacokinetic/Pharmacodynamic Modeling in Drug Development”. Annual Review of Pharmacology and Toxicology. Vol. 40:67-95 https://doi.org/10.1146/annurev.pharmtox.40.1.67 Pastorino R., De Vito C., Migliara G., Glocker K., Binenbaum I., Ricciardi W., Boccia S. (2019) “Benefits and challenges of Big Data in healthcare: an overview of the European initiatives” European Journal of Public Health, Volumen 29, Número 3, October 2019, https://doi.org/10.1093/eurpub/ckz168 Leung, C. K. (2021). Data Science for Big Data Applications and Services: Data Lake Management, Data Analytics and Visualization. Advances in Intelligent Systems and Computing, 899 AISC. https://doi.org/10.1007/978-981-15-8731-3_3 Vayena E, Salathé M, Madoff LC, Brownstein JS. (2015) “Ethical Challenges of Big Data in Public Health”. PLoS Comput Biol 11(2): e1003904. https://doi.org/10.1371/journal.pcbi.1003904 Manogaran G., Thota C., Lopez D., Vijayakumar V., Abbas K.M., Sundarsekar R. (2017) “Big Data Knowledge System in Healthcare”. En: Bhatt C., Dey N., Ashour A. (eds) Internet of Things and Big Data Technologies for Next Generation Healthcare. Studies in Big Data, vol 23. Springer, Cham. https://doi.org/10.1007/978-3-319-49736-5_7 Alloghani, Mohamed & Aljaaf, Ahmed & Al-Jumeily Obe, Dhiya & Hussain, Abir & Mallucci, Conor & Mustafina, Jamila. (2018). Data Science to Improve Patient Management System. 27-30. 10.1109/DeSE.2018.00012. Abinaya, Vinoth y Kumar, Swathika, (2015) “Ontology Based Public Healthcare System in Internet of Things (IoT)” ,Procedia Computer Science, Volumen 50, https://doi.org/10.1016/j.procs.2015.04.067. Latif S., Usman M., Manzoor S., Iqbal W., Qadir J., Tyson G., Castro I., Razi A., Kamel-Boulos M. y Crowcroft, J. (2020). Preprint: Leveraging Data Science To Combat COVID-19: A Comprehensive Review. https://doi.org/10.13140/RG.2.2.12685.28644/4 Kose U., Gupta D., De Albuquerque V., Khanna A. (2021) “Data Science for COVID-19 Volume 1” Academic Press Computational Perspectives

Saxena N., Gupta P., Raman R. y Rathore A.S. (2020) “Role of data science in managing COVID-19 pandemic”. Páginas 385-395. https://doi.org/10.1080/00194506.2020.1855085 Gitanjali Rahul Shinde, Asmita Balasaheb Kalamkar, Parikshit N. Mahalle, Nilanjan Dey (2020) “Data Analytics for Pandemics A COVID-19 Case Study” CRC Press Rainey-Marquez J., (2021) “The COVID-19 Data Plan: 3 Innovative Ways Johnson & Johnson Is Using Data Science to Fight the Pandemic” Johnson & Johnson. Recuperado de: https://www.jnj.com/innovation/how-johnson-johnson-uses-data-science-to-fight-covid-19-pandemic