sistemas híbridos centrados en la lógica difusa para el diagnóstico de la enfermedad coronaria

1

Sistemas Híbridos centrados en la Lógica Difusa

para el Diagnóstico de la enfermedad Coronaria

John Sprockel

Maestría de Ingeniería de Sistemas y Computación, Universidad Javeriana

[email protected]

Resumen. Los sistemas híbridos basados en la lógica difusa representan una forma de solucionar las dificultades

de aprendizaje y adaptabilidad de la lógica difusa mientras se preserva la participación de los expertos y la

capacidad de explicar. En el presente artículo presentan tres publicaciones que sirven para ejemplificar el aporte

de la combinación de estrategias en la solución del problema diagnóstico que representa el infarto agudo del

miocardio.

Palabras Clave: inteligencia artificial, lógica difusa, sistemas fuzzy evolutivos, modelos neuro-fuzzy,

aprendizaje fuzzy, enfermedad coronaria.

1 Introducción

La lógica difusa fue propuesta por Lotfi A. Zadeh en 19651 como una extensión de uno de los conceptos

subyacentes fundamentales de la Lógica Clásica proposicional: la dicotomización [1]. La creación de reglas difusas

presentan dos ventajas frente a las reglas nítidas (crisp) [2]: a) contienen información adicional y b) pueden definir

más fácilmente las fronteras de decisión en un eje no paralelo. La lógica difusa puede ser vista como una teoría para

manejar la incertidumbre de los sistemas complejos.

En la tabla 1 podemos identificar los principales puntos fuertes y falencias de cada una de las herramientas de la

inteligencia artificial. Los sistemas híbridos buscan, complementar sus características en pos de optimizar algún

aspecto de su desempeño.

--: malo, -: más bien mal, +: más bien bueno, ++: bueno

SBR: Sistemas Basados en Reglas, LD: Sistemas Difusos, ANN: Redes Neuronales y AG: Algoritmos Genéticos

*Modificado de Negnevitsky [1].

1. L.A. Zadeh. Fuzzy Sets, Information and Control, 8:338–353. 1965.

SBR LD ANN AG

Representación del conocimiento + ++ --

Tolerancia a la incertidumbre + ++ ++ ++

Tolerancia a la imprecisión -- ++ ++ ++

Adaptabilidad -- - ++ ++

Habilidad de aprendizaje -- -- ++ ++

Habilidad de explicación ++ ++ -- -

Descubrimiento del conocimiento

y mineria de datos

--- ++ +

Mantenibilidad -- + ++ +

TABLA 1. Comparación entre: Sistemas Basados en Reglas, Sistemas Difusos,

Redes Neuronales y Algoritmos Genéticos

2

En el siguiente artículo se exponen tres modelos representativos de sistemas híbridos centrados en la lógica difusa,

orientados al diagnóstico de la enfermedad coronaria.

2 Presentación de un artículo de ejemplo de neuro-fuzzy

El artículo titulado “An adaptive fuzzy model for ECG interpretation”, escrito por Xue et al en 1998 [5], describe

cómo abordar el problema del diagnóstico del infarto y su localización, a partir de la medición de la amplitud del

segmento ST (infra o supradesnivel) en distintas derivaciones, observar la figura 2.

Figura 2. El punto M hace referencia al sitio donde se mide la amplitud del Segmento ST (localizada a un

dieciseisava parte del RR alejada del punto J).

Se usó una base de datos de dolor torácico de un estudio comunitario, con un registro de 1161 pacientes, de los

cuales 285 tenían infarto (123 anterior, 123 inferior y 50 lateral) y 322 tuvieron angina. El 70% fue usado para

entrenamiento y el 30% para pruebas.

Los modelos ANFIS (Adaptative Neuro-Fuzzy Inference System), constan de cinco capas [1], las funciones de cada

una de ellas pueden observarse en la figura 1.

Figura 1. Funciones de cada una de las capas en un modelo ANFIS.

3

Dentro de la metodología empleada, primero se generaron reglas por los expertos, a cada una de ellas se dividió en

tres grupos (bajo, alto y muy alto) y posteriormente se utilizó un modelo ANFIS para optimizar las funciones de

pertenencia de cada una de las variables de entrada. Sus características fueron: a) número de capas 4, b) uso de

Backpropagatión y LMS, c) ejemplos ya descritos, d) número de iteraciones: 100, e) Función de pertenencia en

campana, f) La regla de salida fue tipo Sugeno, con diez variables fijas entre 0 y 1, así que el consecuente se daba en

probabilidad.

Y sus resultados demostraron que se mejoraba la sensibilidad sin comprometer la especificidad en el diagnóstico del

infarto a partir del electrocardiograma.

Tabla 2. Resultados de cada modelo.

Concluye que las desventajas de las ANN es que les hace falta una base de conocimiento estructural y no utilizan el

conocimiento previo de los expertos. El sistema mixto preserva las ventajas de cada uno de los dos modelos

3 Presentación de un artículo de ejemplo de Fuzzy Genético

La publicación de Ainon et al de 2012 [6], titulada “AMI Screening Using Linguistic Fuzzy Rules”, hace uso de un

algoritmo genético multiobjetivo para disminuir la cantidad de variables de entrada y mejorar la precisión de un sistema experto

basado en lógica difusa. Se tomaron datos de 887 pacientes con dolor torácico en urgencias del hospital de Selayang en Malasia.

Se contaba con una base de datos con 48 variables de entrada y una salida.

Características de la solución:

Herramientas de Lógica Difusa:

a) Tipos de reglas: Mandani

b) Inicialización del sistema inicial: se generaron las regla mediante el método de Fuzzy C-means clustering.

c) Descripción de las reglas generadas:

Regla Rj: SI x1 es Aj1 y … y xn es Ajn ENTONCES y es Cj

j es el número de la regla difusa, Ajn es un conjunto difuso antecedente definido sobre la entrada xi, y Cj es

un conjunto difuso que representa al consecuente.

d) Representación de los conjunto difusos: Función Gaussiana.

e) No indican cómo se efectúa la defuzicación.

f) Reemplazo de los conjunto difusos: por los valores lingüísticos bajo, promedio y alto. Se incluyó “no

importa”.

Algoritmo genético:

a) Representación de los individuos: Fase 1: los cromosomas estaban representados por una cadena binaria

con longitud igual al número de variables (0 ó 1 según si se tenía en cuenta o no). Fase 2:

SENSIBILIDAD ESPECIFICIDAD

50 99

Entrenamiento 60 99

Pruebas 54 99

38 98

Después de la adaptación

Antes de la adaptación

MODELO

Red Neuronal

4

Figura 3. Representación de un cromosoma de la segunda fase.

Con n como el número de variables de entrada, m el número de reglas difusas. Aji el antecedente lingüístico

para el atributo i. Y Cj el consecuente.

Por ejemplo: un cromosoma con tres entradas y dos reglas.

Figura 4. Ejemplo de un cromosoma de la segunda fase.

b) Función de Fitness: Fase 1: consiste en dos componentes, minimizar el número de entradas y maximizar la

precisión.

Donde es la precisión de la clasificación por el sistema experto y es el número de variables

de entrada.

Fase 2: también dos componentes, ambos de maximización, uno para la precisión (usan el área bajo la

curva ROC) y otro para la trasparencia, medido por el número de conjuntos difusos “no importa” en la base

de reglas.

c) Proceso del AG:

Generar población inicial

Generar desendencia

• Escoger los padres

• Aplicar operadores genéticos

Seleccionar las mejores soluciones

Verificar la condición de terminación o volver al paso 2.

5

Figura 5. Pasos de un AG.

Como resultado de éste proceso, se crean diez modelos, de los cuales, los dos mejores se comparan con una red

neuronal previamente elaborada. Se logra un mejoramiento de la precisión desde el 0.56 hasta un máximo de 0.75

de AUC, resultando en 79 el de la ANN.

En conclusión se logra una mejoría de la trasparencia a costa de una leve disminución de la precisión.

4 Presentación de un artículo de ejemplo de Aprendizaje Fuzzy Swarm

En el siguiente ejemplo, titulado “A hybrid particle swarm optimization based fuzzy expert system for the diagnosis

of coronary artery disease”, Muthukaruppan et al en el 2012 presentan un modelo en el que se utilizó la combinación

de un modelo de optimización de partículas de enjambre (particle swarm optimization o PSO) con un sistema

experto basado en reglas difusas.

Usaron una base de datos del Instituto Húngaro de Cardiología y de las Cleveland Clinic, compuesa de 597 datos

con 13 atributos clínicos, se realizó el entrenamiento con 478 (278 sanos y 200 con enfermedad coronaria), y las

pruebas con 119 (74 y 45). El desenlace fue angiográfico.

La metodología inicial consistió en utilizar un mecanismo para imputación de los datos perdidos en la base de datos,

llamado Heterogeneous Euclidean Overlap Metric (HEOP).

Herramienta de Aprendizaje Máquina:

Se diseñó un árbol de decisiones que se representa luego como un conjunto de reglas.

Se eligió el Índice de Diversidad de Gini como criterio de división al momento de la generación del árbol. La

medida del la impureza Gini i(t) en el nodo t se calculó de la siguiente forma:

S es el criterio de impureza

j es el número de clases existente en ese nodo y denota la frecuencia relativa de la clase j en el nodo t.

El índice Gini obtiene su máximo valor cuando todas las clases en el nodo ocurren con igual probabilidad y es

mínimo cuando contiene solo una clase.

El control de la complejidad del árbol se realizó mediante la técnica de reducción del error por poda (reduced error

pruning o REP). Consiste en examinar el cambio en el error de mal-clasificación sobre el conjunto de pruebas para

cada sub-árbol T sin nodos terminales en el árbol original. Dicho error aparece si el sub-árbol es reemplazado por la

clase más frecuente. Este proceso se continúa hasta que la poda comprometa la precisión.

Herramientas de Lógica Difusa:

a) Tipos de reglas: Mandani

b) Representación de los conjuntos difusos: Función Triangular.

c) La defuzicación se realizó mediante la técnica del centro de gravedad.

d) Reemplazo de los conjunto difusos: por los valores lingüísticos de manera diferencial para cada variable.

Particle Swarm Optimization:

Se continuó con un proceso PSO para la optimización de las funciones de pertenencia de las reglas. Éste es un

algoritmo evolutivo parecido al AG en el que se cambian los operadores genéticos (mutación y recombinación) por

poblaciones de partículas [3].

6

Figura 6. Pasos de un PSO

Cada una de las cuales tienen un vector de dirección y una velocidad, asociada con un fitness y la memoria de su

mejor posición (ver figura 3).

Figura 7. Anatomía de cada partícula (tomado de Jones [3]).

En éste caso cada partícula está representado por los parámetros de la figura 8 y en la tabla 3 se presentan sus rangos

y las ecuaciones. Los coeficientes de ajuste funcionan desplazando los rangos de la función de pertenencia sin

cambiar la forma (k) y otro que la disminuye o expande (w).

Figura 8. Parámetros de la función de pertenencia.

Generar población inicial de partículas

Generar el movimiento de las partículas

•Asociado con la memoria de la mejor ubicación.

Seleccionar las mejores soluciones una vez cumplido el criterio de terminación

7

A. B.

Tabla 3. A. Parámetros del PSO. B. Ecuaciones para el ajuste de las funciones de pertenencia. Siendo k y w los

coeficientes de ajuste.

En la figura 9 podemos observar un ejemplo del resultado de la optimización de los conjuntos difusos de

la variable pico de edad. Como resultado se obtuvo una precisión y una especificidad del 93.3% con una

sensibilidad del 93.2%. Al ser comparado con otros experimentos similares (con redes de creencia

Bayesianas, Bayes nativo, Neuro-fuzzy, ANFIS, entre otros), éste obtuvo el mejor rendimiento.

Figura 9. Ejemplo de la optimización de los conjuntos difusos con el PSO aplicado.

Concluye que Las principales ventajas de la FES como una herramienta de adquisición de conocimiento son los

siguientes: a) se obtiene un pequeño número de reglas y b) las reglas obtenidas pueden ser fácilmente interpretados.

Estos resultados implican áreas de investigación prometedoras que emplean árboles de decisión y el sistema experto

difuso en varios problemas de clasificación.

5. CONCLUSIONES

La inteligencia artificial intenta emular la inteligencia humana: SBR por reglas e inferencia lógica, ANN por

procesamiento paralelo de datos. Mientras los SBR no pueden aprender si logran explicar su razonamiento, las ANN

operan de manera contraria. La interacción de herramientas logra mejorar el desempeño de estos aspectos. Los

sistemas híbridos combinan al menos dos tecnologías inteligentes. Estos sistemas favorecen el razonamiento y

aprendizaje en ambientes inciertos o imprecisos.

Los sistemas híbridos fuzzy se pueden estar orientados a la disminución de las variables de entrada, encontrar las

reglas a partir de un conjunto de ejemplos (aprendizaje), disminuir el número de reglas o para optimizar los

conjuntos difusos como se demuestra en los ejemplos.

8

Referencias

[1] Negnevitsky, M. (2005). Hybrid intelligent systems. In Artificial intelligence: a guide to intelligent systems (Second.,

pp. 259 – 298). Tazmania, Australia: Pearson Education Limited.

[2] Muthukaruppan, S., & Er, M. J. (2012). A hybrid particle swarm optimization based fuzzy expert system for the

diagnosis of coronary artery disease. Expert Systems with Applications, 39(14), 11657–11665.

doi:10.1016/j.eswa.2012.04.036

[3] Jones MT. Artificial Intelligence: A Systems Approach, INFINITY SCIENCE PRESS LLC, 2008

[4] Dourado, A., Henriques, J., & Carvalho, P. de. (2008). Neural, Fuzzy, and Neurofuzzy Systems for Medical

Applications. In Intelligent and adaptive systems in medicine (pp. 127 – 171). London, UK: Taylor & Francis Group.

[5] Xue, Q., Taha, B., Reddy, S., & Aufderheide, T. (1998). An adaptive fuzzy model for ECG interpretation (Vol. 20, No.

1, pp. 131–134). Presented at the Proceedings of the 20th Annual International Conference of the ZEEE Engineering in

Medicine and Biology Society, IEEE. doi:10.1109/IEMBS.1998.745847

[6] Ainon, R. N., Bulgiba, A. M., & Lahsasna, A. (2010). AMI Screening Using Linguistic Fuzzy Rules. Journal of

Medical Systems, 36(2), 463–473. doi:10.1007/s10916-010-9491-2

sistemas híbridos centrados en la lógica difusa para el diagnóstico de la enfermedad coronaria

Technology