sistemas híbridos centrados en la lógica difusa para el diagnóstico de la enfermedad coronaria
DESCRIPTION
Los sistemas híbridos basados en la lógica difusa representan una forma de solucionar las dificultades de aprendizaje y adaptabilidad de la lógica difusa mientras se preserva la participación de los expertos y la capacidad de explicar. En el presente artículo presentan tres publicaciones que sirven para ejemplificar el aporte de la combinación de estrategias en la solución del problema diagnóstico que representa el infarto agudo del miocardio.TRANSCRIPT
1
Sistemas Híbridos centrados en la Lógica Difusa
para el Diagnóstico de la enfermedad Coronaria
John Sprockel
Maestría de Ingeniería de Sistemas y Computación, Universidad Javeriana
Resumen. Los sistemas híbridos basados en la lógica difusa representan una forma de solucionar las dificultades
de aprendizaje y adaptabilidad de la lógica difusa mientras se preserva la participación de los expertos y la
capacidad de explicar. En el presente artículo presentan tres publicaciones que sirven para ejemplificar el aporte
de la combinación de estrategias en la solución del problema diagnóstico que representa el infarto agudo del
miocardio.
Palabras Clave: inteligencia artificial, lógica difusa, sistemas fuzzy evolutivos, modelos neuro-fuzzy,
aprendizaje fuzzy, enfermedad coronaria.
1 Introducción
La lógica difusa fue propuesta por Lotfi A. Zadeh en 19651 como una extensión de uno de los conceptos
subyacentes fundamentales de la Lógica Clásica proposicional: la dicotomización [1]. La creación de reglas difusas
presentan dos ventajas frente a las reglas nítidas (crisp) [2]: a) contienen información adicional y b) pueden definir
más fácilmente las fronteras de decisión en un eje no paralelo. La lógica difusa puede ser vista como una teoría para
manejar la incertidumbre de los sistemas complejos.
En la tabla 1 podemos identificar los principales puntos fuertes y falencias de cada una de las herramientas de la
inteligencia artificial. Los sistemas híbridos buscan, complementar sus características en pos de optimizar algún
aspecto de su desempeño.
--: malo, -: más bien mal, +: más bien bueno, ++: bueno
SBR: Sistemas Basados en Reglas, LD: Sistemas Difusos, ANN: Redes Neuronales y AG: Algoritmos Genéticos
*Modificado de Negnevitsky [1].
1. L.A. Zadeh. Fuzzy Sets, Information and Control, 8:338–353. 1965.
SBR LD ANN AG
Representación del conocimiento + ++ --
Tolerancia a la incertidumbre + ++ ++ ++
Tolerancia a la imprecisión -- ++ ++ ++
Adaptabilidad -- - ++ ++
Habilidad de aprendizaje -- -- ++ ++
Habilidad de explicación ++ ++ -- -
Descubrimiento del conocimiento
y mineria de datos
--- ++ +
Mantenibilidad -- + ++ +
TABLA 1. Comparación entre: Sistemas Basados en Reglas, Sistemas Difusos,
Redes Neuronales y Algoritmos Genéticos
2
En el siguiente artículo se exponen tres modelos representativos de sistemas híbridos centrados en la lógica difusa,
orientados al diagnóstico de la enfermedad coronaria.
2 Presentación de un artículo de ejemplo de neuro-fuzzy
El artículo titulado “An adaptive fuzzy model for ECG interpretation”, escrito por Xue et al en 1998 [5], describe
cómo abordar el problema del diagnóstico del infarto y su localización, a partir de la medición de la amplitud del
segmento ST (infra o supradesnivel) en distintas derivaciones, observar la figura 2.
Figura 2. El punto M hace referencia al sitio donde se mide la amplitud del Segmento ST (localizada a un
dieciseisava parte del RR alejada del punto J).
Se usó una base de datos de dolor torácico de un estudio comunitario, con un registro de 1161 pacientes, de los
cuales 285 tenían infarto (123 anterior, 123 inferior y 50 lateral) y 322 tuvieron angina. El 70% fue usado para
entrenamiento y el 30% para pruebas.
Los modelos ANFIS (Adaptative Neuro-Fuzzy Inference System), constan de cinco capas [1], las funciones de cada
una de ellas pueden observarse en la figura 1.
Figura 1. Funciones de cada una de las capas en un modelo ANFIS.
3
Dentro de la metodología empleada, primero se generaron reglas por los expertos, a cada una de ellas se dividió en
tres grupos (bajo, alto y muy alto) y posteriormente se utilizó un modelo ANFIS para optimizar las funciones de
pertenencia de cada una de las variables de entrada. Sus características fueron: a) número de capas 4, b) uso de
Backpropagatión y LMS, c) ejemplos ya descritos, d) número de iteraciones: 100, e) Función de pertenencia en
campana, f) La regla de salida fue tipo Sugeno, con diez variables fijas entre 0 y 1, así que el consecuente se daba en
probabilidad.
Y sus resultados demostraron que se mejoraba la sensibilidad sin comprometer la especificidad en el diagnóstico del
infarto a partir del electrocardiograma.
Tabla 2. Resultados de cada modelo.
Concluye que las desventajas de las ANN es que les hace falta una base de conocimiento estructural y no utilizan el
conocimiento previo de los expertos. El sistema mixto preserva las ventajas de cada uno de los dos modelos
3 Presentación de un artículo de ejemplo de Fuzzy Genético
La publicación de Ainon et al de 2012 [6], titulada “AMI Screening Using Linguistic Fuzzy Rules”, hace uso de un
algoritmo genético multiobjetivo para disminuir la cantidad de variables de entrada y mejorar la precisión de un sistema experto
basado en lógica difusa. Se tomaron datos de 887 pacientes con dolor torácico en urgencias del hospital de Selayang en Malasia.
Se contaba con una base de datos con 48 variables de entrada y una salida.
Características de la solución:
Herramientas de Lógica Difusa:
a) Tipos de reglas: Mandani
b) Inicialización del sistema inicial: se generaron las regla mediante el método de Fuzzy C-means clustering.
c) Descripción de las reglas generadas:
Regla Rj: SI x1 es Aj1 y … y xn es Ajn ENTONCES y es Cj
j es el número de la regla difusa, Ajn es un conjunto difuso antecedente definido sobre la entrada xi, y Cj es
un conjunto difuso que representa al consecuente.
d) Representación de los conjunto difusos: Función Gaussiana.
e) No indican cómo se efectúa la defuzicación.
f) Reemplazo de los conjunto difusos: por los valores lingüísticos bajo, promedio y alto. Se incluyó “no
importa”.
Algoritmo genético:
a) Representación de los individuos: Fase 1: los cromosomas estaban representados por una cadena binaria
con longitud igual al número de variables (0 ó 1 según si se tenía en cuenta o no). Fase 2:
SENSIBILIDAD ESPECIFICIDAD
50 99
Entrenamiento 60 99
Pruebas 54 99
38 98
Después de la adaptación
Antes de la adaptación
MODELO
Red Neuronal
4
Figura 3. Representación de un cromosoma de la segunda fase.
Con n como el número de variables de entrada, m el número de reglas difusas. Aji el antecedente lingüístico
para el atributo i. Y Cj el consecuente.
Por ejemplo: un cromosoma con tres entradas y dos reglas.
Figura 4. Ejemplo de un cromosoma de la segunda fase.
b) Función de Fitness: Fase 1: consiste en dos componentes, minimizar el número de entradas y maximizar la
precisión.
Donde es la precisión de la clasificación por el sistema experto y es el número de variables
de entrada.
Fase 2: también dos componentes, ambos de maximización, uno para la precisión (usan el área bajo la
curva ROC) y otro para la trasparencia, medido por el número de conjuntos difusos “no importa” en la base
de reglas.
c) Proceso del AG:
Generar población inicial
Generar desendencia
• Escoger los padres
• Aplicar operadores genéticos
Seleccionar las mejores soluciones
Verificar la condición de terminación o volver al paso 2.
5
Figura 5. Pasos de un AG.
Como resultado de éste proceso, se crean diez modelos, de los cuales, los dos mejores se comparan con una red
neuronal previamente elaborada. Se logra un mejoramiento de la precisión desde el 0.56 hasta un máximo de 0.75
de AUC, resultando en 79 el de la ANN.
En conclusión se logra una mejoría de la trasparencia a costa de una leve disminución de la precisión.
4 Presentación de un artículo de ejemplo de Aprendizaje Fuzzy Swarm
En el siguiente ejemplo, titulado “A hybrid particle swarm optimization based fuzzy expert system for the diagnosis
of coronary artery disease”, Muthukaruppan et al en el 2012 presentan un modelo en el que se utilizó la combinación
de un modelo de optimización de partículas de enjambre (particle swarm optimization o PSO) con un sistema
experto basado en reglas difusas.
Usaron una base de datos del Instituto Húngaro de Cardiología y de las Cleveland Clinic, compuesa de 597 datos
con 13 atributos clínicos, se realizó el entrenamiento con 478 (278 sanos y 200 con enfermedad coronaria), y las
pruebas con 119 (74 y 45). El desenlace fue angiográfico.
La metodología inicial consistió en utilizar un mecanismo para imputación de los datos perdidos en la base de datos,
llamado Heterogeneous Euclidean Overlap Metric (HEOP).
Herramienta de Aprendizaje Máquina:
Se diseñó un árbol de decisiones que se representa luego como un conjunto de reglas.
Se eligió el Índice de Diversidad de Gini como criterio de división al momento de la generación del árbol. La
medida del la impureza Gini i(t) en el nodo t se calculó de la siguiente forma:
S es el criterio de impureza
j es el número de clases existente en ese nodo y denota la frecuencia relativa de la clase j en el nodo t.
El índice Gini obtiene su máximo valor cuando todas las clases en el nodo ocurren con igual probabilidad y es
mínimo cuando contiene solo una clase.
El control de la complejidad del árbol se realizó mediante la técnica de reducción del error por poda (reduced error
pruning o REP). Consiste en examinar el cambio en el error de mal-clasificación sobre el conjunto de pruebas para
cada sub-árbol T sin nodos terminales en el árbol original. Dicho error aparece si el sub-árbol es reemplazado por la
clase más frecuente. Este proceso se continúa hasta que la poda comprometa la precisión.
Herramientas de Lógica Difusa:
a) Tipos de reglas: Mandani
b) Representación de los conjuntos difusos: Función Triangular.
c) La defuzicación se realizó mediante la técnica del centro de gravedad.
d) Reemplazo de los conjunto difusos: por los valores lingüísticos de manera diferencial para cada variable.
Particle Swarm Optimization:
Se continuó con un proceso PSO para la optimización de las funciones de pertenencia de las reglas. Éste es un
algoritmo evolutivo parecido al AG en el que se cambian los operadores genéticos (mutación y recombinación) por
poblaciones de partículas [3].
6
Figura 6. Pasos de un PSO
Cada una de las cuales tienen un vector de dirección y una velocidad, asociada con un fitness y la memoria de su
mejor posición (ver figura 3).
Figura 7. Anatomía de cada partícula (tomado de Jones [3]).
En éste caso cada partícula está representado por los parámetros de la figura 8 y en la tabla 3 se presentan sus rangos
y las ecuaciones. Los coeficientes de ajuste funcionan desplazando los rangos de la función de pertenencia sin
cambiar la forma (k) y otro que la disminuye o expande (w).
Figura 8. Parámetros de la función de pertenencia.
Generar población inicial de partículas
Generar el movimiento de las partículas
•Asociado con la memoria de la mejor ubicación.
Seleccionar las mejores soluciones una vez cumplido el criterio de terminación
7
A. B.
Tabla 3. A. Parámetros del PSO. B. Ecuaciones para el ajuste de las funciones de pertenencia. Siendo k y w los
coeficientes de ajuste.
En la figura 9 podemos observar un ejemplo del resultado de la optimización de los conjuntos difusos de
la variable pico de edad. Como resultado se obtuvo una precisión y una especificidad del 93.3% con una
sensibilidad del 93.2%. Al ser comparado con otros experimentos similares (con redes de creencia
Bayesianas, Bayes nativo, Neuro-fuzzy, ANFIS, entre otros), éste obtuvo el mejor rendimiento.
Figura 9. Ejemplo de la optimización de los conjuntos difusos con el PSO aplicado.
Concluye que Las principales ventajas de la FES como una herramienta de adquisición de conocimiento son los
siguientes: a) se obtiene un pequeño número de reglas y b) las reglas obtenidas pueden ser fácilmente interpretados.
Estos resultados implican áreas de investigación prometedoras que emplean árboles de decisión y el sistema experto
difuso en varios problemas de clasificación.
5. CONCLUSIONES
La inteligencia artificial intenta emular la inteligencia humana: SBR por reglas e inferencia lógica, ANN por
procesamiento paralelo de datos. Mientras los SBR no pueden aprender si logran explicar su razonamiento, las ANN
operan de manera contraria. La interacción de herramientas logra mejorar el desempeño de estos aspectos. Los
sistemas híbridos combinan al menos dos tecnologías inteligentes. Estos sistemas favorecen el razonamiento y
aprendizaje en ambientes inciertos o imprecisos.
Los sistemas híbridos fuzzy se pueden estar orientados a la disminución de las variables de entrada, encontrar las
reglas a partir de un conjunto de ejemplos (aprendizaje), disminuir el número de reglas o para optimizar los
conjuntos difusos como se demuestra en los ejemplos.
8
Referencias
[1] Negnevitsky, M. (2005). Hybrid intelligent systems. In Artificial intelligence: a guide to intelligent systems (Second.,
pp. 259 – 298). Tazmania, Australia: Pearson Education Limited.
[2] Muthukaruppan, S., & Er, M. J. (2012). A hybrid particle swarm optimization based fuzzy expert system for the
diagnosis of coronary artery disease. Expert Systems with Applications, 39(14), 11657–11665.
doi:10.1016/j.eswa.2012.04.036
[3] Jones MT. Artificial Intelligence: A Systems Approach, INFINITY SCIENCE PRESS LLC, 2008
[4] Dourado, A., Henriques, J., & Carvalho, P. de. (2008). Neural, Fuzzy, and Neurofuzzy Systems for Medical
Applications. In Intelligent and adaptive systems in medicine (pp. 127 – 171). London, UK: Taylor & Francis Group.
[5] Xue, Q., Taha, B., Reddy, S., & Aufderheide, T. (1998). An adaptive fuzzy model for ECG interpretation (Vol. 20, No.
1, pp. 131–134). Presented at the Proceedings of the 20th Annual International Conference of the ZEEE Engineering in
Medicine and Biology Society, IEEE. doi:10.1109/IEMBS.1998.745847
[6] Ainon, R. N., Bulgiba, A. M., & Lahsasna, A. (2010). AMI Screening Using Linguistic Fuzzy Rules. Journal of
Medical Systems, 36(2), 463–473. doi:10.1007/s10916-010-9491-2