Download - Desafíos en bases de datos difusas
DESAFÍOS EN BASES DE DATOS DIFUSAS
surgió hace 50+ años
Zadeh, L. A. (1965). “Fuzzy Sets”
Information Control, Vol. 8, pp. 338-353
La teoría de conjuntos difusos
2
La teoría de conjuntos difusos
permite dar un tratamiento matemático-computacional a conceptos vagos del lenguaje natural
𝜇𝐹: 𝑋 → 0,1
0,000,250,500,751,00
x1 x2 x3 x4 x5
0,000,250,500,751,00
x1 x2 x3 x4
3
Conjuntos difusos en bases de datos
30+ años como tema de interés
Datos DifusosBuckles, B., Petry, F. (1982). “A Fuzzy Representation of Data for
Relational Databases”, Fuzzy Sets and Systems
Consultas DifusasBosc, P., Galibourg, M., Hamon, G. (1988). “Fuzzy Querying with SQL:
Extensions and Implementation Aspects”, Fuzzy Sets and Systems
4
Conjuntos difusos en bases de datos
30+ años, mas no ha sido completamente explorado
No se ha incluido en el más reciente estándar
ISO/IEC (2011) Information technology — Database languages— SQL — Part 2: Foundation (SQL/Foundation), ISO/IEC 9075-
2:2011 (en)
5
Conjuntos difusos en bases de datos
30+ años, mas no ha sido completamente explorado
No se han resuelto interrogantes en el más reciente libro
Pivert, O. & Bosc, P. (2012) Fuzzy Preference Queries to Relational Databases, Imperial College Press
6
Conjuntos difusos en bases de datos
30+ años, mas no ha sido completamente explorado
No se ha aplicado el más reciente principio
Zadeh, L. A. (2015) “The Information Principle”, Information Sciences
7
Conjuntos difusos en bases de datos
30+ años, mas no ha sido completamente explorado
No se ha llevado a la más reciente tendencia: Big Data
Abadi, D. et al. (2016) “The Beckman Report on Database Research”, Communications of the ACM
8
Conjuntos difusos en bases de datos
Los SGBD actuales siguen adoleciendo de rigidez en la representación de datos imperfectos y consultas basadas en preferencias del usuario y el contexto
9
Modelo Relacional Difuso
20+ años se propuso GEFREDpermite representar relaciones difusas y atributos difusos
𝑅 𝑎1, 𝑎2, … , 𝑎𝑛 = Τ𝑡𝑖 𝜇𝑖
𝜇𝑖 = 𝜇𝑅 𝑡𝑖𝑡𝑖 = 𝑑𝑖,1, 𝑑𝑖,2, … , 𝑑𝑖,𝑛
𝑑𝑖,𝑗𝜖𝐹𝑑𝑜𝑚 𝑎𝑗
Medina, J. et al (1993). “GEFRED: A Generalized Model of Fuzzy Relational Databases”, Information Sciences
10
Modelo Relacional Difuso
Basado en GEFRED se han definido extensiones a SQL y se han implementado prototipos de DBMS
Galindo, J. (2005). “New Characteristics in FSQL, a Fuzzy SQL for Fuzzy Databases”. WSEAS Transactions on Information Science
and Applications
Galindo, J. (Ed.) (2008), Handbook of Research on Fuzzy Information Processing in Databases. Hershey, PA, USA
11
Atributos Difusos
Se distinguen cuatro tipos de FdomTipo 1, Tipo 2, Tipo 3, Tipo 4
Galindo, J., Urrutia, A., Piattini, M. (2006). Fuzzy DatabaseModeling, Design and Implementation, Idea Group
Publishing
12
Atributos Difusos
Se separa en dos* uno de los tipos de FdomTipo 1, Tipo 2, Tipo 3*, Tipo 4, , Tipo 5*
Coronado, D. et al (2015) "Portal de fuzzydoDB". Memorias de la Tercera Conferencia Nacional de
Computación, Informática y Sistemas, Valencia, Venezuela
13
Atributos Difusos
Tipo 1
atributos con valores de datos precisos que se pueden consultar usando términos lingüísticos vagos (difusos)
14
0,000,250,500,751,00
x1 x2 x3 x4 x5
0,000,250,500,751,00
x1 x2 x3 x4
término difuso término difuso
Atributos Difusos
Tipo 2
atributos numéricos cuyos valores son datos difusosrepresentados como números difusos
15
0,000,250,500,751,00
x1 x2 x3 x4 x5
0,000,250,500,751,00
x1 x2 x3 x4
valor difuso valor difuso
Atributos Difusos
Tipo 3
atributos cuyos valores son etiquetas de un conjunto provisto de una relación difusa de similitud
16
x1 x2 x3 x4
x1 1.00 0.25 1.00 0.75
x2 0.25 1.00 0.25 0.50
x3 1.00 0.25 1.00 0.75
x4 0.75 0.50 0.75 1.00
relación de similitud
Atributos Difusos
Tipo 4
cuyos valores son distribuciones de posibilidad sobre
conjunto de etiquetas
17
0,000,250,500,751,00
x1 x2 x3 x4 x5
valor posibilístico
Atributos Difusos
Tipo 5
cuyos valores son distribuciones de posibilidad sobre
conjunto de etiquetas con una relación de similitud
18
x1 x2 x3 x4
x1 1.00 0.25 1.00 0.75
x2 0.25 1.00 0.25 0.50
x3 1.00 0.25 1.00 0.75
x4 0.75 0.50 0.75 1.00
relación de similitud
0,000,250,500,751,00
x1 x2 x3 x4 x5
valor posibilístico
No resuelto: Ordenamiento de Datos Difusos
19
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
No resuelto: Particionamiento de Datos Difusos
20
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
No resuelto: Agregación de Datos Difusos
21
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
No resuelto: Aritmética de Datos Difusos
22
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
0,000,250,500,751,00
x0 x1 x2 x3 x4 x5 x6
No resuelto:
Las estructuras de almacenamiento físico y recuperación de los manejadores relacionales no se adecúan en forma
directa para datos difusos
Hay mucho trabajo por hacer en Matemáticas e Informática para dar soporte consistente y eficiente a
bases de datos difusas
23
ABDI-USB: qué proponemos
Grupo de Aplicaciones y Bases de Datos Inteligentes de la Universidad Simón Bolívar
Tiene varios resultados en el área que están publicados en revistas y memorias de congresos
Puede albergar y dirigir estudiantes en trabajo de grado y postgrado, de forma presencial o remota
24
Hay mucho trabajo por hacer
"Y todo lo que hagáis, hacedlo de corazón, como para el Señor y no para los hombres“
(Colosenses 3:23)
GRACIAS
33