proyecto sbc
TRANSCRIPT
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
1
ONTOLOGÍA PARA LA BÚSQUEDA DE MÚSICA Introducción
En los últimos años el intercambio de música en formato electrónico se vio beneficiado por los avances tecnológicos en redes, proceso de señales y compresión de audio. Estos avances, brindan a los usuarios finales de estas tecnologías el acceso a vastos catálogos de música, esto hace necesario tener disponible metadatos que describan el contenido musical de los catálogos.
Los metadatos son usados como capa de conocimiento para servicios de envío de música electrónica. Cada ítem del catálogo puede estar definido por un conjunto de descriptores, que toman su valor de una ontología predefinida. Algunos ejemplos de descriptores pueden ser el nombre del título, el nombre del autor, el género musical, principales instrumentos, etc.
Este estudio está enfocado hacia la clasificación de canciones en diversos géneros como: Cumbia, Pop, Romántica, Salsa, Vallenato, etc. Existen varias maneras de abordar el problema de la clasificación de música. Este estudio se centra en la realización de tal proceso mediante la identificación y extracción de características relevantes que pueden ser usadas como entradas para la creación de una Ontología. Objetivos
Obtener un mecanismo sencillo y flexible para la utilización de ontologías que sea de ayuda concreta para tareas de clasificación de la música por tipo de género, año, etc.
Analizar y entender las herramientas que se usaran para este proyecto.
Representar el conocimiento sobre música en un mapa conceptual.
Crear una ontología sobre un sistema de búsqueda de música. Herramientas Para La Construcción De La Ontología Para la construcción de la ontología utilizare CMapTools COE, ya que permite la exportación directa a la ontología formato OWL, para mostrar el conocimiento, se lo han representado gráficamente con la Herramienta Protege 4.0.2, se ha utilizado el siguiente conocimiento y para realizar el análisis del conocimiento y realizar las respectivas consultas twinkle-2.0-bin. Preguntas a Responder por Parte de La Ontología Las preguntas básicas que resolverá la ontología son las siguientes: Géneros de música que hay Nombre de la clase a la que pertenece el dominio nombreDisq Nombre de la clase a la que pertenece el dominio ubicación Listar todos los atributos que pertenecen a la clase disquera Listar todos los atributos que pertenecen a la clase Canción Listar las subclases de la clase Álbum Listar el nombre de los cantautores que forman parte del grupo de intérpretes. Listar los tipos de géneros musicales que hay. Listar los títulos o nombres de las canciones. Otras…
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
2
CONCEPTUALIZACIÓN DEL CONOCIMIENTO TAREA 1: Glosario de términos
NOMBRE SINÓNIMOS DESCRIPCIÓN TIPO
Música canción Combinación de sonidos de la voz humana o de instrumentos o ambos a la vez
concepto
Salsa - es un género y cultura musical muy movida concepto Pop - Abarca un conjunto de géneros y estilos que no se identifican
con naciones o etnias específicas concepto
Clásica - Música culta compuesta en el período clásico, de mediados del siglo XVIII hasta principios del XIX
concepto
Compositor Musicólogo Contenedor destinado a categorías en este caso cantantes concepto Álbum - Colección de pistas de audio relacionadas concepto Genero estilo categoría que reúne composiciones musicales que comparten
distintos concepto
Canción - Composición musical para la voz humana concepto País Nación País que es originario el cantante o la música concepto Año periodo Año del lanzamiento de un álbum música concepto Artista Músicos Personas quien elabora una obra de arte; en este caso música concepto Solista cantante Persona que interpreta música concepto Grupo Conjunto Conjunto musical formado por personas concepto Compositor - concepto Cumbia - Original de la región Caribe de Colombia y representa uno de
los ritmos folclóricos clásicos concepto
Rock - Estilos musicales derivados del rock and roll de los años cincuenta
concepto
Compositor - Persona o personas que realizan una composición musical concepto Disquera Casa disquera Lugar físico de grabación de las canciones que conformaran
un álbum musical. concepto
Ubicación lugar Sitio o sitos en donde se encuentra la casa disquera o sucursales
concepto
Numero pistas Numero canciones
Cantidad o numero de canciones que formaran un Álbum musical
concepto
lanzamiento - Fecha de lanzamiento de un Álbum musical concepto Titulo - Nombre que se le da a una determinada canción concepto Formato - Tipo en la que es gravada una canción concepto Duración tiempo Tiempo en minutos que dura una canción concepto Descripción Resumen Breve descripción de cada uno de los géneros musicales concepto Nombre Álbum - Nombre que se le da a un determinado Álbum que está por
salir a la venta. concepto
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
3
TAREA 2: Construcción taxonomías de conceptos
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
4
TAREA 3: Diagrama de relaciones Binarias
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
5
TAREA 4: Diccionario de conceptos
Nombre del Concepto Atributo de la Clase Atributo Instancias
Relaciones
Género Musical descripción pertenece are
Álbum NombreAlbum, Nro_pistas contiene are
Canción titulo, duración, formato Es_cantada are
Interprete Nombre, tipoArtista Canta, lanza
Is a
Años fLanzamiento are
Idioma descripLenguaje are
Disquera NombreDisq, Ubicación produce are
dance - - is_a
Cumbia - - is_a
Salsa - - is_a
Rock - - is_a
Pop - - is_a
Regueton - - is_a
2002 - - is_a 2009 - - is_a
2008 - - is_a
2007 - - is_a
2006 - - is_a
2005 - - is_a
Inglés - - is_a Español - - is_a AyM - - is_a Sony Music - - is_a
Machete Music - - is_a
Universal Music - - is_a
InterdiscopoRecords - - is_a
JL producciones - - is_a
Latinum Music - - is_a
Star Records - - is_a
Warner Music - - is_a
La melodía de la Calle - - is_a El Patron la victoria - - is_a
iDon - - is_a
Perdoname - - is_a
Te amo - - is_a
PCD - - is_a
Shock Value - - is_a
Remixed - - is_a
Loose - - is_a
Reyes de la Cumbia - - is_a
El Doctorado - - is_a
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
6
El Amor - - is_a
Diva virtual - - is_a
Luna - - is_a
Dejame Entrar - - is_a
Buttons - - is_a
The Way I are - - is_a
Release - - is_a
Searching - - is_a
Corazon partido - - is_a
Tony Dize - - is_a Tito El Banbino - - is_a
Don Omar - - is_a
Edy Lover - - is_a
Makano - - is_a
Pussycat Dolls - - is_a
Timbaland - - is_a
Tommy Aka - - is_a
Nissim - - is_a
Nelly Furtado - - is_a
TAREA 5: Describir en detalle las relaciones binarias Nombre de la
Relación Concepto
origen Cardinalidad
Máxima Concepto destino
Propiedad Matemática
Relación Inversa
canta interprete n canción simétrica esCantada
contiene álbum n canción Simétrica, transitiva pertenece A
pertenece canción n genero Simétrica, transitiva es Parte
produce disquera n álbum simétrica sonGrabados
interprete lanza n álbum simétrica esLanzado
Descripción de las clases disjuntas
Concepto origen Relación Concepto destino
Disquera disjuntos GéneroMusical
GéneroMusical disjuntos Interprete
GéneroMusical disjuntos Idioma
Idioma disjuntos Año
Interprete disjuntos Año
Interprete disjuntos GéneroMusical
Disquera disjuntos Idioma
Año disjuntos GéneroMusical
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
7
TAREA 6: Describir en detalle los atributos de instancias
Nombre del Atributo de la instancia
Concepto Tipo de Valor
Rango de Valores
Cardinalidad
Numero de pistas de un Álbum Álbum String - (8,15)
Titulo de la canción Canción String 1 (1,1)
Nombre del Álbum Álbum String 1 (1,1)
Nombre del Artista Interprete String 1 (1,1)
Nombre de la disquera Disquera String 1 (1,1)
Año de lanzamiento de álbum Año String 1 (1,1)
TAREA 7: Descripción de los atributos de clase
Nombre del Atributo Concepto origen Tipo valor Unidad Medición Cardinalidad
Nombre Jean Carlos Canela string -- (1,1)
Autor o grupo JeanCarlos string -- (1,1)
Estilo Pop string -- (1,1)
Nombre_álbum JeanCarlos string -- (1,1)
Nro_pistas 15 numérico números (1,1)
País Miami string -- (1,1)
Titulo Quedate string -- (1,1)
Duración 4 numérico minutos (1,1)
Formato Mp3 string (1,1)
Año 2009 numérico años (1,1)
Lenguaje Español string -- (1,1)
TAREA 8: Definición de las constantes
Nombre Tipo de valor Valor Unidad de medición
Número máximo de pistas de un álbum string 8 canciones
Número máximo de duración de una pista string 5 minutos
TAREA 9: Definición de los axiomas formales.
Nombre del Axioma Interpretación
Descripción A necesita de B
Conceptos Canción B
Atributos enviados Interprete A
Relaciones binarias canta
Nombre del Axioma Contenido del Álbum
Descripción Y es parte de X
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
8
Conceptos Canción Y
Atributos enviados Álbum X
Relaciones binarias contiene
Nombre del Axioma Géneros Descripción C puede pertenecer a varios D
Conceptos Genero D
Atributos enviados Canción C
Relaciones binarias pertenece
Nombre del Axioma Lanzamiento
Descripción Z produce varios W
Conceptos Álbum W
Atributos enviados Disquera Z
Relaciones binarias Produce
TAREA 10: Definición de las reglas.
Nombre de la regla Reglas para álbum grabados en varios idiomas
Descripción Álbum compuesto por pistas en español, inglés, etc.
Concepto género
Atributos enviados Idioma
Relaciones binarias are
Nombre de la regla Reglas para el tipo de formato en las canciones
Descripción Tipos de formato que tienen las canciones.
Concepto Canción , formato
Atributos enviados Álbum
Relaciones binarias are
TAREA 11: Definición de las instancias.
Nombre de la instancia Concepto Atributo
Salsa Género musical descripción
Pop Género musical descripción
Regueton Género musical descripción
Cumbia Género musical descripción
dance Género musical descripción
AyM Disquera nombreDisq
Sony Music Disquera nombreDisq
Machete Music Disquera nombreDisq
Universal Music Disquera nombreDisq
InterdiscopoRecords Disquera nombreDisq
JL producciones Disquera nombreDisq
Latinum Music Disquera nombreDisq
Star Records Disquera nombreDisq
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
9
Warner Music Disquera nombreDisq
La melodía de la Calle Álbum NombreAlbum
El Patron la victoria Álbum NombreAlbum
iDon Álbum NombreAlbum
Perdoname Álbum NombreAlbum
Te amo Álbum NombreAlbum
PCD Álbum NombreAlbum
Shock Value Álbum NombreAlbum
Remixed Álbum NombreAlbum
Loose Álbum NombreAlbum
Reyes de la Cumbia Álbum NombreAlbum
El Doctorado Canción titulo
El Amor Canción titulo
Diva virtual Canción titulo
Luna Canción titulo
Dejame Entrar Canción titulo
Buttons Canción titulo
The Way I are Canción titulo
Release Canción titulo
Searching Canción titulo
Corazon partido Canción titulo
Tony Dize Interprete Nombre
Tito El Banbino Interprete Nombre
Don Omar Interprete Nombre
Edy Lover Interprete Nombre
Makano Interprete Nombre
Pussycat Dolls Interprete Nombre
Timbaland Interprete Nombre
Tommy Aka Interprete Nombre
Nissim Interprete Nombre
Nelly Furtado Interprete Nombre
2009 Año lanzamiento
2008 Año lanzamiento
2007 Año lanzamiento
2006 Año lanzamiento
Inglés Idioma descriplenguaje
Español idioma descriplenguaje
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
10
Representación del conocimiento con Protege
La ilustración del uso y las ventajas de la utilización de los mapas conceptuales para mostrar el conocimiento, se lo han representado gráficamente con la Herramienta Protege 4.0.1, el conocimiento obtenido es el siguiente:
Razonador Una vez que se ha construido la ontología se procede a validar la misma, para lo cual utilicé el razonador Pellet. Donde Pellet es un razonador basado en Java y de código open-source. Puede ser usado en conjunción con las dos bibliotecas de Jena y OWL API, proporcionando una interfaz DIG. Puede descargar los pluging que proporciona funcionalidades para ver la validación de especies, la coherencia de verificación de las ontologías, clasificar la taxonomía, implicaciones de verificación y contestar un subconjunto de consultas RDQL. También puede utilizar la demo en línea que proporciona la mayor parte de estas funcionalidades.
CONSULTAS SPARQL UTILIZANDO LA HERRAMIENTA TWINKLE
Para iniciar con la explotación de nuestra ontología se debe definir con anterioridad los prefijos
para simplificar las consultas.
PREFIX URI:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> PREFIX owl:<http://www.w3.org/2002/07/owl#> PREFIX xsd:<http://www.w3.org/2001/XMLSchema#> PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX daml:<http://www.daml.org/2001/03/daml+oil#>
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
11
Como primer punto partimos de una consulta simple, la cual presenta el sujeto, objeto y
predicado.
Nombre de la clase a la que pertenece el dominio nombreDisq
PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:nombreDisq rdfs: ?Clase }
Listar las subclases de Álbum con su descripción PREFIX URI:<http://www.w3.org/2000/01/rdf-schema#subClassOf> PREFIX rdfs:<http://localhost/default#Album> select?Albums ?descripcion where{ ?Albums URI: rdfs: }
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
12
Nombre de la clase a la que pertenece el dominio descripLenguaje PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:descripLenguaje rdfs: ?Clase }
Nombre de la clase a la que pertenece el dominio ubicación PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ URI:ubicacion rdfs: ?Clase }
Listar todos los atributos que pertenecen a la clase disquera PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ ?Atributos rdfs: URI:disquera }
Listar todos los atributos que pertenecen a la clase Canción PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#domain> PREFIX URI:<http://localhost/default#> select* where{ ?Atributos rdfs: URI:Cancion }
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
13
Listar las subclases de la clase Álbum PREFIX URI:<http://www.w3.org/2000/01/rdf-schema#subClassOf> PREFIX rdfs:<http://localhost/default#Album> select* where{ ?SubClasesDeAlbum URI: rdfs: }
Listar el nombre de los cantautores que forman parte del grupo de intérpretes. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Interprete> select* where{ ?NombreArtista URI: rdfs: }
Listar los tipos de géneros musicales que hay. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#GeneroMusical> select* where{ ?TiposDeGeneros URI: rdfs: }
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
14
Listar los títulos o nombres de las canciones. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Cancion> select* where{ ?TituloDeLasCanciones URI: rdfs: }
Listar los años de lanzamiento de un Álbum. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#Año> select* where{ ?Añolanamiento URI: rdfs: }
Listar los Álbum con sus canciones. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?ListadoDeAlbums ?Canciones where { ?ListadoDeAlbums rdfs: URI:Album . ?Canciones rdfs: URI:Cancion . }
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
15
Listar las canciones con su género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Canciones ?GeneroMusical where { ?Canciones rdfs: URI:Cancion . ?GeneroMusical rdfs: URI:GeneroMusical . }
Listar Álbum con sus Canciones y género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Album ?Canciones ?GeneroMusical where {?Album rdfs: URI:Album . ?Canciones rdfs: URI:Cancion . ?GeneroMusical rdfs: URI:GeneroMusical . }
Listar Álbum con sus Canciones y género musical. PREFIX URI: <http://localhost/default#> PREFIX rdfs:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> SELECT ?Canciones ?GeneroMusical where { ?Canciones rdfs: URI:Cancion .
?GeneroMusical rdfs: URI:GeneroMusical . }
Cuáles son las subclases de la Clase Álbum. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> CONSTRUCT {?s rdfs:name uri: } WHERE {?s rdfs:subClassOf uri:Album }
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
16
Cuáles son los tipos de intérprete que hay. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> SELECT ?Interprete ?subclase WHERE
{uri:solista rdfs:subClassOf ?Interprete OPTIONAL
{?subclase rdfs:subClassOf uri:Interprete } }
Cuáles son los principales elementos de un álbum. PREFIX uri:<http://localhost/default#> PREFIX rdfs:<http://www.w3.org/2000/01/rdf-schema#> SELECT ?clase ?subclase WHERE{uri:Año rdfs:subClassOf ?clase OPTIONAL{?subclase rdfs:subClassOf uri:Album}} }
Cuáles son los elementos que no se relacionan con Género Musical. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#GeneroMusical> select*
Sistemas Basados en el Conocimiento Diana Lucía Poma Lima
17
where{ ?GeneroMusical_Disjuntas URI: rdfs: }
Cuáles son los elementos que no se relacionan con las Casa disqueras. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#disquera> select* where{ ?Disjuntas URI: rdfs: }
Cuáles son los elementos que no se relacionan con las Casa disqueras. PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX URI:<http://www.w3.org/2002/07/owl#disjointWith> PREFIX rdfs:<http://localhost/default#Interprete> select* where{ ?Disjuntas URI: rdfs: }
Cuáles son los elementos que no se relacionan con las Casa
PREFIX URI:<http://www.w3.org/1999/02/22-rdf-syntax-ns#type> PREFIX rdfs:<http://localhost/default#> select* where{{ ?Año_Lanamiento URI: rdfs:Año }UNION{ ?Albums URI: rdfs:Album }}