web semántica tejiendo una red de significados disertante lic. giannella ligato [email protected]...

70
Web Semántica Tejiendo una red de significados Disertante Lic. Giannella Ligato [email protected] www.seoposicionamiento.com Universidad Tecnológica Nacional Facultad Regional Buenos Aires Seminarios Athena 21 de agosto de 2007

Upload: guillermo-camacho-castro

Post on 24-Jan-2016

219 views

Category:

Documents


0 download

TRANSCRIPT

  • Web SemnticaTejiendo una red de significadosDisertante Lic. Giannella Ligatotana@vardump.com.arwww.seoposicionamiento.com.arUniversidad Tecnolgica NacionalFacultad Regional Buenos AiresSeminarios Athena21 de agosto de 2007

  • Personaje del daTim Berners-LeeEl padre de la Web

  • Tim Berners-LeeLondres, 1955. Ambos padres matemticos. Estudi en el Queens College, en la Universidad de Oxford. All construy una computadora con una soldadora, algunos circuitos TTL, un procesador M6800 y un televisor.En 1989, en el CERN, Tim Berners-Lee y Robert Caillau propusieron juntar hipertexto con DNS y TCP: as naci la World Wide Web. El 6 de agosto de 1991 vio la luz el primer sitio web de la historia: http://info.cern.ch/

  • Tim Berners-Lee-Esta computadora NeXT fue el primer server y tuvo el primer navegador y el primer editor web de la historia. -Tim Berners-Lee escribi el cdigo del navegador y el del server. Por si esto fuera poco, tambin es el padre del lenguaje HTML. En 1994, Tim Berners-Lee fund la W3C, la organizacin que lidera la definicin de estndares para Internet. CERN

  • Tim Berners-LeeHoy, Tim Berners-Lee sigue trabajando en la W3C, y es investigador senior en el MIT. Sigue prefiriendo estas tareas antes que la actividad privada. Adems, por supuesto, es el primer impulsor de la Web Semntica

  • Tim Berners-LeeCitas de Tim Berners-Lee: The power of the Web is in its universality. Access by everyone, regardless of disability is an essential aspect. The Web is now philosophical engineering. Physics and the Web are both about the relationship between the small and the large. You affect the world by what you browse. Sites need to be able to interact in one single, universal space.

  • Web SemnticaTejiendo una red de significados

  • TemarioCmo funciona internet hoyQu es la web semntica: metadatos, XML, RDFCoffee break.Qu es una ontologa y para qu sirve: OWLCmo integramos todo esto: webservicesCmo funcionar internet maana.

  • Cmo funciona la web hoyOrganizar mi viaje?

  • Cmo funciona la web hoy

  • Cmo funciona la web hoy

  • Cmo funciona la web hoyCaramba Quiz tenga ms suerte con el hotel

  • Cmo funciona la web hoy

  • Cmo funciona la web hoyLa red no es para m, es imposible encontrar algo Necesito un agente de viajes!

  • Cmo funciona la web hoyMil maneras de referirse a lo mismo, y tambin referencia a distintas entidades con el mismo significante ambigedad y falta de precisin.Los datos no estn inmediatamente disponibles para ser procesados por otro software.Los datos no estn interconectados, cada sitio es una isla.

  • Cmo funciona la web hoyTrfico desde buscadoresMiles de resultados con poca precisinResultados altamente sensibles al vocabularioResultados inconexos, pginas en vez de sitiosIntensiva en tiempo y trabajo del usuario Mquinas tontasInformacin no clasificadaBaja interoperabilidad

  • Cmo funciona la web hoyEn todo caso, se puede extraer datos, pero no informacin ni menos aun conocimiento.Los buscadores entienden las palabras pero no las relaciones. Cmo hago para buscar hoteles con media pensin disponibles en Buenos Aires?Media pensin categoraDisponibles fecha etc

  • Cmo funciona la web hoyRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoFlechas = links

  • Entonces?As funciona la web hoyTienen solucin estos inconvenientes?

    Segn la W3C, la solucin posible es la

    Web Semntica

  • Qu mejorar la web semnticaMquinas que comprendan significadosDiscriminacin automtica de relevanciasInteroperabilidadBsquedas ms eficientes: resultados certeros en menos tiempo Usuario ocupado en la toma de decisiones y no en las tareas repetitivas xito para encontrar lo que buscbamos!!

  • Qu es la web semnticasintaxis.(Del lat. syntaxis, y este del gr. , de , coordinar).1. f. Gram. Parte de la gramtica que ensea a coordinar y unir las palabras para formar las oraciones y expresar conceptos.2. f. Inform. Conjunto de reglas que definen las secuencias correctas de los elementos de un lenguaje de programacin.

  • Qu es la web semnticasemntico, ca.(Del gr. , significativo).1. adj. Perteneciente o relativo a la significacin de las palabras.2. f. Estudio del significado de los signos lingsticos y de sus combinaciones, desde un punto de vista sincrnico o diacrnico.

    Inform.!!!

  • Qu es la web semnticaUna red de significadosInformacin clasificadaJerarqua de datosInfraestructura ordenada

  • Qu es la web semntica

    RecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoRecursoes sinnimo de es hijo de es miembro dees autor de es citado pores parte de es amigo de dicta clases enFlechas = relaciones y propiedades

  • Qu es la web semnticaUn ejemplo concreto:

  • Qu es la web semnticaLa web semntica implica una infraestructura comn, mediante la cual se pueda compartir, procesar y transferir informacin de forma sencilla.*

    *Segn la definicin oficial de W3CEsta infraestructura hace que las mquinas comprendan el significado de la informacin se facilita y agiliza el trabajo humano.

  • Web semnticaDefinicin de Tim Berners Lee: Una web semntica es una red de datos que pueden ser procesados directa o indirectamente por mquinas. Es una web extendida que permitir a humanos y mquinas trabajar en cooperacin mutua

  • Cmo hacemos para que las mquinas entiendan significados?

    Hacer mquinas ms inteligentes Enfoque IA

    Hacer datos ms inteligentes Enfoque WSWeb semntica

  • Web semnticaBuaaaaaa, nadie me quiere!!!No te preocupes, Roboto, que cuando necesite un agente te voy a llamar

  • Cmo se logra esto?La web semntica requiere de: MetadatosOntologas

    Y para aprovechar todo su potencialLgica y motores de inferenciaAgentes inteligentes

  • Stack de web semntica

  • Datos ms inteligentes

  • Datos en la web semnticaLa web semntica requiere de datos inteligentes, esto es:Independientes de las aplicacionesClasificadosParte de una ecosistema mayor de informacin (ontologa).

  • MetadatosEtimolgicamente, datos que hablan de datos ayudan a clasificar los datosMetadatos: Datos acerca de estructura y contenido de los documentos de la web, sean [X]HTML, imgenes, video, audio, documentos de texto, etc.Metadatos

  • MetadatosRecurso Propiedad Valor[Sujeto Predicado Objeto]Ya se usan ampliamente en [X]HTML, en PDF, en archivos de ofimtica, etc. Metadatos sociales: folksonomies.

  • MetadatosEjemplo [X]HTML:Holamundo.htm RecursoPropiedadValor

    Ejemplo folksonomies: delicious, YouTube, flickr

  • Vamos por partes

  • URIUniform Resource Identifiers, identificadores de recursos nicos, sin posibilidad de ambigedad. Puede ser una localizacin (URL), un nombre (URN) o ambos. Ejemplos: http://www.utn.edu.armailto:[email protected]:isbn:0-395-36341-1

  • UnicodeEstndar para representar y manipular texto en cualquier idioma del mundo.

    Tiene un repertorio de ms de 100.000 caracteres.

  • XMLeXtensible Markup LanguageMetalenguaje de etiquetas extensibles, se puede acomodar a las necesidades de cada uno. Esquemas que definen y restringen su estructura.Establece relaciones bsicas pero no una semntica todava nos falta un paso.

  • XMLEjemplo:

    ]>

    PepeLolaHolaTodo bien?

  • XMLEjemplo:

    635748 Gran Hotel Pirulo 3

  • RDFResource Description Framework (infraestructura para la descripcin de recursos)*No exclusivamente, tambin puede usar otras (N3, RxR, Turtle, N-Triplex, Trix). Soluciona las carencias de XML, y agrega semntica. Es un modelo de metadatos que usa la sintaxis de XML*.

    Sigue el modelo Recurso Propiedad Valor (triple)

  • RDFEjemplo de RDF-XML:

    La Universidad Tecnolgica Nacional

  • RDFEjemplo de RDF-XML: 4 Madrid Hyatt

  • RDF y XML no son lo mismoXML es bsicamente un formato de datos, una sintaxis que permite gran flexibilidad. No hay significado (semntica) embebido en un archivo XML; no se puede hacer demasiado a menos que se cuente con un tipo particular de XML extra (un schema, como XHTML or SVG). En cambio, RDF es un modelo que, a pesar de no tener la flexibilidad de XML, soluciona algunos de sus inconvenientes y agrega semntica.

    http://www.w3.org/DesignIssues/RDF-XML.html

  • Otros ejemplos de implementaciones: RSS 0.90 y 1.0Proyecto FOAF

    RDFC:\Documents and Settings\Tana Ligato\Desktop\Athena\foaf.rdf

  • RDFSRDF trabaja con un RDF Schema (RDFS): definicin de vocabularioRDFS no provee clases ni propiedades particulares de una aplicacin, sino que otorga un framework para describir esas clases y propiedades. Es una especie de type system para RDF (comparable a los type systems usados en OOP como Java).

  • RDFSLas clases en un RDF Schema son comparables a las clases en lenguajes de programacin orientada a objetos. Los recursos pueden ser definidos como instancias de clases o subclases de clases.

  • RDFSEjemplo:
  • Invitacin pero ahora ya tenemos que empezar a hablar de taxonomas y ontologas.

    Tomamos primero un caf?

  • Break

  • TaxonomasUna taxonoma es un vocabulario controlado ordenado jerrquicamente. Vocabulario controlado: lista cerrada de trminos definidos y nicos (sin ambigedad).Una taxonoma define la clasificacin de trminos y los principios que rigen esa clasificacin. Las relaciones de una taxonoma estn dadas por los tesauros.

  • OntologasVocabularios que las mquinas pueden entender, especificados con la suficiente precisin como para permitir diferenciar trminos y referenciarlos de manera precisa y unvoca.Las ontologas estn referidas a un dominio de informacin, un rea de conocimiento determinada.

  • OntologasEntonces: Una ontologa define conceptos y relaciones en un rea de conocimientos, de manera unvoca. Una ontologa captura informacin lgica de manera tal que de ella pueda inferirse informacin.

  • OntologasEjemplo:

    class-def alojam % alojam es una claseclass-def transporte % transporte es una clasesubclass-of NOT alojam % separada de alojamclass-def hotelsubclass-of alojam % los hoteles son subc de alojamclass-def habitslot-constraint is-part-of % habit son parte del hotelhas-value hotelclass-def avion subclass-of transporte class-def bus subclass-of transporte

  • Ontologas

  • OWLWeb Ontology Language: Lenguaje para definir ontologas. OWL fue creado como forma comn de procesar el contenido de la informacin web - no para mostrarlo sino para procesarloTrabaja sobre RDFUsa sintaxis XMLEs un estndar con 3 sublenguajes: OWL Lite OWL DL (incluye OWL Lite) OWL Full (incluye OWL DL)

  • OWLEjemplo:

    Un ejemplo aun ms elaborado: http://smi-protege.stanford.edu/svn/owl/trunk/examples/travel.owl?rev=6289&view=auto

    C:\Documents and Settings\Tana Ligato\Desktop\Athena\airport-ont.htm

  • Integracin: webservicesQu es un webservice (definicin oficial)

    Es un conjunto de aplicaciones o de tecnologas con capacidad para interoperar en la Web. Estas aplicaciones o tecnologas intercambian datos entre s con el objetivo de ofrecer servicios. Los proveedores ofrecen sus servicios como procedimientos remotos y los usuarios solicitan un servicio llamando a estos procedimientos a travs de la Web.

  • Integracin: webservices

  • Integracin: webservices

  • Resumiendo

  • Componentes para una WSXML nos da la sintaxis para documentos estructurados, pero no agrega semntica. XML Schema restringe la estructura de documentos XML y extiende a XML con datatypes. RDF es un modelo de datos para objetos ("recursos") y relaciones entre ellos. Provee semntica simple para este modelo de datos, y puede ser representado con sintaxis de XML. RDF Schema es un vocabulario para describir clases y propiedades de recursos RDF, usando semntica para jerarquas generalizadas de esas propiedades y clases. OWL agrega vocabulario para describir propiedades y clases: entre otros, relaciones entre clases, cardinalidad, igualdad, caractersticas de propiedades, etc.

  • Cmo funcionar la web maanaLa web semntica permitir: - ... realizar deducciones lgicas.- ... realizar inferencias.- ... combinar informacin.- ... generar informacin nueva a partir de la existente.- ... realizar consultas complejas.- ... automatizar procesos.

  • Cmo funcionar la web maana- El viaje perfecto: avin, hotel, restaurante, visa, trmites para llevar mascotas, vacunas. - El mini-asesor contable: impuestos, fechas de pago, lugares, bancos, noticias. - Una agenda mdica: cartilla de la obra social, sacar turno, procesar receta, pedir los lentes.

  • Preguntas?Preguntas con delay : escribime a [email protected]?

  • Bibliografa y recursos Ivan Herman: Introduction to the Semantic Web. W3C, 2003. Disponible en http://www.w3.org/2003/Talks/0624-BrusselsSW-IH/Overview.html AAVV: Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential. The MIT Press, 2003.AAVV: Resource Description Framework. W3C, 1998 y ss. Disponible en http://www.w3.org/RDF/Tim Berners-Lee: Weaving the web. Harper, 1999. Daconta et al: The Semantic Web, a guide to the future of XML, Web Services and Knowledge Management. Wiley and Sons, 2003. AAVV: The Semantic web: on the respective roles of XML and RDF. IEEE, 2001. Disponible en http://www.ontoknowledge.org/oil/downl/IEEE00.pdf INTERESANTE!!Jena, framework para desarrollar aplicaciones de web semntica (Java): http://jena.sourceforge.net/Protg, herramienta para modelar ontologas: http://protege.stanford.edu/

  • Gracias por venir!www.seminariosathena.com.ar

  • Esta presentacin queda a tu disposicin bajo licencia Creative Commons: http://creativecommons.org/licenses/by/2.5/ar/

    Si te pareci til y quers usarla, hacelo! :)

    Avisame a [email protected]

    Tomado de Daconta et al: The Semantic Web, a guide to the future of XML, Web Services and Knowledge Management. Wiley and Sons, 2003. CDATA (character data): Agarra todo el texto contenido dentro del tag y lo muestra tal cual. Evita problemas de sintaxis.PCDATA (parsed character data): esos elementos pueden contener cualquier dato XML. CDATA (character data): Agarra todo el texto contenido dentro del tag y lo muestra tal cual. Evita problemas de sintaxis.PCDATA (parsed character data): esos elementos pueden contener cualquier dato XML. Tomado de Daconta et al: The Semantic Web, a guide to the future of XML, Web Services and Knowledge Management. Wiley and Sons, 2003. Tomado de Daconta et al: The Semantic Web, a guide to the future of XML, Web Services and Knowledge Management. Wiley and Sons, 2003. Extrado de http://www.w3.org/TR/owl-features/ (la traduccin es ma, y es bastante libre ).