charla ucv, 15 de mayo de 2012

Post on 25-Jun-2015

1.407 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

XML y Web Semántica en parlamentos:Caso BCN

15 de mayo de 2012Christian Sifaqui

Congreso Nacional de Chile

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico

Atendemos y entregamos servicios

BCN: fábrica y repositorio decontenidos

Énfasis en administrar contenidos y datos: CMS

Énfasis en administrar contenidos y datos: CMS

Búsqueda y relacionamiento de los contenidos: Autonomy

Énfasis en administrar contenidos y datos: CMS

Búsqueda y relacionamiento de los contenidos: Autonomy

Relacionamiento y apertura de los datos: web semántica

XML

XML

XML (Extensible Markup Language)es un lenguaje de marcación (markup)estándar abiertopromovido por el W3C adoptado ampliamente a nivel mundial

para representar datos y documentos

XML

<preface><subdivision>

<docProponent>República de Panamá</docProponent><docProponent>Ministerio de Desarrolo

Agropecuario</docProponent><docType>Decreto Ejecutivo</docType><docNumber>n. 223</docNumber><docDate date="2010-06-29">(De 29 de 06 de

2010)</docDate><docTitle>Que reglamenta la Ley 72 de 2008, que establece el

procedimento especial para la adjudicación de la propiedad colectiva de tierras de los pueblo indígenas que no están dentro de las comarcas.</docTitle></subdivision>

</preface>

No XML

XML

XML

XML

• formato abierto para datos y documentos• independiente de la tecnología• separa la información de presentación de la de

representación• comprensible para máquinas• jerárquico, riguroso, extensible, preciso y flexible• constituye una inversión a largo plazo para

archivo

XML

1. colocación de marcadores (tags) entorno al texto

2. se debe definir un vocabulario de tags y reglas de cómo deben relacionarse los tags entre sí

3. estas reglas se definen mediante esquemas denominados DTD (Document Type Definition) o esquemas XML

XML

• Legible por la máquina

• interconexión de los documentos• mejor búsqueda• múltiples plataformas• dialogar sistemas informáticos• aplicaciones heterogéneas (blog, wiki, redes sociales,

RSS, etc.)• reutilizar la información• comparativa entre diferentes versiones

XML en ámbito legislativo

Al representar documentos jurídicos – legislativos o parlamentarios – (proyectos de ley, leyes, debates, actos administrativos, etc.) se requieren atenciones especiales:

• contiene información que contribuye a la dirección del workflow (flujo de trabajo)

• apoya la redacción legislativa nacional (mejores prácticas)• interoperable con otras instituciones y otros recursos• se enriquece con las contribuciones de los ciudadanos• preserva (en el tiempo) el valor jurídico en largos intervalos de tiempo• accesible a todos por vía multi-canal (accesibilidad y brecha digital)• abierto a todo el mundo para su inspección• distribuido sin discriminación (usabilidad) • utilizable con herramientas comunes y sistemas de gestión documental

Algunos estándares XML en ámbito legislativo

Muchos de ellos fueron creados en el pasado sólo para la publicación web y no distinguen entre representación del contenido y la presentación (Formex)

Otros son específicos para una nación y difícilmente se adaptan a otros sistemas jurídicos (LexDania, NormeInRete)

Otros no distinguen la parte procedural-aplicativa de la mera representación del documento (House of Representative XML standard)

Algunos estándares XML en ámbito legislativo

Estándares que cumplen las características mencionadas más arriba: Akoma Ntoso

Una personalización de dicho estándar: LexML Brazil, (se utiliza en el Senado de Brasil)

Chile ha adoptado en la BCN un estándar XML similar en algunos aspectos a Akoma Ntoso, pero que realiza la modelación del documento normativo ya en su fase conclusiva (promulgado) sin ocuparse de todo el íter legislativo

Estado del arte: XML en ámbito legislativo

Primera generación del estándar de documento legal XML , se orientó sobre todo a describir el texto legal y su estructura con un enfoque cercano a las entidades de base de datos o el procesamiento tipográfico de paradigmas

Estado del arte: XML en ámbito legislativo

Segunda generación empleó una mayor atención en la modelización del documento y la descripción del texto, la estructura y los metadatos . Sin embargo, el carácter descriptivo de los elementos no fue precedido por un análisis abstracto de las clases de datos y el resultado es una lista demasiado larga de tags, una compleja inclusión de esquemas XML o DTD, con una frecuente superposición entre los metadatos y la definición de texto y unos instrumentos demasiado débiles para unir el texto con diferentes niveles (layers)

Estado del arte: XML en ámbito legislativo

Tercera generación se basa en el patrón (pattern). El patrón define las propiedades de la clase y su gramática, el modelo del contenido, el comportamiento y el respeto a la jerarquía de otras clases, por lo que cualquier tag adicional pertenece a una clase abstracta ya existente y de esta manera se preserva la coherencia a través del tiempo. Dedica especial atención a dividir el texto, la estructura y los metadatos. Mira a la ontología como un principio fundamental para realizar un seguimiento en firme de cualquier nuevo nivel (layer) colocado en la parte superior del texto puro. Debido a que el patrón define unas reglas generales que ya no están sujetas a limitaciones reales en la acción de mark-up, la claridad del diseño favorece su carácter prescriptivo

Estado del arte: XML en ámbito legislativo

Cuarta generación utiliza el patrón (pattern) junto con una co-restricción a modo gramatical, con, entre otros, RELAX NG, Schematron, DSD, etc. para resolver el problema anteriormente mencionado de la falta de carácter prescriptivo

www.leychile.cl

Ley 22000

Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.

Y por cuanto he tenido a bienaprobarlo y sancionarlo…

Ley 22000

Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.

Y por cuanto he tenido a bienaprobarlo y sancionarlo…

Ley 25345

1.- Modifica ley 22000 de la siguienteforma:a)reemplázase en el Artículo 1 laspalabras “a” por “xyz”.

Y por cuanto he tenido a bienaprobarlo y sancionarlo…

Ley 25345

1.- Modifica ley 22000 de la siguienteforma:a)reemplázase en el Artículo 1 laspalabras “a” por “xyz”.

Y por cuanto he tenido a bienaprobarlo y sancionarlo…

Ley 22000

Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.

Ley 22000

Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.

Ley 22000

Artículo 1. xyzbc.Artículo 2. def.Artículo 3. ghi.

Ley 22000

Artículo 1. xyzbc.Artículo 2. def.Artículo 3. ghi.

t0 t1

Modelar “vida” de una norma

Ley Chile

Modelar “estructura” de una norma

Ley Chile

Modelar la “visualización” de una norma

Ley Chile

http://www.leychile.cl 2009-

“Nickname”, nombre popular

www.leychile.cl

Acceder a ley 19628http://www.leychile.cl/Navegar?idNorma=141599 http://www.leychile.cl/Navegar?idLey=19628

Obtener el XML de la normahttp://www.leychile.cl/Consulta/obtxml?opt=7&idLey=19628

http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=141599

www.leychile.cl

www.leychile.cl

Otra opción es mediante un webservice http://www.leychile.cl/Consulta/obtxml?opt=61&cadena=[texto_a_buscar][&exacta=[1|]&cantidad=[5]]

www.leychile.cl

Web ServicesÚltimas leyes publicadas

http://www.leychile.cl/Consulta/obtxml?opt=3

Dada una norma, obtener sus metadatoshttp://www.leychile.cl/Consulta/obtxml?opt=50&strBusqueda=117%23normal%23on||48%23normal%23on||53%23normal%23[idNorma]

Vista “plana”http://www.leychile.cl/Consulta/obtxml?opt=63&idNorma=[idNorma]

Para GLINhttp://www.leychile.cl/Consulta/obtxml?opt=4546&idLey=[idLey]

...

www.leychile.cl

Web Semántica

Web Semántica

WebRepleta de información

Orientada al ser humano:para comprender el contenido de una páginapara relacionar contenidos dentro de una página (textos, imágenes, videos, etc.)

Web Semántica

WebDificultad en localización de la información

(adaptar a una región específica, por ejemplo, traducir)

Buscadores actuales funcionan bien, pero orientados al keyword

Por ejemplo: “constitución”¿la de Chile?¿ciudad del sur?

Web Semántica

WebPodría pensarse en una búsqueda semántica de

información

Web Semántica

Pero el problema es la heterogeneidad de la información incluso en diferentes capas

• Codificación (ASCII, UNICODE, etc.)• Lenguaje natural utilizado• Disposición de la información en la página

web

Web Semántica

¿Cómo integrar la información?

• La información está implícita (se puede extraer de la combinación de los datos existentes)

• Se requieren métodos de lógica formal

Razonamiento automático

Web Semántica

Soluciones

• ad hoc: usar métodos de IA para analizar la información no estructurada existente en la Web

• a priori: estructurar la información en la Web para facilitar el análisis automático Web Semántica

Web Semántica

Dos condiciones esenciales para realizar lo anterior:

1. Usar estándares abiertos para describir la información:• claramente definidos• flexibles• ampliables

2. Métodos para extraer información de estas descripciones

Web Semántica

Estándares:

Web Semántica

Open Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipo

Linked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica

http://datos.bcn.cl

Open/Linked data

LeyChileLeyChile datos.bcn.cldatos.bcn.cl

Tripletas RDFOntologías OWL – RDF Schema

Endpoint Sparql – Interfaz Web WS - SOAP

Normas XML

Herramientas de generaciónde mashup del grafo

Internet

etc.etc.Linked data desde consultas

Web Semántica

Caso BCN¿Cómo definir las URI?

Modelo documental

Cada documento bibliográfico debe ser pensado bajo tres puntos de vista siguiendo el estándar FRBR adoptado por el Grupo de Estudio IFLA sobre Requisitos Funcionales para Registros Bibliográficos:Trabajo: una creación intelectual o artística, la obra original

producida por un autor, por ejemplo el Hamlet de Shakespeare

Expresión: una clara realización intelectual o artística de una obra, por ejemplo la película de Hamlet en 1990 por Zeffirelli

Manifestación: la encarnación física de una expresión concreta, por ejemplo, el formato DVD de la película

Modelo documental

En nuestro caso, el documento legal es interpretado como una fuente bibliográfica y por esta razón tiene diferentes nombres:

• Trabajo: el nombre de la ley en sí, por ejemplo, la Ley 34

Modelo documental

Por lo tanto, es importante definir en esta fase qué partes de todo el documento deberían ser convertidas en una manifestación XML y qué partes es mejor preservar en otros formatos (PDF, TIFF, etc.)

El documento principal, los anexos y la tabla deben ser objeto de control y para cada uno de ellos se identifica una tipología de documento

URI

Para cada uno se debe identificar el URI en cualquiera de los tres aspectos principales: Trabajo, Expresión, Manifestación.

URI

HTML + RDFahttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.html n3http://datos.bcn.cl/recurso/cl/LEY/20000/datos.n3RDFhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.rdf JSONhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.json ntripleshttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.ntriples

Otro ejemplo:http://datos.bcn.cl/recurso/cl/DTO/ministerio-de-educacion/

2004-09-21/173/es@2009-11-19/datos.html

URI

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341Decreto 341 del 11 de noviembre de 2008 del Ministerio de Educación

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20

Versión original

Última versión

Enlaces

Consulta compleja

Encontrar todas las normas emitidas por una municipalidad entre los años 1995 y 2000, pero que fueron modificadas después del año 2005

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

Endpoint Sparql

Listado de organismos:

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#>

SELECT distinct ?nombre WHERE { ?org norms:creatorOf ?o . ?org norms:hasName ?nombre}

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#>

SELECT distinct ?nombre WHERE { ?org norms:creatorOf ?o . ?org norms:hasName ?nombre}

Endpoint Sparql

Versiones de una norma:

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT ?n ?id_norma ?tipo ?prDate ?pbDate ?titulo ?lang ?htmlWHERE { ?n dc:identifier "484478"^^xsd:integer . ?n norms:hasNumber ?id_norma . ?n dc:title ?titulo . ?n dc:language ?lang . ?n norms:type ?tipo . ?n norms:promulgationDate ?prDate . ?n norms:publishDate ?pbDate . ?n norms:hasHtmlDocument ?html .}

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT ?n ?id_norma ?tipo ?prDate ?pbDate ?titulo ?lang ?htmlWHERE { ?n dc:identifier "484478"^^xsd:integer . ?n norms:hasNumber ?id_norma . ?n dc:title ?titulo . ?n dc:language ?lang . ?n norms:type ?tipo . ?n norms:promulgationDate ?prDate . ?n norms:publishDate ?pbDate . ?n norms:hasHtmlDocument ?html .}

Endpoint Sparql

Grafo de una norma:

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>SELECT ?n ?p ?o WHERE { ?n ?p ?o . Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846>).}

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>SELECT ?n ?p ?o WHERE { ?n ?p ?o . Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846>).}

Endpoint Sparql

Grafo de una norma:

http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846/datos.html

Endpoint Sparql

Vinculaciones de modificatorias:

PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct ?n ?p ?modificatoriaWHERE { ?n ?p ?modificatoria . ?n norms:isModifiedBy ?modificatoria .Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-

de-gobierno/2003-01-04/19846> ) . }

Actualmente

Actualmente

Otra ontología

Reseñas biográficas

no tenemos todos los años de nacimiento, ni fallecimiento, ni los lugarespor ejemplo, Salvador de la Cavareda Trucios diputado

suplente por Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)

Pero sabemos lo que nos faltaPREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ap } . FILTER (!bound(?ap)) . }

PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ap } . FILTER (!bound(?ap)) . }

Uso

Acceso

- datos.bcn.cl- leer documentación de la ontología- acceder a endpoint sparql

select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo as ?Apellido_Materno where { ?p a foaf:Person . ?p rdfs:label ?n. ?p bcnbio:surnameOfFather ?pa. ?p bcnbio:surnameOfMother ?mo.}

select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo as ?Apellido_Materno where { ?p a foaf:Person . ?p rdfs:label ?n. ?p bcnbio:surnameOfFather ?pa. ?p bcnbio:surnameOfMother ?mo.}

Visualizaciones

Actualmente

Exponer partes de la norma y su metadataIncorporar más datasets

Reseñas biográficasDatos geográficosTransparenciaHistoria de la LeyCongreso y Recursos legislativos (modelan los

documentos del Congreso Nacional)

Nuevas visualizaciones

Referencias

1. Carlos Iglesias (ed.), “Open Government Data: Feasibility Study in Chile”, 2011. https://public.webfoundation.org/2011/05/OGD_Chile.pdf

2. Cirsfid - Università di Bologna, “XML Legislativo: Principios e instrumentos técnicos”, documento interno BID, 2011

3. Harth, Rudolph & ul Mehdi, “Semantic Web Technologies I”, 2010, http://semantic-web-grundlagen.de/w/images/3/3b/WS1011-1-Einleitung_und_XML.pdf

top related