san-lod: el sistema archivístico nacional italiano como datos abiertos enlazados por alessandro...

22
Istituto Centrale per gli Archivi Istituto Centrale per gli Archivi 1 SAN-LOD El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados http://dati.san.beniculturali.it Alessandro Chiaretti InnovaTICS, agosto 2014

Upload: innovatics

Post on 08-Jul-2015

107 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

Istituto Centrale per gli Archivi Istituto Centrale per gli Archivi

1

SAN-LODEl Sistema Archivístico Nacional Italiano como

Datos Abiertos Enlazados

http://dati.san.beniculturali.it

Alessandro Chiaretti

InnovaTICS, agosto 2014

Page 2: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 2

Istituto Centrale per gli Archivi – ICAR

• Mandato institucional:

• Promover soluciones innovadoras para conseguir la interoperabilidad tecnológica y semántica entre los sistemas archivísticos del país;

• Realizar herramientas para la interoperabilidad tecnológica y semántica, y ofrecer servicios de uso avanzado dirigidos a distintos niveles de usuarios.

Page 3: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 3

Datos Abiertos Enlazados

• ¿Qué son? http://vimeo.com/album/2072014/video/49231112

• La Web Semántica y las iniciativas relacionadas con Datos Abiertos Enlazados estimulan a las instituciones para que publiquen, compartan y conecten sus datos;

• Gran potencial para las instituciones de memoria, proveedores de contenidos muy valiosos, en la medida que puedan complementar los propios datos con fuentes externas.

Page 4: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 4

LOD en Bibliotecas

• Las bibliotecas han reconocido este potencial, y ya son varias las que han abierto o están abriendo sus datos.

Page 5: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 5

LOD en archivos

• Todavía pocos ejemplos:– LOCAH y Linking Lives (Reino Unido);– ReLoad - Repository for Linked open archival data (Italia).

Page 6: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 6

SAN - Sistema Archivistico Nazionale

• Sistema Archivístico Nacional de Italia;• Inaugurado en diciembre de 2011, gestionado por ICAR;• Portal aglutinador de recursos archivísticos: punto de acceso

integrado al patrimonio archivístico italiano, que pone a disposición descripciones de archivos y recursos digitales de naturaleza heterogénea;

• 553.214 recursos archivísticos y digitales, provenientes de 21 sistemas de archivos (estatales y privados);

• www.san.beniculturali.it

Page 7: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 7

Catálogo de los recursos archivísticos - CAT

• Repositorio de datos archivísticos:• Conjuntos archivísticos;• Productores;• Instrumentos de descripción;• Conservadores;

• Los sistemas adheridos a SAN envían los datos en base a un formato de intercambio (XML schema) definido a nivel central en el año 2009 (Sottocommissione tecnica per la definizione dei metadati relativi alle risorse archivistiche rese accessibili attraverso il Sistema Archivistico Nazionale).

Page 8: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 20148

SAN-LOD: objetivos

• Convertir los datos de SAN en Datos Abiertos Enlazado para:

• Poner a disposición recursos visibles y reusables en la web, también fuera de su contexto original de utilización y de creación;

• Permitir nuevas conexiones entre sujetos, personas, organizaciones y lugares, con la finalidad de promover la investigación interdisciplinaria y enriquecer el conocimiento histórico.

Page 9: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 9

SAN-LOD: objetivos

schemaEAD.xsd

SAN-LOD.owl

schemaEAC.xsd

strumenti.xsd

scons.xsd

Page 10: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 10

Primera fase: la ontología

• Ontología: representación de un conjunto de conceptos y relaciones entre ellos en un dominio determinado, estructurada formalmente;

• OWL (Ontology Web Language) para formalizar el modelo conceptual SAN de descripción de objetos archivísticos, correspondiente a la estructura de los XML schema;

• Extensión de la estructura a través de introducción de nuevas entidades y relaciones (contextos históricos, perfiles de instituciones, tesauros SKOS).

Page 11: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 11

La Ontología SAN:27 class y subclass, 50 data properties, 35 object properties

Page 12: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 12

Tesauro SAN

• Tesauro en formato SKOS (Simple Knowledge Organisation System) que reúne a los diccionarios controlados del CAT SAN, y además agrega la posibilidad de asociar temas a los conjuntos archivísticos;

• Herramienta de soporte al control de la descripción archivística, que puede seguir integrando datos de varias proveniencias y convertirse en un marco de informaciones indispensables para contextualizar los datos.

Page 13: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 14

Segunda fase: los datos

• Transformación de los datos en OWL, en base a la ontología;

• Agregación a los datos originales de las propiedades más usadas en LOD (Dublin Core, Foaf…);

• Interlinking de los recursos SAN con recursos externos, de dominio archivístico (ReLoad) o más general (DBpedia, GeoNames…).

Page 14: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 15

Soggetto produttore

Soggetto Conservatore

Complesso Archivistico

Tematismo

Luogo

Strumenti di ricerca

Profilo istituzionale

Contesto storico

istituzionale

GeoNames

DBpedia

Dominio GGASI

Otros dominios externos

SISTATIstat

Dominio SIAS

Datos Abiertos Enlazados SAN

ToponimiStorici

Persona

ente

famigliaRelazione

CPF

Sito web

Luogo Cons

Tesauro SAN

Dominio SAN

Page 15: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 16

Publicación de los datos SAN-LOD

• http://dati.san.beniculturali.it;

• Licencia Italian Open Data Licence V.2.0;

• Todos los datos disponibles para la descarga, la navegación y la reutilización:

• 4.607.024 tripletas en Endpoint Sparql (Virtuoso rdf store);

• 97 datasets para descarga en formatos RDF/XML, TTL, CSV;

• Consulta Html.

Page 16: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 18

www.san.beniculturali.it

Page 17: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 1919

http://dati.san.beniculturali.it

Page 18: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 20

RAW DATA

Page 19: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 201421

http://lodlive.it/

DBpedia

SAN

ReLoad

Page 20: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 22

Próximas evoluciones: Atlas Histórico Institucional (ASI)

• Ulterior extensión de la ontología SAN-LOD;• Datos sobre la historia del territorio italiano, que van a ampliar

y profundizar el conocimiento; • Repertorio histórico administrativo-territorial, que pretende

poner a disposición de la comunidad un catálogo de autoridades de topónimos a nivel nacional;

• Los topónimos históricos de ASI van a constituir un marco de referencia en el entorno LOD, tanto para el SAN como para cualquier futura operación descriptiva de tipo histórico-geográfica.

Page 21: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014 23

Beneficios

• Aumento considerable de la visibilidad de los datos archivísticos, gracias a la publicación en formatos abiertos y a la interconexión con otras fuentes de información;

• Con la publicación centralizada de los datos por parte del SAN, todos los sistemas que lo componen se ven beneficiados, sin necesidad de hacer nuevas inversiones en tecnología;

• Los datos del SAN, como en general los datos de bibliotecas y archivos, son manejados por profesionales de la información y tienden a ser de muy alta calidad. Por ello, tienen el potencial de convertirse en una indispensable columna vertebral de la creciente Web Semántica.

Page 22: SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por  Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)

SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados

InnovaTICS 2014

Contactos

ICAR (Istituto Centrale per gli Archivi)Direttore: Marina Giannettovia di Castro Pretorio 105, 00185 Roma

[email protected]; [email protected];

http://www.icar.beniculturali.it/

24

[email protected]

Alessandro Chiaretti