flujos de trabajo en la gestión de un repositorio institucional
DESCRIPTION
Flujos de trabajo en la gestión de un repositorio institucional. Antonio Juan Prieto Jiménez Jordi Serrano-Muñoz Universitat Politècnica de Catalunya. ¿Quiénes somos?. Sumario. Razón de ser ¿Biblioteca? Agentes ¿Empezamos? Check-list Como organizarlo Interoperabilidad e integración - PowerPoint PPT PresentationTRANSCRIPT
Flujos de trabajo en la gestión de un repositorio institucional
Antonio Juan Prieto JiménezJordi Serrano-Muñoz
Universitat Politècnica de Catalunya
¿Quiénes somos?
Sumario• Razón de ser• ¿Biblioteca?• Agentes• ¿Empezamos?• Check-list• Como organizarlo• Interoperabilidad e integración• Sostenibilidad• Soporte• Infraestructura TIC• Mas tareas
• La UPC en cifras• Repositorios en la UPC
Repositorios: Razón de ser (I)
• Ofrecer a nuestra comunidad una herramienta o aplicación para publicar sus trabajos académicos, en acceso abierto y en texto completo en Internet
• Garantizar el acceso perpetuo a los trabajos archivados mediante su almacenamiento en servidores seguros mantenidos y gestionados por la ¿Biblioteca?
• Mejorar la visibilidad de la organización y sus autores en la red.
Repositorios: Razón de ser (II)• ¿De verdad necesitamos crear, gestionar y
mantener un repositorio?• Analicemos las implicaciones:
• ¿Está la organización madura?• Dimensiones• Capacidades• Recursos: personas, infraestructura,
económicos, ….
Repositorios: Razón de ser (y III)• No lo necesitamos:
• Esperamos la oportunidad• Creamos las condiciones• Preparamos el terreno• No hacemos nada
• Si lo necesitamos• ¿Podemos hacerlo?• Lo tenemos claro• Alianzas / Colaboraciones
Repositorios: ¿Biblioteca? (I)
• La implementación, gestión, organización no es solo una responsabilidad de la biblioteca
• Es de toda la institución• Requiere un compromiso institucional• Si no hay compromiso…. ¿Para que
queremos un repositorio?
Repositorios: ¿Biblioteca? (y II)
La institución debe comprometerse con el control y la protección de su producción intelectual en soporte digital
Alicia López Medina (UNED)
Repositorios: Agentes (I)
• Implicación a diferentes niveles:• Órganos de gobierno• Gestores / administradores• Docentes / investigadores, …• Oficina de apoyo a la investigación y
transferencia de tecnología• Sistemas de información• …..
Y también biblioteca
Repositorios: Agentes (y II)
• Necesitamos la complicidad y el compromiso de nuestro entorno
• No debemos “lanzarnos a la piscina” solos, en ese caso lo mas probable es que fracasemos
• Cada uno de los agentes tiene su responsabilidad, su tarea y evidentemente diferentes niveles de implicación
Repositorios: ¿Empezamos?
• Habrá que hacer pasillos y “cafés”• Crear complicidades• Explicar cuales son los beneficios para el
investigador / docente y para la organización también para la sociedad
• Implicará un cambio cultural• Pensemos en la lista de tareas e implicaciones• Y naturalmente en asignarle un presupuesto
Atención: ¡esto no es un proyecto!
Repositorios: Check-list (I) /
• Visión, misión, objetivo del repositorio• ¿Qué representa el repositorio para la
organización?• ¿Qué contenidos?• ¿Hemos identificado a los agentes? • ¿La organización tiene una política sobre la
propiedad intelectual?• ¿Se han analizado los riesgos?
Repositorios: Check-list (II)
• ¿No habrá ya por ahí algún repositorio?• ¿Tenemos el soporte institucional? ¿Está la
institución “madura”?• La organización y los agentes, ¿Están
preparados? ¿Están capacitados?• ¿Tenemos algún “champion” como cómplice?• ¿Hemos definido roles, responsabilidades,
etc.. para el desarrollo del repositorio?
Repositorios: Check-list (y III)
• ¿Hay financiación?• ¿Qué estadísticas, datos e informes
facilitaremos del repositorio?• ¿Y el ROI?
Fuente: JISC: Planning Checklist - Before You Start Repositories Support Project
Repositorios: Como organizarlo (I)• Identificar comunidades, usuarios,
contenidos,…• Quien deposita o almacena• Procedimientos:
• Flujos y roles: aceptación, moderador/validador, revisor
• Mandato• Licencias
Repositorios: Como organizarlo (II)• Metadatos, normalización, …• Políticas de preservación
migración de formatos• Dominio, hosting, backup/copias de
seguridad, actualizaciones, migraciones …
No estamos solos en esto
Repositorios: Como organizarlo (III)• Diferentes implicaciones = diferentes
niveles:• “Políticos”• Tecnológicos• Gestión
• Se trata de una carrera de fondo: ¿Empezamos por un “piloto”? …. pero ….
• ….. ¿De verdad que necesitamos el repositorio?
Repositorios: Como organizarlo (IV)
• Modelo centralizado único repositorio para todos los contenidos
• Modelo diversificado:• Ajustar los modelos de metadatos.• Adaptarse a la naturaleza de los contenidos.• Trabajar las particularidades de los documentos.• Facilitar su integración con otros sistemas de
información.• Adaptarlos a la organización de la biblioteca• Desarrollo tecnológico mas flexible
Repositorios: Como organizarlo (y V)• Modelo centralizado:
• Fácil de gestionar• Incidencias con las "excepciones"
• Modelo diversificado:• Incremento en los costes de mantenimiento.• Dispersión de contenidos y posible confusión
en la comunidad de usuariosConocer la organización la decisión es de
todas las partes
Interoperabilidad e integración (I)• Con otros sistemas de información:
• De la organización• Externos
• Podemos compartir / reusar información• Se pueden generar nuevas aplicaciones / utilidades• Mejoramos tareas / flujos de trabajo• Todos ponen / Todos ganan• Disponemos de estándares
No inventemos la rueda
Interoperabilidad e integración (y II)• OAI-PMH• Dublin Core• SWORD• SOA• IMS• SCORM• ….incluso el MARC
Sostenibilidad• Estamos preparados respecto a:
• Crecimiento de repositorio• Infraestructura TIC• Presupuesto asignado• Personal y su gestión• Updates / Migraciones• Preservación
Calculemos a medio / largo plazo
Soporte• Legal, TIC, Gestión …..• Modelo(s) de metadatos• Plataforma(s)• Políticas de colecciones y de acceso• Gestión usuarios → roles, flujos … • Interacción con los agentes• Capacidad de respuesta (compromiso)
Infraestructura TIC• In house / externalizado• Cloud• Compartido• Atención a los SLA (la letra pequeña)• Backup
Evaluar costes…….
Más tareas• Mandato ¿Work in progress?• Autores ¿Están dispuestos a colaborar?• Algún tipo de incentivo• Difusión interna / externa• Alta directorios / Google Scholar• ......
¿de verdad que necesitamos un repositorio?
La UPC en cifras 2010-2011 (I) Titulaciones• 69 titulaciones de grado• 19 dobles titulaciones• 85 convenios
internacionales de doble titulación
• 61 programas de máster• 46 programas de
doctorado• 363 programas de
formación continua (másteres UPC y cursos de posgrado)
Comunidad• 44.221 estudiantes• 2.780 personal docente e
investigador• 1.694 personal de
administración y servicios
Distribuida en• 11 campus y centros
territoriales• 23 escuelas y facultades
13 bibliotecas+/-100 personas
La UPC en cifras 2010-2011 (II) Investigación• 64.164.414 € Ingresos por
proyectos I+D+i y transferencia tecnológica
• 101 Distinciones científico-técnicas recibidas
• 843 nuevos convenios y proyectos de investigación
• 2.070 artículos publicados en revistas científicas
• 78 patentes
Departamentos, institutos y centros de investigación• 42 departamentos• 6 institutos de investigación• 183 grupos de investigación• 17 centros específicos de
investigación• 19 Centros de investigación
en la red TECNIO• 19 Centros de investigación
vinculados
Universidad y Empresa• 2.680 empresas y entidades con convenio de colaboración• 14 empresas creadas y participadas (Programa Innova y Innova 31)• 21 cátedras y aulas de empresa
La UPC en cifras 2010-2011 (y III) • 13 bibliotecas• +/-120 personas• Modelo diversificado• 2 TB. Contenidos• +/-64.000 documentos• Desde CRIS 9.700 documentos revisados / año • 47% personal implicado en estas tareas• En algunos casos representa el 25% de su
tarea
Repositorios en la UPC• Modelo diversificado:
• 2001: TDX • 2002: Archivo Gráfico de la ETSAB • 2003: Videoteca Digital de la UPC • 2004: Trabajos académicos • 2005: Revistas y congresos • 2006: E-prints • 2007: OCW Materiales docentes• 2010: Fondo histórico bibliotecas UPC
• 2011: Nuevo OCW• 2012: Depósito de exámenes
Integración
• Recuperar la información donde se genera o introduce por primera vez
• Evitar duplicar tareas• Actualizaciones => Estándares (SWORD, OAI,
RSS, etc.)• Importancia en el crecimiento repositorio
Estándares: extraer información
• OAI-PMH– Nuevos formatos de metadatos añadidos– Módulo OAIExtended: sets específicos (driver,
OpenAIRE, etc.)
• RSS– Ampliado para casos específicos (ItunesU,
Universia, etc.)
Estándares: Carga de datos
Simple Web-services Offering Repository Deposit
Un protocolo para depositar en repositorios entre aplicaciones Proyecto financiado por JISC iniciado en 2007 Implementado para diversas plataformas (DSpace, Eprints, Fedora, IntraLibrary) Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB) Dos operaciones básicas
Servicedocument Deposit
SWORD: formato METS (I)
• Llamada HTTP en la que se envía un archivo ZIP comprimido en formato estándar METS que contiene:- Archivo xml con las datos del recurso (archivo mets.xml) - Documentos propios del recurso
Memoria.pdfAnnex.pdf…
…Mets.xml(datos del recurso:-Autor-Tutor-Titulo-Fechas-Palabras clave… )
SWORD: formato METS (II)
Cabecera
Metadatos descriptivos en formato MODS/SWAP/etc.
Licencia Creative Commons
Lista archivos
Mapa estructural
--
--
SWORD – Llamada deposit
RESP HTTP 201 CREATED
HTTP POST
ClienteServidor SWORD
UPCommons
POST /deposit/123456789/18 HTTP/1.1Host:eprints.upc.es/pfc-swordContent-Type: application/zipAuthorization: Basic ZGFmZnk6c2VjZJldA==Content-length: nnnContent-MD5: md5-digestContent-Disposition: filename=mydeposit.zipX-Format-Namespace: METS
<?xmlversion="1.0" encoding="UTF-8"?><atom:entryxmlns:atom="http://www.w3.org/2005/Atom"xmlns:sword="http://purl.org/net/sword/"><atom:id>info:something:1</atom:id>…</atom:entry>
Puesta en marcha
• Pasos iníciales– Ver las necesidades de datos a enviar – Explicación del protocolo y formato
• Preparar un entorno de desarrollo • Creación de un wiki con información
sobre: – Datos necesarios para el envío del recurso– Como se mapean estas datos dentro del
formato METS– Como se envían (SWORD)– Enlaces a librerías en diferentes formatos de
programación
Otras
• No siempre existen los estándares adecuados• Debemos hacer cambios específicos para
casos concretos (solo “si no hay más remedio”)
• Exportación de bases de datos, cargas manuales, etc.
• Cambios bien documentados
Trabajos académicos UPC
E-prints UPC
Videoteca UPC Fondo Antiguo UPC
OCW UPC
Revis
tas y
co
ngre
sos U
PC
TDX
UPC
Exámenes UPC
PRISMA
DRAC
GD EscuelasGD Escuelas
OJS
MediaTIC
Catálogo
ITunesU
Doctorat
MDC
Portal producción científica
AteneaOAI-PMH
SWORD
SWORD
SWOR
D
OAI-P
MH
RSS
BD EXPORT
BD EXPORT Visión General
GD Escuelas
SWORD
E-prints UPC
• Integración con DRAC (CRIS de la UPC)• Portal producción científica UPC• Driver / OpenAIRE
Integración DRAC
DRAC, el Descriptor de la Recerca i l’Activitat Acadèmica de la UPC: http://drac.upc.edu/info
Sistema que registra la actividad académica de la UPC Generación CVN Intervención del SBD en la definición del proyecto y posterior
participación en los workflows de revisión de datos Integrado con UPCommons “Política institucional de acceso abierto: acceso, visibilidad,
impacto y preservación de la producción académica de la UPC en Internet”
Modelo de integración Integración en dos fases:
1. Envío:• Introducción metadatos básicos en DRAC• Obligatoriedad de introducir enlace o archivo• Si se introduce archivo, se conecta a UPCommons
2. Revisión:• Revisión de metadatos básicos en DRAC• Revisión de metadatos propios de UPCommons, validación de las
condiciones de acceso y publicación final
Autenticación simultánea en ambas aplicaciones mediante CAS
Integración DRAC: Pasos
Integración DRAC: Pasos
PASO 1: Carga archivo PASO 2: Aceptación licencia
Integración DRAC: Pasos
Integración DRAC: Pasos
Integración DRAC: Pasos
Portal Producción científica
Portal de la Producción científica de la UPChttp://bibliotecnica.upc.edu/producciocientifica
Portal Producción científica
Evolución E-prints UPC20
05-1
1
2006
-04
2006
-09
2007
-01
2007
-05
2007
-09
2008
-01
2008
-05
2008
-09
2009
-01
2009
-05
2009
-09
2010
-01
2010
-05
2010
-09
2011
-01
2011
-05
2011
-09
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
Drac restringidoDrac abiertoEnvío directo
Antes de DRAC2262 reg. (4 años)
Con DRAC4214 reg. en abierto (2 años)2804 reg. acceso restringido
(2 años)
Trabajos académicos UPC
• Envío de los PFC/TFC desde las aplicaciones de gestión de las escuelas
• Proceso de carga de registros al catálogo
Envío de PFC/TFC
• Diferentes escuelas disponen de aplicaciones para la gestión de las lectura de PFC/TFC
• Recogen los archivos del proyecto y metadatos necesarios
• Nos envían a través de SWORD• De momento 4 escuelas => en proyecto
hacerlo con todas a través de la E-administración
Envío de registro al catálogo
• Evitar catalogar los trabajos dos veces• Carga semanal de registros del repositorio al
catálogo• Exportación de registro MARCXML mediante
OAI• ¡Más en el Pecha Kucha de mañana!
Revistas y Congresos UPC
• Envío de números de revistas desde OJS• Exportación/importación con RACO (Revistes
Catalanes amb Acces Obert)
OJS (I)
• Proyecto de IDP: Servició de publicaciones de la UPC
• Soporte al sistema de revisión de revistas editadas en la UPC
• Gestión y asignación de DOI
OJS (II)
DOI
UPCommonsRevistas y Congresos
SWORDSWAP
PAM MESSAGEREGISTRO
Resolución DOI
OJS
OAI-PMH
Videoteca UPC
• Mediatic• ItunesU
Mediatic
• Proyecto de colaboración entre Servicio informáticos del Campus de Terrassa y la Biblioteca del Campus de Terrassa
• Envío a través de SWORD
ItunesU UPC
• Videoteca UPC posible fuente de contenido
• Adaptación del RSS para hacerlo compatible con ItunesU (soportado en las últimas versiones de DSpace)
OCW y Exámenes UPC
• Desarrollados con Drupal• IDP: Servicio de publicaciones de la UPC• Integraciones
– Integración con Sistema de Gestión Académica (PRISMA): extracciones de tablas de la base de datos
– RSS Universia, MDX y OCW Consortium– Campus Virtual
PRISMA
• Información sobre asignaturas, plan docente …. mediante importación de base de datos
• Vía SOA, PRISMA captura datos bibliográficos del catálogo de documentos recomendados en la guía docente
• Re-uso de esos datos bibliográficos en el OCW
Futuro
• Trabajar en el envío de Tesis• Exportación de registros de fondo Antiguo a
Memoria Digital de Catalunya• Aplicar el modelo de carga de PFC SWORD a
más escuelas (proyecto de e-administración) • Exportación al catálogo con otros repositorios• …¿Datos?
¡Muchas gracias por la atención!
Seguimos en el Pecha Kucha ;-)