(pre) diagnóstico de cumplimiento de directrices driver emiliano marmonti. consultor componente iii...
Post on 11-Jan-2015
2 Views
Preview:
TRANSCRIPT
(Pre) Diagnóstico de cumplimiento de directrices DRIVER
Emiliano Marmonti. Consultor Componente IIIBogotá. Colombia 28 de Agosto de 2012
Finalidad de este espacio
Espacio destinado a que los socios indiquen el estado de situación de las
redes a nivel de cada país.
Detallar el estado de implementación de un cosechador/agregador de cada red objeto de procesamiento por parte del
cosechador de la red regional
Pre-Diagnóstico de estado de situación de la red
Prueba no exhaustiva destinada a tomar una muestra de un número de
repositorios por país para detectar los principales obstáculos que la red
nacional podría hallar.
Estas pruebas se han realizado solo para dar un contexto apropiado a la
formulación de los acuerdos entre los socios en cuanto al uso y aplicación de
las directrices.
Pre-Diagnóstico de estado de situación de la red (II)
Prueba realizada sobre un total de 19 repositorios de los distintos países
• Argentina• Brasil• Chile• Venezuela• Colombia• Perú• Ecuador
Pre-Diagnóstico de estado de situación de la red (II)
Aclaración Importante: Los números indicados en las muestras no representan un volúmen de cada red.
Se ha tomado una muestra que se considera válida para alcanzar conclusiones en relación a los
potenciales problemas en la adhesión a DRIVER 2.0
Tecnología usada para la toma de muestras. Desarrollo propio basado en OVAL Validity Checker (python+django)
Pre-Diagnóstico de estado de situación de la red (II)
Argentina
• SEDICI (UNLP)• RepHipUNR (UNR)• Instituto Balseiro• Tesis de la UNL• Biblioteca Digital UNCuyo• CLACSO
Tomados en muestra 10.222
registros
Pre-Diagnóstico de estado de situación de la red (II)
Brasil
• Universidad Federal do Paraná• RIDI – IBICT• Universidad Federal de Brasilia
Tomados en muestra 9.973 registros
Pre-Diagnóstico de estado de situación de la red (II)
Colombia
• Universidad del Rosario• Pontificia Universidad Javeriana• Universidad del Valle• Universidad Tecnológica de Pereira
Tomados en muestra 5.792
registros
Pre-Diagnóstico de estado de situación de la red (II)
Chile
• Universidad de Talca • Universidad de Chile
Tomados en muestra 10.856
registros
Pre-Diagnóstico de estado de situación de la red (II)
Venezuela
• Universidad de Los Andes • REVENCYT (Indice y Biblioteca
Electrónica de Revistas Venezolanas de Ciencia y Tecnología)
Tomados en muestra 24.365
registros
Pre-Diagnóstico de estado de situación de la red (II)
Ecuador
• Pontificia Universidad Católica del Ecuador
• Instituto de Altos Estudios Nacionales
Tomados en muestra 7.739
registros
Pre-Diagnóstico de estado de situación de la red (II)
Perú
• Scielo Perú• Repositorio Digital de Tesis de PUCP
Tomados en muestra 4.776
registros
Problemas comunes a todos los países
Necesidad de un fuerte control de errores. Robustez del cosechador
• Repositorios no accesibles• Repositorios en estado de espera
contínuo.• Repositorios que dependiendo la
tecnología de base que accede puede concluir o no cosecha. Timeouts. Número de retries
• XML de respuesta mal conformados• Existencia de desarrollos propios no
normalizados que con diversos tipos de material no logran publicar correctamente los recursos.
Implicancias en la solución a seleccionar
Conclusiones
dc:date
• El validador encuentra aproximadamente un 50% de observaciones en relación a la ausencia del campo dc:date (mandatorio en DRIVER 2.0) tanto como un 50% de observaciones en relación al incumplimiento de la norma ISO 8601.
Poco menos de 1/3 de las
observaciones de error halladas
corresponden a dc:date
Conclusiones
dc:creator
• Para DRIVER 2.0 dc:creator es obligatorio, sin embargo en muchos de los repositorios implementados sobre DSpace, se está truncando el dc.contributor.creator a dc.contributor sin especificar creator. Esto genera una diferencia importante en la definición semántica de la autoría
2/3 de las observacioneshalladas por el
Validador correspondena dc:creator
Conclusiones
dc:title
• El validador ha encontrado alrededor de 350 entradas que no poseen dc:title definido. En general se atribuyen a dificultades de mapeos de metadatos al momento de la exposición sobre el protocolo OAI
Menos del 3%de las
observacioneshalladas porel validador
pertenecen a dc:title
Conclusiones
dc:identifier
• El validador ha encontrado en toda la muestra solo 4 registros que no poseen dc:identifier
Baja incidencia en la muestra
tomada
Prueba incompletaNecesidad de verificar si primer occ es URL válida
Indicadores – dc.typeTesis
Texto
Thesis
Teses e Dissertações
Article
text
Tesis de doctorado
journal article
Oficio
Artículo
bachelorThesis
Revista
Book
Tesis de grado
Working Paper
Doc. de trabajo / Informes
masterThesis
Trabajo de Grado Maestría
Textual: Revistas
Libro
acceptedVersion
Tesis de maestria
A mejorar en las pruebas, no mezclar
en el análisis diferentes ocurrencias
¿Como debería funcionar la red a nivel nacional?
Documento de trabajo 270
workingPaper 257
Audio 222
NonPeerReviewed 180
Other 173
Video: Documentales 164
Book chapter 149
bookPart 123
Video: Entrevistas 116
Monografia Especialização 115
newspaper 110
Imagen en movimiento 104
Image 100
institutionalDocument 99
Tesina 99
conferenceObject 93
Documento a texto completo 86
Trabajo de especializacion 84
Ponencias 83
Video 59
Textual: Libros 58
Artículo de Revista 55
Learning Object 50
Textual: Tesis 44
Presentation 42
doctoralThesis 39
Capitulo de libro 37
Multimedia - Video 30
conferencePaper 25
Tesis Doctoral 25
Boletín 20
Imagen fija 18
Multimedia - Audio 14
Otro 14
Sound 14
Trabajo de Grado 14
MovingImage 13
Multimedia 13
Audio: Formación Académica 10
Meeting Abstract 10
journal 9
Livros 9
Event 8
Informe tecnico 8
¿Filtrado de Registros?
DRIVER 2.0 solo trata de material
textual
Gran problema con las Tesis
Tesis 11050
Texto 6943
Thesis 6446
Teses e Dissertações 5164
Article 5084
text 3410
Tesis de doctorado 2427
journal article 2220
Oficio 1543
Artículo 1491
bachelorThesis 1433
Revista 1365
Book 1167
Tesis de grado 972
Working Paper 962
Doc. de trabajo / Informes 894
masterThesis 843
Trabajo de Grado Maestría 692
Textual: Revistas 596
Libro 495
acceptedVersion 338
Tesis de maestria 315
Objeto de conferencia 290
Documento de trabajo 270
workingPaper 257
Audio 222
¿Que tipo de Tesis son? Forma correcta de acuerdo a DRIVER 2.0 especificación del
tipo de Tesis.
DRIVER 2.0
¿Como debería funcionar la red a nivel nacional?
Article 5084
text 3410
Tesis de doctorado 2427
journal article 2220
info:eu-repo/semantics/article
info:eu-repo/semantics/doctoralThesis
¿Se supone entonces que el cosechador regional hará estos mapeos o los harán las redes nacionales?
Mapeos
Otros indicadores – dc.format
application/pdf 16298
text/html 9519
text 3190
application/html 2505
video 1500
pdf 772
2814 bytes 605
2837 bytes 594
application/octet-stream 567
text/plain 506
635569 bytes 467
1840 bytes 454
2833 bytes 414
manuscripttext 361
2809 bytes 320
2834 bytes 291
application/flv 288
2821 bytes 271
2817 bytes 179
2859 bytes 137
2816 bytes 121
2819 bytes 119
2824 bytes 109
2840 bytes 104
2797 bytes 97
application/msword 76
2810 bytes 73
2866 bytes 72
2636 bytes 69
pp. 153-166 1
pp. 515-528 1
pp. 105-120 1
pp. 9-25 1
pp. 349-356 1
pp. 867-872 1
pp. 73-83 1
pp. 429-443 1
316 p. 1
295 p. 1
pp. 549-561 1
30p. 1
pp. 215-239 1
p. 123-145 1
p. 599-614 1
pp. 177-188 1
pp. 221-234 1
Otros indicadores – dc.rights
openAccess 4876
Reconocimiento-No comercial-Sin obras derivadas 2.0 Genérica 3469
http://creativecommons.org/licenses/by-nc-nd/2.0/deed.es 3469
Creative Commons 2.5.ar 988
Open access 551
closedAccess 276
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ 112
Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5) 112
Atribución-NoComercial-SinDerivadas 2.5 Perú 58
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ 58
Atribución-NoComercial-CompartirIgual 2.5 Perú 42
http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ 42
http://creativecommons.org/licenses/by/3.0/ 41
Creative Commons Attribution 3.0 Unported (CC BY 3.0) 41
Atribución 2.5 Perú 38
http://creativecommons.org/licenses/by/2.5/pe/ 38
Solo Universidad de Talca 33
http://creativecommons.org/licenses/by-nc/3.0/ 31
Creative Commons Attribution-NonCommercial 3.0 Unported (CC BY-NC 3.0) 31
http://creativecommons.org/licenses/by-nc-nd/3.0/ 21
http://creativecommons.org/licenses/by-nc-sa/3.0/ 20
Atribución-CompartirIgual 2.5 Perú 20
http://creativecommons.org/licenses/by-sa/2.5/pe/ 20
restrictedAccess 20
Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0) 19
Creative Commons Atribución-NoComercial-SinDerivadas 2.5 Argentina (CC BY-NC-ND 2.5) 18
Otros indicadores – dc.rights
Vargas, Sonia Amalia 1
Barrera Enderle, Victor 1
Godoy R., Carmen Gloria 1
Ruiz Valdés, Javiera del Rosario 1
Vilches Contreras, Isabel 1
Soto Herrera, Cristián 1
Salomone, Alicia 1
Salazar Jaque, Borys 1
Romero Flores, Raúl 1
Oteiza, Rodrigo 1
Olea, Catalina 1
Naranjo Igartiburu, Manuel 1
Montalva C., Cristóbal 1
Lagos Garcés, Elena 1
Infante Arriagada, Pascuala 1
Idini Flores, Mariano 1
Hevia Castillo, Álvaro 1
Henríquez Lorca, Patricio 1
Fernández García, Daniel 1
Faúndez Carreño, Rodrigo 1
Vivanco, Julieta 1
Cerda, Loreto 1
Castillo Medrano, Andrés; Figueroa Román, Arturo; Freire Vallejos, Matías; Ibáñez Ballesteros, Rodrigo 1
Bello González, Carolina; Gallardo Araya, Andrea; Jara Marín, María José 1
Álvarez Coronado, Juan Pablo 1
Gallardo Moreno, Laura Priscilla 1
Cano Cubillos, Rocío 1
Galleguillos Díaz, Karin Sofía 1
Futuras acciones de la consultoría componente III en relación a los diagnósticos de cumplimiento.
• Realizar mejoras en las herramientas para toma de indicadores y observaciones del cumplimiento de las directrices. Requerimientos en cuanto al validador de la red regional. Informes desglosados por país.
• Atender e implementar los acuerdos alcanzados en la presente reunión.
• Mejoras en la metodología de tomas de muestras.
• Necesidad de establecimiento de reglas claras para la incorporación a la plataforma agregador cosechador. Threeshold de cumplimiento.
• Definición del alcance de los mapeos automáticos a realizar.
Estado de situación conformación de las redes
Espacio de debate y destinado a la formulación de acuerdos técnicos en
relación a lo esperado para la componente III. Validador y agregador /
cosechador.
top related