gestión de datos de investigación

38
Gestión de datos de investigación Fernando Ariel López (CAICYT-CONICET) [email protected] Lorena Carlino (CONICET) [email protected] #JVAA2016 #AccesoAbierto #OAW16

Upload: fernando-ariel-lopez

Post on 22-Jan-2017

328 views

Category:

Science


1 download

TRANSCRIPT

Page 1: Gestión de datos de investigación

Gestión de datos de investigación

Fernando Ariel López (CAICYT-CONICET) [email protected]

Lorena Carlino (CONICET) [email protected]

#JVAA2016 #AccesoAbierto #OAW16

Page 2: Gestión de datos de investigación

Fernando Ariel López (CAICYT - CONICET, Argentina)

•Coordinador Comunicación y Formación / CAICYT-CONICET•Director de Biblioteca / UMET•Co-Fundador y Director / Aprender 3C•Integra el proyecto de investigación sobre Acceso Abierto / IIGG-UBA•Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA)•Autor y Coordinador Comunicaciones / InfoTecarios•Evaluador en diversas revistas científicas y congresos profesionales.

Expositor, Consultor y Formador en Acceso Abierto al conocimiento científico (Repositorios y Revistas Digitales), Ciencia Abierta (Datos científicos y Plan de Gestión de Datos), Ciencia 2.0, Web social, Tecnologías de Información y Comunicación, Alfabetización Informacional, Alfabetizador Digital, etc.

Page 3: Gestión de datos de investigación

Lorena Carlino (CONICET, CABA, Argentina)

Actualmente tiene a su cargo la Oficina Técnica Central de Repositorios Institucionales del CONICET. Es Licenciada en Bibliotecología y Documentación (UMSA), Especialista en Comunicación Institucional (Universidad Austral). Se ha involucrado en la gestión de la información digital y el uso compartido de la información. Lleva adelante la ejecución de entornos de acceso abierto, el intercambio de datos de investigación y la implementación de sistemas interoperables para facilitar y acercar el conocimiento.

Page 4: Gestión de datos de investigación

BIG DATA REDES SOCIALES + IOT

+ Smart City

Page 5: Gestión de datos de investigación

CIENCIA Ciencia AbiertaGOBIERNO Gobierno Abierto

Page 6: Gestión de datos de investigación

LEGISLACIÓN• LEY 26.899 (2013)Creación de Repositorios Digitales Institucionales de

Acceso Abierto, Propios o Compartidos

• RESOLUCIÓN 538 de JFG (2013)Sistema Nacional de Datos Públicos

• DECRETO 117 (2016) Plan de Apertura de Datos

• Ley Acceso a la Información Pública (2016)

Acceso a la Información Pública

Page 7: Gestión de datos de investigación

→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)

→ pueden ser numéricos, descriptivos o visuales.

→ pueden ser en estado bruto o analizado,

→ pueden ser experimentales u observacionales.

→ pueden ser abiertos o cerrados

¿Qué son los datos de investigación?¿Qué son los datos de investigación?

Page 8: Gestión de datos de investigación

Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba.

Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras.

En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.”

¿Qué son los datos de investigación?¿Qué son los datos de investigación?

Page 9: Gestión de datos de investigación

● Es una colección de datos reunidos durante la ejecución de un proyecto de investigación.

● Son objetos digitales compuestos y heterogéneos.● Constituye la base de la investigación y va asociado a una

publicación científica (resultado de la investigación).● Se almacena y gestiona en Repositorios Interoperables conforme a

estándares internacionales.

Es el objeto específico de control, organización,

descripción y preservación de datos científicos

DATASET

Page 10: Gestión de datos de investigación

BENEFICIOS #DatosAbiertos● Ayuda a verificar los resultados.● Evitar la fabricación y falsificación de datos.● Diferentes interpretaciones o enfoques

aplicados a datos existentes contribuyen a los avances científicos.

● Optimización en el uso de recursos.● Preservación a largo plazo bien gestionada,

permite mantener la integridad de los datos.

TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101

http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101

Page 11: Gestión de datos de investigación

CIENCIA

Líneas de Trabajo:

1.POLÍTICA DE DATOS CIENTÍFICOS

2.CICLO DE VIDA DE LOS DATOS CIENTÍFICOS

3.PLAN DE GESTIÓN DE DATOS CIENTÍFICOS

4.E-INFRAESTRUCTURAS

Page 12: Gestión de datos de investigación
Page 13: Gestión de datos de investigación

1. Diseño y planificación de la creación/extracción de datos

2. Creación/Extracción de Datos

3. Limpieza, Normalización y Descripción de Datos

4. Almacenamiento y Preservación de Datos

5. Exploración, Explotación y Visualización de Datos

6. DataMining & Knowledge Discovery

CICLO DE VIDA DE LOS DATOS CIENTÍFICOS

Page 14: Gestión de datos de investigación
Page 15: Gestión de datos de investigación
Page 16: Gestión de datos de investigación

¿Qué es un PGD?Un plan de gestión de datos científicos (Data Management Plan - DMP) es un documento elaborado por el investigador o grupo de investigación donde se define:

•qué datos van a ser creados y cómo,

•cómo se van a describir, organizar, almacenar y gestionar los datos

•de qué forma van a ser compartidos, explicando cualquier restricción de

uso que pueda ser aplicada.

•Quién o quiénes serán los responsables de realizar cada una de estas

actividades.

•de qué forma van a ser compartidos, explicando cualquier restricción de

uso que pueda ser aplicada.

Page 17: Gestión de datos de investigación

DMP Argentina (CAICYT-CONICET)

Propuesta para Proyecto de Investigación:•Bloque de Datos administrativos•Bloque de Recolección de datos•Bloque de Documentación y metadatos•Bloque de Almacenamiento y copias de seguridad •Bloque de Selección y preservación•Bloque de Re-uso de Datos

Page 18: Gestión de datos de investigación

e-INFRAESTRUCTURAS Repositorio Interoperable de Datos•Datos Públicos Argentina (CKAN, OKF),•Zenodo (Invenio, CERN)•DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),•Harvard DATAVERSE (Eprints)

Plataforma de Trabajo para Investigadores•OSF, HubZero, MyExperiment.org, etc.

Cluster de Almacenamiento y/o Procesamiento

Page 19: Gestión de datos de investigación

NUEVOS PERFILES

Page 20: Gestión de datos de investigación

La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísticos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos.

Data Scientist / Científicos de Datos

Page 21: Gestión de datos de investigación

Bibliotecari@ de Datos / Data Librarian

Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.

El perfil del bibliotecario de datos requiere:•Competencias informáticas•Conocimiento de la disciplina (corpus, prácticas de investigación y flujos de trabajo)•Gestión de datos:

adquisición (desarrollo de la colección), organización (catalogación y metadatos), preservación y conservación a largo plazo implementación de servicios adecuados para

los usuarios.

Page 22: Gestión de datos de investigación

NUEVAS COMPETENCIAS

Page 23: Gestión de datos de investigación

COMPETENCIAS

• Estadística, Algebra y Programación

• Tecnologías y Formatos Abiertos

• XML, PYTHON, R, etc.

• Herramientas de normalización, procesamiento

y visualización.

• Comunicación (visual y audiovisual)

• Diseño Centrado en el Usuario (UX)

Page 24: Gestión de datos de investigación

Ley 26.899

• DESARROLLAR REPOSITORIOS DIGITALES INSTITUCIONALES DE ACCESO ABIERTO

• ESTABLECER POLÍTICAS • PRESENTACIÓN DE UN PLAN DE GESTIÓN• DEPOSITO DE DATOS PRIMARIOS COLECTADOS Y DE LA

PRODUCCIÓN RESULTANTE DE INVESTIGACIONES FINANCIADAS CON FONDOS PÚBLICOS EN ESOS REPOSITORIOS

Page 25: Gestión de datos de investigación

http://ri.conicet.gov.ar/

ri.conicet.gov.ar

PROMEDIO+2.900

VISITAS/MES+38.000VISITAS/AÑO

GOOGLECONICETRI

+7000ARTÍCULOS

ri.conicet.gov.ar

BUSCADORES

WEBCONICET

RI

TRAFICO

Page 26: Gestión de datos de investigación

HACIA EL DESARROLLO DE UN REPOSITORIO DE DATOS DE INVESTIVACIÓN

REPOSITORIO DE DATOS

POLÍTICAS Y ESTRATEGIAS

PLAN DE GESTIÓN DE DATOS

METADATOS GENÉRICOS Y

DOCUMENTACIÓN

DESARROLLO DE PLATAFORMA

Gerencia de Organización y Sistemas

Gerencia de Desarrollo

Page 27: Gestión de datos de investigación

Ciclo de los datos de

investigación

Fuente: infografía REBIUN - CRUE

Page 28: Gestión de datos de investigación

Ciclo de los datos de

investigación

Page 29: Gestión de datos de investigación

Y sobre todo…Es una herramienta para el investigador

¿QUÉ ES UN PLAN DE GESTION DE DATOS?

Es un documento que permite conocer el tratamiento que van a recibir los datos recopilados o generados en el curso de una investigación.

quiénes están involucrados en el flujo de los datos de investigación;

cuáles son sus prácticas, necesidades y límites a la hora de compartir sus datos;

qué datos se están generando, cómo se están almcenando y qué grado de grado de apertura tendrán ;

Page 30: Gestión de datos de investigación

PILOTO – PGD CONICET

JULIO 2016 LANZAMIENTO DE UN PILOTO PGD CONICET42 PROYECTOS UE INVITADOS20 PROYECTOS UE VOLUNTARIOS

OBJETIVOEvaluar el contenido del PGD

Conocer el tratamiento de los datosRelevar el interés y las necesidades

ALGUNOS RESULTADOS…

PILOTO PGD - CONICET

Page 31: Gestión de datos de investigación

TIPOS DE DATOS

USO DE ESTANDARES

Page 32: Gestión de datos de investigación

VOLUMEN

Page 33: Gestión de datos de investigación

DONDE PONDRÁ ACCESIBLE SUS DATOS

Page 34: Gestión de datos de investigación

50% REQUIEREN SOPORTE O CAPACITACIÓN75% CONSIDERA APROPIADA LA ORGANIZACIÓN DEL CONTENIDO60% ASUMEN COMO NECESIDAD LA GESTION DE UN PGD50% REQUIERE MÁS INFORMACIÓN ACERCA DEL USO DE ESTÁNDARES Y ESQUEMAS DE METADATOS

IMPLEMENTACIONPlan de Gestión de Datos

ENTORNO WEBCAPACITACIÓN•Diseño del Sitio Web - FAQ•Contenido informativo y de consulta•Talleres online•Instalación del DMP seleccionado•Sinergia con MinCyT

2016 - 2017

ENCUESTA DEL PILOTO – PGD CONICET

Page 35: Gestión de datos de investigación

¿Problemas?

SOMOS GRANDES LECTORES DE ACCESO ABIERTO yPOCO AUTORES DE ACCESO ABIERTO

AUTOARCHIVO

¿Soluciones?

Acompasar el cambio mostrando los beneficios de la apertura tanto institucionalmente como de quienes son productores

GENERAR CONCIENCIAABRIR EN ACCION

Page 36: Gestión de datos de investigación

Incrementa la citación

Uso y reuso, velocidad y reaprovechamiento

Almacenamiento y preservación

Obtención de Indicadores y tendencias más reales

Eleva el factor de impacto

Aumenta la Visibilidad individual e Institucional

Localización sistemática de la información

Mejoras en la calidad de la investigación

Uso de estándares e identificadores unívocos

Ahorro de fondos públicos

Page 37: Gestión de datos de investigación

GENERAR CONCIENCIAGESTIONAR EL CAMBIO EFECTIVAMENTE

MARCO ADECUADO CONFIANZA BENEFICIOS

Leyes PolíticasLineamientos

Sistemas amigablesPlataformas robustasUso de estándaresActualización permanenteResguardos

Aumento de la visibilidadIncremento de citacionesPreservación Localización organizadaSin duplicidad de esfuerzos

SERVICIOS

Capacitación Mesa de AyudaProveer Recursos

Page 38: Gestión de datos de investigación

Muchas Gracias