gestion de datos de investigacion

31
Implementación de políticas y estrategias en América Latina y el Caribe IV Taller LEARN de Gestión de Datos de Investigación Santiago, Chile, 27 Fernando Ariel López (CAICYT - CONICET) [email protected] | @fernando__lopez Gestión de Datos de Investigación, una propuesta ARGENTINA

Upload: learn-project

Post on 15-Apr-2017

264 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Gestion de Datos de Investigacion

Implementación de políticas y estrategias en América Latina y el Caribe

IV Taller LEARN de Gestión de Datos de

Investigación Santiago, Chile, 27

Fernando Ariel López (CAICYT - CONICET)

[email protected] | @fernando__lopez

Gestión de Datos de Investigación, una propuesta ARGENTINA

Page 2: Gestion de Datos de Investigacion

Fernando Ariel López (CAICYT - CONICET, Argentina)

•  Coordinador Comunicación y Formación / CAICYT-

CONICET •  Director de Biblioteca / UMET •  Co-Fundador y Director / Aprender 3C •  Integra el proyecto de investigación sobre Acceso Abierto /

IIGG-UBA •  Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA) •  Autor y Coordinador Comunicaciones / InfoTecarios •  Evaluador en diversas revistas científicas y congresos

profesionales. Expositor, Consultor y Formador en Acceso Abierto al conocimiento científico (Repositorios y Revistas Digitales), Ciencia Abierta (Datos científicos y Plan de Gestión de Datos), Ciencia 2.0, Web social, Tecnologías de Información y Comunicación, Alfabetización Informacional, Alfabetizador Digital, etc. Más información en about.me/fernandoariellopez

Page 3: Gestion de Datos de Investigacion

BIG DATA: Redes Sociales, IOT, Smart City, Sensores, Wereables, …

Page 4: Gestion de Datos de Investigacion

CIENCIA à Ciencia Abierta GOBIERNO à Gobierno Abierto

SOCIEDAD à Periodismo de Datos, Hackativismo Cívico, Innovación abierta, etc.

Page 5: Gestion de Datos de Investigacion

LEGISLACIÓN • RESOLUCIÓN 538 de JFG (junio 2013)

Sistema Nacional de Datos Públicos

•  LEY 26.899 (diciembre 2013) Creación de Repositorios Digitales Institucionales de

Acceso Abierto, Propios o Compartidos

• DECRETO 117 (enero 2016)

Plan de Apertura de Datos

•  Ley Acceso a la Información Pública (2016) Acceso a la Información Pública

Page 6: Gestion de Datos de Investigacion

→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)

→ pueden ser numéricos, descriptivos o visuales.

→ pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales.

→ pueden ser abiertos o cerrados

¿Qué son los datos de investigación? ¿Qué son los datos de investigación?

Page 7: Gestion de Datos de Investigacion

●  Es una colección de datos reunidos durante la ejecución de un proyecto de investigación.

●  Son objetos digitales compuestos y heterogéneos. ●  Constituye la base de la investigación y va asociado a una

publicación científica (resultado de la investigación). ●  Se almacena y gestiona en Repositorios Interoperables conforme a

estándares internacionales.

Es el objeto específico de control, organización,

descripción y preservación de datos científicos

DATASET

Page 8: Gestion de Datos de Investigacion

CIENCIA

Líneas de Trabajo:

1.  POLÍTICA DE DATOS CIENTÍFICOS

2.  CICLO DE VIDA DE LOS DATOS CIENTÍFICOS

3.  PLAN DE GESTIÓN DE DATOS CIENTÍFICOS

4.  E-INFRAESTRUCTURAS

5.  ROLES, COMPETENCIAS y FORMACIÓN

Page 9: Gestion de Datos de Investigacion
Page 10: Gestion de Datos de Investigacion

1.  Diseño y planificación de la creación/extracción de datos

2.  Creación/Extracción de Datos

3.  Limpieza, Normalización y Descripción de Datos

4.  Almacenamiento y Preservación de Datos

5.  Exploración, Explotación y Visualización de Datos

6.  DataMining & Knowledge Discovery

CICLO DE VIDA DE LOS DATOS CIENTÍFICOS

Page 11: Gestion de Datos de Investigacion

Ciclo de los datos de

investigación

Fuente: infografía REBIUN - CRUE

Page 12: Gestion de Datos de Investigacion

¿Qué es un PGD? Un plan de gestión de datos científicos (Data Management Plan - DMP) es un documento elaborado por el investigador o grupo de investigación donde se define:

•  Qué datos van a ser creados y cómo,

•  Cómo se van a describir, organizar, almacenar y gestionar los datos

•  De qué forma van a ser compartidos, explicando cualquier restricción

de uso que pueda ser aplicada.

•  Quién o quiénes serán los responsables de realizar cada una de estas

actividades.

•  de qué forma van a ser compartidos, explicando cualquier restricción de

uso que pueda ser aplicada.

Page 13: Gestion de Datos de Investigacion
Page 14: Gestion de Datos de Investigacion
Page 15: Gestion de Datos de Investigacion
Page 16: Gestion de Datos de Investigacion

DMP Argentina (CAICYT-CONICET)

Propuesta para Proyecto de Investigación: •  Bloque de Datos administrativos •  Bloque de Recolección de datos •  Bloque de Documentación y metadatos •  Bloque de Almacenamiento y copias de

seguridad •  Bloque de Selección y preservación •  Bloque de Re-uso de Datos

Page 17: Gestion de Datos de Investigacion

JULIO 2016 LANZAMIENTO DE UN PILOTO PGD CONICET 42 PROYECTOS UE INVITADOS 20 PROYECTOS UE VOLUNTARIOS

OBJETIVO Evaluar el contenido del PGD

Conocer el tratamiento de los datos Relevar el interés y las necesidades de los

investigadores, agencias de investigación y financiadores

ALGUNOS RESULTADOS…

ENCUESTA DEL PILOTO – PGD CONICET

Page 18: Gestion de Datos de Investigacion

TIPOS DE DATOS

USO DE ESTANDARES

ENCUESTA DEL PILOTO – PGD CONICET

Page 19: Gestion de Datos de Investigacion

VOLUMEN

ENCUESTA DEL PILOTO – PGD CONICET

Page 20: Gestion de Datos de Investigacion

DONDE PONDRÁ ACCESIBLE SUS DATOS

ENCUESTA DEL PILOTO – PGD CONICET

Page 21: Gestion de Datos de Investigacion

50% REQUIEREN SOPORTE O CAPACITACIÓN

75% CONSIDERA APROPIADA LA ORGANIZACIÓN del CONTENIDO

60% ASUMEN COMO NECESIDAD LA GESTION de un PGD

50% REQUIERE MÁS INFORMACIÓN ACERCA del USO DE

ESTÁNDARES Y ESQUEMAS DE METADATOS

ENCUESTA DEL PILOTO – PGD CONICET

Page 22: Gestion de Datos de Investigacion

e-INFRAESTRUCTURAS Repositorio Interoperable de Datos•  Datos Públicos Argentina (CKAN, OKF),•  Zenodo (Invenio, CERN)•  DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),•  Harvard DATAVERSE (Eprints)

Plataforma de Trabajo para Investigadores•  OSF, HubZero, MyExperiment.org, etc.

Cluster de Almacenamiento y/o Procesamiento

Page 23: Gestion de Datos de Investigacion

NUEVOS PERFILES

Page 24: Gestion de Datos de Investigacion

La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísticos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos.

Data Scientist / Científicos de Datos

Page 25: Gestion de Datos de Investigacion

Bibliotecari@ de Datos / Data Librarian

Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.El perfil del bibliotecario de datos requiere:•  Competencias informáticas•  Conocimiento de la disciplina (corpus, prácticas de

investigación y flujos de trabajo)•  Gestión de datos:

q  adquisición (desarrollo de la colección),q  organización (catalogación y metadatos),q  preservación y conservación a largo plazoq  implementación de servicios adecuados para los

usuarios.

Page 26: Gestion de Datos de Investigacion

NUEVAS COMPETENCIAS

Page 27: Gestion de Datos de Investigacion

COMPETENCIAS

•  Estadística, Algebra y Programación•  Tecnologías y Formatos Abiertos•  XML, PYTHON, R, etc.•  Herramientas de normalización, procesamiento

y visualización.•  Comunicación (visual y audiovisual)

•  Diseño Centrado en el Usuario (UX)

Page 28: Gestion de Datos de Investigacion
Page 29: Gestion de Datos de Investigacion
Page 30: Gestion de Datos de Investigacion

OPORTUNIDADES Comunidad Científica:

•  Acordar estándares de trabajo, normalización y gestión de datos

•  Empoderar en Gestión de Datos Científicos

•  Contribuir al avance de la ciencia, maximizando la visibilidad y el impacto

de la inversión en Investigación

•  Financiamiento y Desarrollo de e-infraestructuras para el

aprovechamiento de la Big Data Científica

•  Encuentro con otras comunidades de Gobierno Abierto, Periodismo de

Datos, HackActivismo Cívico, IoT, etc.

•  Repensar formas de producción, medición e impacto científico

Page 31: Gestion de Datos de Investigacion

MUCHAS GRACIAS

Fernando Ariel López (CAICYT - CONICET)

[email protected] | @fernando__lopez