big data para bibliotecas de salud 2015
Post on 12-Jan-2017
509 Views
Preview:
TRANSCRIPT
Oportunidades y desafíos de la gestión de Big Data en bibliotecas de ciencias de la salud
Bibliosalud 2015 – Jorge Serrano-Cobos
2
Qué vamos a ver
1. El concepto
2. Herramientas
3. Técnicas de estudio
4. Desafíos para las bibliotecas
5. Oportunidades para las bibliotecas
6. Conclusiones
1. El concepto es el concepto¿Más allá de un hype, una moda?
4
What we offerMASmedios expertise and skills
Photo by JD Hancock
Desambiguando “Big Data”
5
Big Data versus…¿Mismo perro, distinto collar?
6
Lo obvio…Gestionamos sólo un % de los datos que están a nuestro alcance
7
Una definiciónLas 3 V’ s
Conjunto de activos de información caracterizados por su gran volumen, velocidad y variedad, que exigen formas innovadoras y rentables de procesamiento de la información para mejorar la comprensión y la toma de decisiones.
Doug Laney (Gartner)
”
”
¿Hartos ya de Vs?
Photo by 澎湖陽光阿有專業浮潛
Sin datos es como
si…
Photo by Eric Benacek
Con datos …
11
Por tanto, al final…Preguntas > Datos > Información > Respuestas > Conocimiento > Sabiduría
"Big data isn't about the data. It's about analytics."
Gary King (Harvard University)
””
2. HerramientasOh my goodness
13
Tecnologías¿Qué necesitamos?
• Datos
• Modelos de base de datos
• Almacenamiento de los datos
• Software de análisis
• Storytelling / Visualización de información
14
Tipos de datosAtendiendo a su estructura
• Datos estructurados
• Bases de datos propias o de terceros
• Datos de sensores físicos (Internet of Things)
• Metadatos
• Datos no estructurados
• Texto
• No texto
• Datos semiestructurados
15
Tipos de datosAtendiendo a su origen
• Web & Social Media
• Machine-to-Machine
• Transaction Data
• Biometrics
• Human Generated
• …
IBM
16
Tecnologías¿Qué necesitamos?
• Modelos de base de datos
• SQL
• NoSQL
• BD documentales• BD de grafos• BD clave/valor (key/value)• BD multivalor• BD orientadas a objetos• BD tabular• BD de arrays
17
Tecnologías¿Qué necesitamos?
• Software de análisis
• Análisis estadístico puro
• Data Mining
• Text Mining
• Mixtos
• Verticales
• …
18
HerramientasCaro, carísimo, open, freemium…
dataversity.net
19
HerramientasAlgunas alternativas Open Source …
Incorpora datamining / machine learnig con…
”R”, tal cual
3. Técnicas de estudioEs el análisis, estúpido
21
Tipos de análisisEstadística + Computación
• Provenientes de la Estadística:
• Estadística descriptiva
• Estadística inferencial
• Distribuciones de probabilidad
• Estadística multivariante
• Series Temporales
• Ecuaciones diferenciales
• …
22
Tipos de análisisEstadística + Computación
http://www.elprofesionaldelainformacion.com/index.html
Photo by BlueGoa
Diferencias vs. Semejanzas
http://www.slideshare.net/pranny/a-hybrid-recommendation-system
Reglas de asociaciónRelaciones entre diferentes variables
http://www.jmp.com/
Analítica predictiva¿Predecir el futuro?
Text MiningPatrones en datos no estructurados
http://provalisresearch.com/products/content-analysis-software/
27
Text MiningTendencias / histórico
Photo by Steve Jurvetson
¿Sentiment analysis?
Análisis del sentimientoOjo con esto
Photo by Steve Jurvetson
Nicholas Christakis
By Marc Smith
Social Network AnalysisAnálisis de redes con NodeXL
31
Analítica de la bibliotecaUsuarios, papers, científicos…
¿Quién ha dicho altmetrics? ¡Cybermetrics!
32
Analítica de la bibliotecaUsuarios, papers, científicos…
33
Analítica de la bibliotecaUsuarios, papers, científicos…
34
Analítica de la bibliotecaUsuarios, papers, científicos…
4. Desafíos para las bibliotecasGestión de bibliotecas basadas en… ¿el dato?
36
Desafíos para las bibliotecasAparte del presupuesto, claro
• Privacidad de los datos personales
http://www.dilbert.com
37
• Confianza ciega en los datos (caso Google Flu)
http://scholar.harvard.edu/files/gking/files/0314policyforumff.pdf
Desafíos para las bibliotecasAparte del presupuesto, claro
5. Oportunidades para las bibliotecasGestión de bibliotecas basadas en… ¿el dato?
39
Aplicando Big Data a BibliotecasEl rol de la biblioteca
Escenarios:
• La Biblioteca, como emisora de datos
• La Biblioteca, como garante de los datos
• La Biblioteca, como integradora de datos
• La Biblioteca, como analista / explotadora de datos
40
Aplicando Big Data a BibliotecasEl rol de la biblioteca
Escenarios:
• La Biblioteca, como emisora de datos
• La Biblioteca, como garante de los datos
• La Biblioteca, como integradora de datos
• La Biblioteca, como analista / explotadora de datos
41
Big vs Small Librarian Data Como emisores de los datos
Drupal + eXtensible Catalog
http://pcu.bage.es/
42
Aplicando Big Data a BibliotecasEl rol de la biblioteca
Escenarios:
• La Biblioteca, como emisora de datos
• La Biblioteca, como garante de los datos
• La Biblioteca, como integradora de datos
• La Biblioteca, como analista / explotadora de datos
43
Databrarians al poderGarantes de los datos
Algunas iniciativas:
• http://www.re3data.org: Registro global de repositorios de datos de investigación. Y Schema propio de definición de datos en XML , usando DOI para hacer los datos persistentes, únicos y citables.
• http://data.okfn.org/ : trabajan en estándares para compartir datos de todo tipo. (hay un grupo español - http://okfn.es/ )
• http://sparceurope.org/thehaguedeclaration/
44
Databrarians al poderEmisores y garantes de los datos
http://assets.okfn.org/p/data.okfn.org/img/the-idea.png
45
Databrarians al poderEmisores y garantes de los datos
Algunas guías:
• “Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020” http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
• Guía de la universidad de Duke sobre “Research data management services o RDS http://library.duke.edu/data/guides/data-management/repositories
46
Aplicando Big Data a BibliotecasEl rol de la biblioteca
Escenarios:
• La Biblioteca, como emisora de datos
• La Biblioteca, como garante de los datos
• La Biblioteca, como integradora de datos
• La Biblioteca, como analista / explotadora de datos
47
Búsqueda de datosData sharing, Linked Open Data…
48
Búsqueda de datosData sharing, Linked Open Data…
49
Búsqueda de datosData sharing, Linked Open Data…
50
Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…
http://www.easp.es/exploraevidencia
51
Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…
52
Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…
53
Búsqueda de datosRecuperar sobre variedad de fuentes de forma unificada…
54
Aplicando Big Data a BibliotecasEl rol de la biblioteca
Escenarios:
• La Biblioteca, como emisora de datos
• La Biblioteca, como garante de los datos
• La Biblioteca, como integradora de datos
• La Biblioteca, como analista / explotadora de datos
55
Big vs Small Librarian Data Como integradores de datos
+
56
Big vs Small Librarian Data Como integradores de datos
http://www.foregroundweb.com/
+
57
Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…
Azucena Santillánhttp://www.socialbiblio.com/materiales-de-busqueda-eficaz-de-evidencias-en-cuidados/
58
Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…
https://adwords.google.com/KeywordPlanner
59
Análisis de la demanda de información vs. ofertaControl del vocabulario, ayuda en recuperación de info…
https://www.google.es/trends/
60
Visualización de informaciónStorytelling, contextualización gráfica de la información
https://www.youtube.com/watch?v=X82iJZEViDo&app=desktop
61
Visualización de informaciónA veces, no es cuestión de presupuesto, sino de imaginación
https://docs.google.com/spreadsheets/d/14qNC6yHuJN_rHhfCb_j_3kxV3qhc6fM1aSHaUm6tiyM/
edit#gid=0
5. Conclusiones
63
Conclusiones
1. Lo importante es querer preguntarse, buscar respuestas
2. Las herramientas se democratizan
3. Datos sí, pero con cuidado
4. Múltiples aplicaciones, imaginación al poder
5. Sopesar oportunidades vs. costes
6. La tecnología es útil, las personas más
64
Oficinas centrales:C/Garcilaso 15-B
46003 ValenciaTel.: 96 369 41 23 Fax: 96 369 34 39
Oficinas NYC:175 Varick Sreet
New York. N.Y. 10014 U.S.A.
Gracias :-)
Jorge Serrano-Cobosjorge@masmedios.com
http://www.facebook.com/masmedios
http://twitter.com/masmedios
MASmedios (Madrid)C/Jesús del Valle, 28 bajo
28004, MadridTel.: 636 26 71 78
64
Nota de agradecimiento: Copyright de imágenes, a sus respectivos dueños 65
top related