meta-análisis bibliográfico en la websistemas.fciencias.unam.mx/~layla/clase...

40
Meta-análisis bibliográfico en la Web Layla Michán Laboratorio de Ciencimetría, Información e Informática en Ciencias Biológicas

Upload: others

Post on 11-Apr-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Meta-análisis bibliográfico en la Web

Layla MichánLaboratorio de Ciencimetría, Información e

Informática en Ciencias Biológicas

Índice

• Tercera calificación parcial– Reporte de la pregunta individual

– Reporte de la investigación grupal: informática en su área

• Disciplinas informáticas (Bioinformática, neuroinformática)

• Herramientas (Colecciones, programas)

• Aproximaciones (text mining, bibliometría, semántica, ontologías)

• Introducción al meta-análisis

• Herramientas automáticas en la Web para meta-análisis

Meta-análisis

• Simultáneo al desarrollo de ciencias de lainformación (CI) y las tecnologías la información yla comunicación (TICS), en especial con eldesarrollo de las bases de datos y la Internet, sehan producido formas sistémicas de análisis decantidades colosales de información (terabites).

• Técnica cuantitativa que usa medicionesespecíficas para indicar la fuerza (tendencias) derelaciones variables en los estudios incluidos en elanálisis. La técnica enfatiza los resultados entremúltiples estudios en oposición a los resultadosobtenidos de una sola investigación.

Características

Se pueden hacer debido a que existengrandes colecciones de datos de registrosbibliográficos.

Hemos reconocido cinco tipos:

1. Análisis de textos simples

2. Análisis bibliométricos (Ciencimetría)

3. Análisis de redes

4. Descubrimiento basado en literatura (Minería de textos, minería de datos).

5. Semántica

Elección de fuentes y recursos

Búsqueda

Extracción

carga

Diseño de la base de datos

relacional: tablas, relaciones y

formularios

Selección

Análisis bibliométrico

Traducción

Normalización y Depuración

Pruebas

Validación

Migración

Tratamiento cuantitativo: Indicadores

ciencimétricos y biliométricos,

métodos y modelos matemáticos, y

técnicas estadísticas (univariante,

bivariante y multivariante), minería de

textos, semántica, redes.

Registros y campos

Bases de datos

Frecuencia de variables y

tablas de contingencia

Regularidades

Interpretación: descripción,

comparación, contextualización

Análisis

Explicaciones

Consultas

Relaciones lógicas

Recuperación

Interpretación

Determinación, identificación y

parámetrosVisualización

Meta-análisis

Elección de fuentes y recursos

Búsqueda

Aplicación Web

Interpretación

Indicadores y

visualización

• Amigables y fáciles de usar

• De uso generalizado

• Aplicaciones novedosas

• Utilizan registros de colecciones bibliográficas

– WoS, Scopus, PubMed, Clase y Periódica, Scielo, REDALyC, WWS

• Se analizan miles de registros simultáneamente (10, 000-100,000)

• Dinámicos

– Datos actualizados

– Análisis en tiempo real

• Propósitos

– Mejorar las búsquedas

– Facilitar la recuperación de literatura

– Visualizar proporciones, tendencias y patrones en la literatura

Aplicaciones Web para

meta-análisis automáticos

Artículos de vanguardia

Marcar

Compartir

cBuscar

Calificar

Rankingc

Comentar

Metrics

Bibliometría para

selección de

literatura

Bibliometría para evaluación y selección de

literatura

Statistics

Bibliometría

para

tendencias

Fig. 2. Co-word space of the top 50 highly frequent and bursty words used in the top

10% most highly cited PNAS publications in 1982-2001.

Bibliometría

para

palabras

Bibliometría para

obtención de nuevo

conocimiento

Bibliometría para

artículos

Bibliometría para dominios

1

10

100

1000

10000

100000

1864

1870

1876

1882

1888

1894

1900

1906

1912

1918

1924

1930

1936

1942

1948

1954

1960

1966

1972

1978

1984

1990

1996

2002

log

Do

cu

men

tos

SCI Periodica

SCI Biosis

CAB Scopus

ZR

Bibliometría para colecciones

Taxonomía AL

0

10

20

30

40

50

60

70

80

90

100

Bio

l Evolu

t

Zoolo

ogía

Eco

l y cien

c amb

Cien

c bio

log

Anat y

morf

Botàn

ica

Paleo

nto

logía

Bio

l mar y

acuát

Bio

div

y co

nserv

Gen

ética y h

erencia

Parasito

logía

Bio

l repro

d

Fisio

logía

Enfer in

fecc

Forestal

Agricu

ltura

Boquím

y b

iol m

ol

%Biosis

ZR

CAB

SCI

Periódica

Taxonomía América Latina

Taxonomía AL

Bibliometría para colecciones

Bibliometría para países/regiones

Bibliometría y redes

para el conocimiento

Bibliometría y redes para el

conocimiento

0

500

1000

1500

2000

2500

3000

19

00

19

05

19

10

19

15

19

20

19

25

19

30

19

35

19

40

19

45

19

50

19

55

19

60

19

65

19

70

19

75

19

80

19

85

19

90

19

95

20

00

20

05

Escherichia (94873)

Drosophila (48989)

Saccharomyces (27549)

Arabidopsis (18094)

Zea (7636)

Neurospora (6640)

Dictyostelium (6191)

Chlamydomonas (5646)

Caenorhabditis (5353)

Schizosaccharomyces (3183)

Danio (973)

Año

Docu

men

tos

0

100

200

300

400

19

40

19

45

19

50

19

55

19

60

19

65

19

70

19

75

19

80

19

85

19

90

19

95

20

00

20

05

Neurospora (6640)

Dictyostelium (6191)

Chlamydomonas (5646)

Caenorhabditis (5353)

Schizosaccharomyces (3183)

Danio (973)

Año

Docu

men

tos

Modelos en Biomedicina SCIBibliometría para análisis de

la ciencia

Meta-análisis para PubMed

META-ANALISIS

Bibliometría Análisis de Redes

Text Mining

Jensen et al. Nature Reviews Genetics 7, 119–129 (February 2006) | doi:10.1038/nrg1768

Figure 1 | Growth of Medline.

The numbers of journals, papers

(as represented by Medline

abstracts), papers on the cell cycle

and papers on Cdc28 that were

published each year from 1950 to

2005 are shown. An average for 3

years was calculated for the Cdc28

curve because of much lower

numbers. The number of new

papers that were published each

year continues to increase,

especially on certain topics such as

the cell cycle, for which it is no

longer possible to read all new

papers that are published. By

contrast, specific proteins that are

'hot' at one point in time tend to lose

their popularity later, as exemplified

by Cdc28.

Bibliometría para consultas

Búsqueda

Tendencias

Bibliometría y web semántica

Bibliometría y minería de textos para

refinar búsquedas y visualizar

tendencias

Chilibot

Relaciones entre un subconjunto de genes afectados por el tratamiento con

cocaína.

Redes para obtención de

nuevo conocimiento

Redes para obtención de

nuevo conocimiento

Bibliometría para

recuperación de

información

Análisis de redes para

visualización de

contenidos de literatura

Bibliometría

para

búsquedas

Retractación

http://pmretract.heroku.comBibliometría

para

fenómenos

de

publicación

Minería para

plagio

Tarea

• Hacer una presentación por alumno de los siguientes indicadores bibliométricos (basarse en documentos que lo expliquen de las bases de datos o de su área de investigación):

– Factor de Impacto

– Índice H

– Obsolescencia

– Vida media

– Citación

– Efecto mateo

– “Sleeping Beauties”

http://biiiogeek.blogspot.com/

• Esta investigación se lleva a cabo

gracias al financiamiento de:

• DGAPA, UNAM. Proyecto PAPIME PE

201509

• CONACYT, Ciencia Básica. Proyecto

13276 2011-2014.

Licencia Creative

Commons

http://creativecommons.org/licenses/by/3.0/deed.es_GT

Michán, L. 2011. Presentación

Forma de citar este trabajo