meta-análisis bibliográfico en la websistemas.fciencias.unam.mx/~layla/clase...
TRANSCRIPT
Meta-análisis bibliográfico en la Web
Layla MichánLaboratorio de Ciencimetría, Información e
Informática en Ciencias Biológicas
Índice
• Tercera calificación parcial– Reporte de la pregunta individual
– Reporte de la investigación grupal: informática en su área
• Disciplinas informáticas (Bioinformática, neuroinformática)
• Herramientas (Colecciones, programas)
• Aproximaciones (text mining, bibliometría, semántica, ontologías)
• Introducción al meta-análisis
• Herramientas automáticas en la Web para meta-análisis
Meta-análisis
• Simultáneo al desarrollo de ciencias de lainformación (CI) y las tecnologías la información yla comunicación (TICS), en especial con eldesarrollo de las bases de datos y la Internet, sehan producido formas sistémicas de análisis decantidades colosales de información (terabites).
• Técnica cuantitativa que usa medicionesespecíficas para indicar la fuerza (tendencias) derelaciones variables en los estudios incluidos en elanálisis. La técnica enfatiza los resultados entremúltiples estudios en oposición a los resultadosobtenidos de una sola investigación.
Características
Se pueden hacer debido a que existengrandes colecciones de datos de registrosbibliográficos.
Hemos reconocido cinco tipos:
1. Análisis de textos simples
2. Análisis bibliométricos (Ciencimetría)
3. Análisis de redes
4. Descubrimiento basado en literatura (Minería de textos, minería de datos).
5. Semántica
Elección de fuentes y recursos
Búsqueda
Extracción
carga
Diseño de la base de datos
relacional: tablas, relaciones y
formularios
Selección
Análisis bibliométrico
Traducción
Normalización y Depuración
Pruebas
Validación
Migración
Tratamiento cuantitativo: Indicadores
ciencimétricos y biliométricos,
métodos y modelos matemáticos, y
técnicas estadísticas (univariante,
bivariante y multivariante), minería de
textos, semántica, redes.
Registros y campos
Bases de datos
Frecuencia de variables y
tablas de contingencia
Regularidades
Interpretación: descripción,
comparación, contextualización
Análisis
Explicaciones
Consultas
Relaciones lógicas
Recuperación
Interpretación
Determinación, identificación y
parámetrosVisualización
Meta-análisis
Elección de fuentes y recursos
Búsqueda
Aplicación Web
Interpretación
Indicadores y
visualización
• Amigables y fáciles de usar
• De uso generalizado
• Aplicaciones novedosas
• Utilizan registros de colecciones bibliográficas
– WoS, Scopus, PubMed, Clase y Periódica, Scielo, REDALyC, WWS
• Se analizan miles de registros simultáneamente (10, 000-100,000)
• Dinámicos
– Datos actualizados
– Análisis en tiempo real
• Propósitos
– Mejorar las búsquedas
– Facilitar la recuperación de literatura
– Visualizar proporciones, tendencias y patrones en la literatura
Aplicaciones Web para
meta-análisis automáticos
Fig. 2. Co-word space of the top 50 highly frequent and bursty words used in the top
10% most highly cited PNAS publications in 1982-2001.
Bibliometría
para
palabras
1
10
100
1000
10000
100000
1864
1870
1876
1882
1888
1894
1900
1906
1912
1918
1924
1930
1936
1942
1948
1954
1960
1966
1972
1978
1984
1990
1996
2002
log
Do
cu
men
tos
SCI Periodica
SCI Biosis
CAB Scopus
ZR
Bibliometría para colecciones
Taxonomía AL
0
10
20
30
40
50
60
70
80
90
100
Bio
l Evolu
t
Zoolo
ogía
Eco
l y cien
c amb
Cien
c bio
log
Anat y
morf
Botàn
ica
Paleo
nto
logía
Bio
l mar y
acuát
Bio
div
y co
nserv
Gen
ética y h
erencia
Parasito
logía
Bio
l repro
d
Fisio
logía
Enfer in
fecc
Forestal
Agricu
ltura
Boquím
y b
iol m
ol
%Biosis
ZR
CAB
SCI
Periódica
Taxonomía América Latina
Taxonomía AL
Bibliometría para colecciones
0
500
1000
1500
2000
2500
3000
19
00
19
05
19
10
19
15
19
20
19
25
19
30
19
35
19
40
19
45
19
50
19
55
19
60
19
65
19
70
19
75
19
80
19
85
19
90
19
95
20
00
20
05
Escherichia (94873)
Drosophila (48989)
Saccharomyces (27549)
Arabidopsis (18094)
Zea (7636)
Neurospora (6640)
Dictyostelium (6191)
Chlamydomonas (5646)
Caenorhabditis (5353)
Schizosaccharomyces (3183)
Danio (973)
Año
Docu
men
tos
0
100
200
300
400
19
40
19
45
19
50
19
55
19
60
19
65
19
70
19
75
19
80
19
85
19
90
19
95
20
00
20
05
Neurospora (6640)
Dictyostelium (6191)
Chlamydomonas (5646)
Caenorhabditis (5353)
Schizosaccharomyces (3183)
Danio (973)
Año
Docu
men
tos
Modelos en Biomedicina SCIBibliometría para análisis de
la ciencia
Jensen et al. Nature Reviews Genetics 7, 119–129 (February 2006) | doi:10.1038/nrg1768
Figure 1 | Growth of Medline.
The numbers of journals, papers
(as represented by Medline
abstracts), papers on the cell cycle
and papers on Cdc28 that were
published each year from 1950 to
2005 are shown. An average for 3
years was calculated for the Cdc28
curve because of much lower
numbers. The number of new
papers that were published each
year continues to increase,
especially on certain topics such as
the cell cycle, for which it is no
longer possible to read all new
papers that are published. By
contrast, specific proteins that are
'hot' at one point in time tend to lose
their popularity later, as exemplified
by Cdc28.
Chilibot
Relaciones entre un subconjunto de genes afectados por el tratamiento con
cocaína.
Redes para obtención de
nuevo conocimiento
Retractación
http://pmretract.heroku.comBibliometría
para
fenómenos
de
publicación
Tarea
• Hacer una presentación por alumno de los siguientes indicadores bibliométricos (basarse en documentos que lo expliquen de las bases de datos o de su área de investigación):
– Factor de Impacto
– Índice H
– Obsolescencia
– Vida media
– Citación
– Efecto mateo
– “Sleeping Beauties”
• Esta investigación se lleva a cabo
gracias al financiamiento de:
• DGAPA, UNAM. Proyecto PAPIME PE
201509
• CONACYT, Ciencia Básica. Proyecto
13276 2011-2014.