sistemas para la gestión de conocimiento en chile los indicadores de cti: estado del arte y...
TRANSCRIPT
Sistemas para la gestión de conocimiento en Chile
LOS INDICADORES DE CTI: ESTADO DEL ARTE Y DESAFIOS FUTUROS
Santiago, 21 y 22 de Septiembre
Jorge Walters [email protected]
________________________Septiembre 2004
Motivación (i)
• Hoy es posible unir dinámicamente los datos provenientes de las bases de datos de gestión de la actividad científica, con la producción científica propiamente tal.– La capacidad de almacenamiento permite disponer de
textos completos en formato digital• Proyectos, publicaciones científicas, patentes
– Las fuentes de información disponibles en Internet y en redes especializadas dejan disponible contenidos que están disponibles antes que los datos necesarios para la generación de indicadores tradicionales.
– El desarrollo de tecnologías para el procesamiento de información basada en conceptos.
________________________Septiembre 2004
Trabajos relacionados
• Using curriculum vitae to compare some impacts of NSF research grants with research Center Funding (Monica Gaughan & Barry Mozeman, Research Value Mapping Program, GATech)
• OPS : Indicadores de recursos humanos CyT en Salud, Un nuevo enfoque (Reunión RICYT)
________________________Septiembre 2004
Instrumentos
• STANALYST, CNRS
• Vec-Mining, Grupo STELA
• Collexis
________________________Septiembre 2004
Motivación (ii)
Metadatos
Análisis automático
Documento
original
DB
________________________Septiembre 2004
La tecnología
________________________Septiembre 2004
Testing Collexis technologyThe Abstraction Process
Illustration from Collexis® http://www.collexis.com/
________________________Septiembre 2004
Testing Collexis technologyAbstraction Process Simplified
DeCS, LanguageLanguageLanguage
________________________Septiembre 2004
Un documento, un vector en el espacio definido por el tesauro
A
B
d3
d1d2
________________________Septiembre 2004
El experimento
________________________Septiembre 2004
El modelo (i)
• Resúmenes de Medline (un segmento) para generar una collexion. Para cada resumen se genera un vector de conceptos (fingerprint)
• El espacio está definido por MESH (2002)• La definición de SIDA, según NLM, define lo que
entendemos por este concepto y nos sirve para restringir el espacio de análisis (¡sólo un ejemplo!).
• A partir de una búsqueda filtrada para un país específico, obtenemos el conjunto de fingerprints (vectores) de documentos relevantes al tema.
________________________Septiembre 2004
El modelo (ii)
FingerPrintpaís = Compi(fpdoci)
A
B
País 3
País 1País 2
AIDS
Ángulo entre 2 países
Ángulo de un país y el patrón
Comparación de los ángulos con el patrón
________________________Septiembre 2004
Un texto que define... The most severe manifestation of infection with the Human Immunodeficiency Virus (HIV). The Centers for Disease Control and Prevention (CDC) lists numerous opportunistic infections and cancers that, in the presence of HIV infection, constitute an AIDS diagnosis. In 1993, CDC expanded the criteria for an AIDS diagnosis in adults and adolescents to include CD4+ T-cell count at or below 200 cells per microliter in the presence of HIV infection. In persons (age 5 and older) with normally functioning immune systems, CD4+ T-cell counts usually range from 500 - 1,500 cells per microliter. Persons living with AIDS often have infections of the lungs, brain, eyes, and other organs, and frequently suffer debilitating weight loss, diarrhea, and a type of cancer called Kaposi's Sarcoma. See HIV Disease; Opportunistic Infection; AIDS Wasting Syndrome
________________________Septiembre 2004
El fingerprint de AIDS
AIDS Representation
00.20.40.60.8
11.2
Inf
ectio
n
Acq
uire
d
Cen
ters
for
Dia
gnos
is
Per
sons
Adu
lt
Agi
ng
Im
mun
e
Lun
g
Eye
Dia
rrhe
a
Dis
ease
Concepts
Ran
k
________________________Septiembre 2004
AIDS in Brazil
AIDS in BRASIL
00.20.40.60.8
11.2
HIV
Acq
uire
d
HIV
-1
Infe
ctio
n
Sur
viva
l
Epi
dem
iolo
gy,
Ris
k B
ehav
ior
Hos
pita
ls
Pre
vale
nce
Nes
ted
Tra
nsam
inas
es
Tes
tis
Fib
rin T
issu
e
Pur
ified
Pro
tein
T-L
ymph
ocyt
e
Concepts
Ran
k
________________________Septiembre 2004
Comparaciones dinámicas
AIDS Representation
00.20.40.60.8
11.2
Inf
ectio
n
Acq
uire
d
Cen
ters
for
Dia
gnos
is
Per
sons
Adu
lt
Agi
ng
Im
mun
e
Lun
g
Eye
Dia
rrhe
a
Dis
ease
Concepts
Ran
k
________________________Septiembre 2004
Posibles aplicaciones
________________________Septiembre 2004
mapas conceptuales
________________________Septiembre 2004
Mesh 2002 v/s Medline 1999
Thanks to Martin Schmidt and Mario Diwersy(http://www.syynx.de/)
________________________Septiembre 2004
MESH 2002 v/s MEDLINE 2001
Thanks to Martin Schmidt and Mario Diwersy(http://www.syynx.de/)
________________________Septiembre 2004
Vista geográfica+ intesidad = + cercanía al tema
• La producción del país.
• Un tema específico.• Intensidades de
color para representar mayor o menor cercanía al tema en estudio.
________________________Septiembre 2004
Vista geográfica (ii)
________________________Septiembre 2004
Distribución Geográfica
________________________Septiembre 2004
A modo de conclusión y próximos pasos
• Seguir probando el modelo– La tecnología es estable– Los contenidos existen– Se define un espacio que independiza del tipo de
documento y del idioma– Es crucial la construcción/adopción de un vocabulario.
Superado en el área de la salud.
• Aplicar el modelo a contenidos válidos y con un volumen adecuado.
• Estudiar la relación con indicadores tradicionales.• Aplicar el modelo a nivel institucional y en otras
áreas.
________________________Septiembre 2004
¡Muchas gracias!