búsqueda y obtención de información. contenido de esta presentación la información como recurso...
TRANSCRIPT
Búsqueda y Obtención de Información
L. Codina - UPF
2
Contenido de esta presentación
La Información como recursoBúsquedas avanzadas
Booleanas
Octubre 2013
L. Codina - UPF
3
Entornos
Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas
Octubre 2013
L. Codina - UPF
4
La información como recurso - 1
¿Qué es un recurso? Alguna cosa que nos ayuda a alcanzar un objetivo
Octubre 2013
L. Codina - UPF
5
Las Consecuencias
Es letal Mucha información (ruido) Perder información (silencio)
Necesitamos Solamente información relevante (precisión), pero Toda la información relevante (exhaustividad)
Octubre 2013
L. Codina - UPF
6
Las Soluciones
Necesitamos Conocer las fuentes
Fuentes críticas de cada sector de actividad o rama del conocimiento Saber buscar
Conocer los principios unificadores de la búsqueda Ecuaciones de búsqueda
Uso efectivo de los formularios de búsquedas avanzadas
Octubre 2013
L. Codina - UPF
7
Búsqueda simple
Palabra(s) clave(s) Un único término
Ejemplos: web Problema: ruido
Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) Ejemplos: web móvil Problema: falsas coordinaciones
Frase Una frase o una palabra clave compuesta rodeada por comillas
Ejemplos: “la web móvil y los medios de comunicación” Problema: silencio
Recomendación general Uso de búsquedas avanzadas
Octubre 2013
L. Codina - UPF
8
Búsquedas avanzadas
Booleanas
Octubre 2013
L. Codina - UPF
9
Parametrizadas
Palabras claveRestricción por campos o parámetrosLos más habituales
Título Tema Fecha de publicación Autor Lengua
Ejemplo Título: “cine musical” Entre: 1960 y 1980
Octubre 2013
L. Codina - UPF
10
Parametrizadas
Catálogos:Catálogo Athenea de la UPO http://athenea.upo.es/REBIUN http://rebiun.absysnet.com/ Bases de datos:ISOC del CSIC En http://athenea.upo.es/ buscar ISOCDialnet: http://dialnet.unirioja.es/
Buscadores académicos:SCIRUS http://www.scirus.com/
Octubre 2013
L. Codina - UPF
11
Ejemplo: Scirus
Octubre 2013
L. Codina - UPF
12
Booleanas - 1
Basada en álgebra de BooleOperadores principales
AND OR NOT
Forma simple t1 OP t2 Dónde:
t1 es una palabra clave OP es uno de los operadores principales (AND, OR, NOT)
Concepto de ecuación t1 OP t2 = conjunto de documentos
Octubre 2013
L. Codina - UPF
13
Ejemplo: Scirus
Búsqueda boolena simple
Octubre 2013
L. Codina - UPF
14
Booleanas - 2
Forma compuesta (t1 OP t2) OP (t3 OP t4) Ejemplos
(cine OR vídeo) AND (ayudas OR becas) (sitcom OR “comedia de situación”) AND (niños OR adolescentes)
Octubre 2013
L. Codina - UPF
15
Booleanas - 3
Uso AND > reduce resultados y aumenta precisión OR > aumenta resultados y reduce precisión NOT > reduce resultados y aumenta precisión
Balance: AND > aumenta precisión pero elimina información OR > aumenta resultados pero incrementa el ruido NOT > reduce el ruido pero elimina información
Octubre 2013
L. Codina - UPF
16
Cuadro resumen
Operador Resultados Precisión Ruido
AND - + -OR + - +NOT - + -
Octubre 2013
L. Codina - UPF
17
Problemas - 1
AND > Falsamente intuitivo No corresponde necesariamente con el uso del “y” gramatical Ejemplo: “necesito información sobre la obras de teatro y novelas
que han sido adaptadas para cine y televisión” Traducción booleana incorrecta:
(teatro AND novela) AND (cine AND televisión) Problema: el usuario perderá información muy relevante
Traducción booleana correcta: (teatro OR novela) AND (cine OR televisión) Ventaja: el usuario consigue una gran precisión sin pérdida de
información
Octubre 2013
L. Codina - UPF
18
Búsquedas Combinadas
Combinan ecuaciones Parametrizadas Booleanas
Ejemplo (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-
2012) Interpretación: buscamos artículos sobre la web móvil y la
publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años.
Octubre 2013
L. Codina - UPF
19
Ejemplo: CSIC
Formulario de búsqueda combinada en CSIC
Octubre 2013
L. Codina - UPF
20
Problemas - 2
OR Anti intuitivo
término 1 o bien término 2, o ambos cuantos más términos, más ruido, no menos
En la lengua natural, la partícula “O” puede tener dos significados: Incluyente Excluyente
Cómo operador booleano siempre es incluyente
Octubre 2013
L. Codina - UPF
21
Problemas 3
NOT Anti intuitivo Puede destruir información: elimina por igual información relevante y
no relevanteEjemplo: “necesito información sobre publicidad de
refrescos, pero siempre que sean bebidas para adultos”Con la ecuación: (refrescos AND publicidad) NOT jóvenes
Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos”
Octubre 2013
L. Codina - UPF
22
Ejercicio 1
Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?:a) (becas AND ayudas) AND (cine AND vídeo)b) (becas OR ayudas) AND (cine OR vídeo)
Octubre 2013
L. Codina - UPF
23
Ejercicio 2
Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?:a) perros AND gatosb) perros OR gatos
Octubre 2013
L. Codina - UPF
24
Ejercicio 3
¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?:• (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos))
Octubre 2013
L. Codina - UPF
25
Ejercicio 4
¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM”
Octubre 2013
L. Codina - UPF
26
Ejemplo de sistemas relevantes
Motores académicos Scirus Google Scholar
Bases de datos académicas (multidisciplinares) Dialnet CSIC
Bases de datos profesionales (Humanistas) Historical Abstracts Fondo antiguo de la USE: http://fondosdigitales.us.es/ Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ Cartoteca Digital http://cartotecadigital.icc.cat/ Portal de Humanidades Liceus
http://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 Acceso a Pares http://pares.mcu.es/ Europeana http://www.europeana.eu/portal/ Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol
Octubre 2013