búsqueda y obtención de información. contenido de esta presentación la información como recurso...
Post on 25-Jan-2016
221 Views
Preview:
TRANSCRIPT
Búsqueda y Obtención de Información
L. Codina - UPF
2
Contenido de esta presentación
La Información como recursoLa saturación informativaBúsquedas avanzadas
Booleanas
Octubre 2012
L. Codina - UPF
3
Entornos
Intensivos en información Académicos e Investigadores
Estudiantes universitarios Doctorando y estudiantes de tercer ciclo Profesores de universidad Sectores I+D+i etc.
Profesionales Historiadores Geografos Humanistas Comunicólogos etc.
Sistemas de información relevantes Motores de búsqueda especializados Bases de datos especializadas
Octubre 2012
L. Codina - UPF
4
La información como recurso - 1
¿Qué es un recurso? Alguna cosa que nos ayuda a alcanzar un objetivo
Octubre 2012
L. Codina - UPF
5
La información como recurso - 2
En el contexto académico Permite establecer el estado de la cuestión Aporta las bases para cualquier investigación Evita “reinventar la rueda” Es el motor de la innovación Pone las bases para procesos de I+D+i competitivos
Octubre 2012
L. Codina - UPF
6
El Problema
Nuestro ecosistema informativo Cada vez es más rico
Más información Más fuentes Más formatos Más tecnologías y canales
Pero el día sigue teniendo 24 horas No podemos consumir toda la información que nos afecta
profesionalmenteCada vez se requieren mejores competencias
informacionales “Somos” la información a la que nos exponemos
Octubre 2012
L. Codina - UPF
7
Las Consecuencias
Es letal Mucha información (ruido) Perder información (silencio)
Necesitamos Solamente información relevante (precisión), pero Toda la información relevante (exhaustividad)
El balance necesario La precisión reduce la exhaustividad Hemos de elegir entre:
Aumentar precisión (y perder exhaustividad) Aumentar la exhaustividad (y perder precisión)
Octubre 2012
L. Codina - UPF
8
Las Soluciones
Necesitamos Conocer las fuentes
Fuentes críticas de cada sector de actividad o rama del conocimiento Saber buscar
Conocer los principios unificadores de la búsqueda Ecuaciones de búsqueda
Uso efectivo de los formularios de búsquedas avanzadas
Octubre 2012
L. Codina - UPF
9
Fuentes: Valoración de Sistemas de Información
Búsqueda avanzada Opciones de parametrización Uso de operadores Utilidades complementarias Facilidad general de uso
Página de resultados Presentación Opciones de ordenación Utilidades complementarias
Relevancia Ranking > ordenación por relevancia Adecuación de la respuesta a la necesidad del usuario
Octubre 2012
L. Codina - UPF
10
Tipos de búsqueda
SimpleAvanzada
ParametrizadaFormas de expresión
Sintaxis directa Formulario (asistida)
Octubre 2012
L. Codina - UPF
11
Búsqueda simple
Palabra(s) clave(s) Un único término
Ejemplos: web Problema: ruido
Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) Ejemplos: web móvil Problema: falsas coordinaciones
Frase Una frase o una palabra clave compuesta rodeada por comillas
Ejemplos: “la web móvil y los medios de comunicación” Problema: silencio
Recomendación general Uso de búsquedas avanzadas
Octubre 2012
L. Codina - UPF
12
Búsquedas avanzadas
Booleanas
Octubre 2012
L. Codina - UPF
13
Parametrizadas
Palabras claveRestricción por campos o parámetrosLos más habituales
Título Tema Fecha de publicación Autor Lengua
Ejemplo Título: “cine musical” Entre: 1960 y 1980
Octubre 2012
L. Codina - UPF
14
Parametrizadas
Octubre 2012
Catálogos:Catálogo Athenea de la UPO http://athenea.upo.es/REBIUN http://rebiun.absysnet.com/ Bases de datos:ISOC del CSIC En http://athenea.upo.es/ buscar ISOCDialnet: http://dialnet.unirioja.es/
Buscadores académicos:SCIRUS http://www.scirus.com/
L. Codina - UPF
15
Ejemplo: Scirus
Octubre 2012
L. Codina - UPF
16
Booleanas - 1
Basada en álgebra de BooleOperadores principales
AND OR NOT
Forma simple t1 OP t2 Dónde:
t1 es una palabra clave OP es uno de los operadores principales (AND, OR, NOT)
Concepto de ecuación t1 OP t2 = conjunto de documentos
Octubre 2012
L. Codina - UPF
17
Ejemplo: Scirus
Búsqueda boolena simple
Octubre 2012
L. Codina - UPF
18
Booleanas - 2
Forma compuesta (t1 OP t2) OP (t3 OP t4) Ejemplos
(cine OR vídeo) AND (ayudas OR becas) (sitcom OR “comedia de situación”) AND (niños OR adolescentes)
Octubre 2012
L. Codina - UPF
19
Booleanas - 3
Uso AND > reduce resultados y aumenta precisión OR > aumenta resultados y reduce precisión NOT > reduce resultados y aumenta precisión
Balance: AND > aumenta precisión pero elimina información OR > aumenta resultados pero incrementa el ruido NOT > reduce el ruido pero elimina información
Octubre 2012
L. Codina - UPF
20
Cuadro resumen
Operador Resultados Precisión Ruido
AND - + -OR + - +NOT - + -
Octubre 2012
L. Codina - UPF
21
Problemas - 1
AND > Falsamente intuitivo No corresponde necesariamente con el uso del “y” gramatical Ejemplo: “necesito información sobre la obras de teatro y novelas
que han sido adaptadas para cine y televisión” Traducción booleana incorrecta:
(teatro AND novela) AND (cine AND televisión) Problema: el usuario perderá información muy relevante
Traducción booleana correcta: (teatro OR novela) AND (cine OR televisión) Ventaja: el usuario consigue una gran precisión sin pérdida de
información
Octubre 2012
L. Codina - UPF
22
Búsquedas Combinadas
Combinan ecuaciones Parametrizadas Booleanas
Ejemplo (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-
2012) Interpretación: buscamos artículos sobre la web móvil y la
publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años.
Octubre 2012
L. Codina - UPF
23
Ejemplo: CSIC
Formulario de búsqueda combinada en CSIC
Octubre 2012
L. Codina - UPF
24
Problemas - 2
OR Anti intuitivo
término 1 o bien término 2, o ambos cuantos más términos, más ruido, no menos
En la lengua natural, la partícula “O” puede tener dos significados: Incluyente Excluyente
Cómo operador booleano siempre es incluyente
Octubre 2012
L. Codina - UPF
25
Problemas 3
NOT Anti intuitivo Puede destruir información: elimina por igual información relevante y
no relevanteEjemplo: “necesito información sobre publicidad de
refrescos, pero siempre que sean bebidas para adultos”Con la ecuación: (refrescos AND publicidad) NOT jóvenes
Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos”
Octubre 2012
L. Codina - UPF
26
Ejercicio 1
Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?:a) (becas AND ayudas) AND (cine AND vídeo)b) (becas OR ayudas) AND (cine OR vídeo)
Octubre 2012
L. Codina - UPF
27
Ejercicio 2
Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?:a) perros AND gatosb) perros OR gatos
Octubre 2012
L. Codina - UPF
28
Ejercicio 3
¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?:• (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos))
Octubre 2012
L. Codina - UPF
29
Ejercicio 4
¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM”
Octubre 2012
L. Codina - UPF
30
Ejemplo de sistemas relevantes
Motores académicos Scirus Google Scholar
Bases de datos académicas (multidisciplinares) Dialnet CSIC
Bases de datos profesionales (Humanistas) Historical Abstracts Fondo antiguo de la USE: http://fondosdigitales.us.es/ Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ Cartoteca Digital http://cartotecadigital.icc.cat/ Portal de Humanidades Liceus
http://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 Acceso a Pares http://pares.mcu.es/ Europeana http://www.europeana.eu/portal/error.html Museos en línea <http://museusenlinia.gencat.cat/>. Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol
Octubre 2012
top related