presentación lectura tfmi

117
Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web David J. Brenes Martínez Trabajo Fin de Máster de Investigación I Máster en Ingeniería Web - Rama Investigadora Escuela Universitaria en Ingeniería Técnica en Informática de Oviedo 24/Septiembre/2008

Upload: david-j-brenes

Post on 20-Jan-2015

980 views

Category:

Education


1 download

DESCRIPTION

Presentación correspondiente al TFMI del I Máster en Ingeniería Web de la EUITIO. El TFMI abordaba como tema de investigación las características de navegación del usuario así como la detección de las intenciones del usuario y las ayudas que los Sistemas de Recuperación de Información proporcionan.

TRANSCRIPT

Page 1: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Impacto del uso de realimentación colectivasobre la

recuperación de información en la Web

David J. Brenes Martínez

Trabajo Fin de Máster de InvestigaciónI Máster en Ingeniería Web - Rama Investigadora

Escuela Universitaria en Ingeniería Técnica en Informática de Oviedo

24/Septiembre/2008

Page 2: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Estructura

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 3: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

Introducción

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 4: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de todos los SI

Introducción

1 IntroducciónEl problema de todos los SI

El problema de la CienciaEl problema de la Web

Page 5: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de todos los SI

Sobrecarga de Información

Cantidad de información generadaUsuario abrumado

Page 6: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de todos los SI

Necesidad de SRI

ConsejosAncianos

CatálogosÁreas temáticas‘Si te ha gustado...’

Page 7: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Ciencia

Introducción

1 IntroducciónEl problema de todos los SIEl problema de la Ciencia

El problema de la Web

Page 8: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Ciencia

Demasiada Información

ArtículosIdeasProyectosPlazos

Page 9: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Ciencia

Solución de organización

[Berners-Lee(1989)]Red de enlaces entre conceptosProyecto para el CERNSolución local para una organización

Page 10: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Introducción

1 IntroducciónEl problema de todos los SIEl problema de la CienciaEl problema de la Web

Page 11: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Demasiada información

Apertura de la WebDescentralizaciónSolución local aplicada globalmente

Nuevas tecnologíasNuevos modos de acceso

Popularización de la WebNuevos perfiles de usuarioNuevos intereses

Page 12: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Un SRI para el SRI

La Web necesita SRIsDemasiada informaciónDemasiados usuarios

Comprender el sistema¿Cómo acceden los usuarios?¿Cómo se les puede ayudar?

Page 13: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Pero... ¿Cómo navegan los usuarios?

No hay un usuario medio. [Krug(2005)]Futilidad de modelos simplistasNecesidad de modelos más complejos

Page 14: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Pero... ¿Y qué pretenden los usuarios?

Análisis del ‘por qué’ no del ‘cómo’Análisis de temática de búsquedaAnálisis de intenciones

Page 15: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Introducción

El problema de la Web

Pero... ¿Y cómo les estamos ayudando?

Complejos SRIsFormados por iniciativas más pequeñasMúltiples influencias sobre el usuario

Escasos estudios de impactoEstudios más bien teóricosPocas conclusiones sobre los usuarios

Page 16: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Cuestiones planteadas

Cuestiones planteadas

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 17: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Cuestiones planteadas

Características de las consultas

¿Poseen las consultas más populares característicasdistintas a las menos populares?

Diferencias entre consultas.Construcción de modelos de usuario más complejos.

Page 18: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Cuestiones planteadas

Intencionalidad del usuario

¿Puede deducirse la intención de los usuarios enbase a características conductuales, de maneraautomatizada?

Enriquecimiento del modelo de usuario.Enfoque automático.

Page 19: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Cuestiones planteadas

Estudio de SRIs

¿Podemos dividir los SRIs en ayudas más simples demanera que éstas puedan ser objeto de estudio?

Facilidad de análisis.Identificación de funcionalidades.

Page 20: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Cuestiones planteadas

Evaluación de los efectos

¿Pueden diseñarse experimentos que nos permitanevaluar los efectos que éstos tienen sobre losusuarios?

Evaluación de las ayudas.Cambios en el modelo de usuario.

Page 21: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis de las características de los usuarios

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 22: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Estudios Previos

Análisis de las características de los usuarios

3 Análisis de las características de los usuariosEstudios Previos

El problemaAnálisis estratificadoConclusiones

Page 23: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Estudios Previos

En el principio

Perfiles de usuario muy técnicosUso de la web como herramientaExperiencia acumulada en otros SRI

Popularización de la WebAparición de otros perfilesAparición de otros usos de la webDiseños de los primeros SRIs: [Pinkerton(1994)],[Koster(1994)]

Page 24: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Estudios Previos

Cuando miramos a los usuarios

Primeros artículos de análisis de consultas:[Jansen et al.(1998a)], [Silverstein et al.(1998)],[Lau and Horvitz(1999)]

4 años después.Datos de logs de buscadores

Características únicasPocas consultasPocos términosPocos resultadosNo debido a usuarios inexpertos [Cothey(2002)]

Uso de características avanzadasPoco usoA veces incorrectoMás propio de usuarios más expertos[Höscher and Strube(2000)]

Page 25: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Estudios Previos

Conclusiones

SRIs diseñados para ‘otros’ usuariosCaracterísticas diferenciadoras de la Recuperación deInformación en la Web

Page 26: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

El problema

Análisis de las características de los usuarios

3 Análisis de las características de los usuariosEstudios PreviosEl problema

Análisis estratificadoConclusiones

Page 27: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

El problema

Perspectiva muy amplia

Bueno para detectar grandes tendenciasMalo para detectar fenómenos más cercanos al usuario

¿Por qué introducen pocas palabras?¿Por qué comprueban pocos resultados?¿Por qué no hacen uso de búsquedas avanzadas?

Page 28: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

El problema

Otro enfoque

Análisis estratificadoCreación de agrupaciones de consultas y sesionesPosibilidad de hallar tendenciasPosibilidad de elaborar teorías

Page 29: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Análisis de las características de los usuarios1

3 Análisis de las características de los usuariosEstudios PreviosEl problemaAnálisis estratificado

Conclusiones

1Artículo en revisión en Journal on Information Sciences

Page 30: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Criterio de agrupación

15 % de apariciones en el log de consultasSesiones agrupadas según primera consulta

Sesiones detectadas mediante intervalo fijo

Page 31: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Criterio de agrupación: Ejemplo

Grupo Consulta Apariciones Rango Diferencia1 google 332.002 0 02 ebay 139.171 49.800 192.8312 yahoo 130.535 20.875 8.6363 yahoo.com 97.518 20.875 41.6533 mapquest 88.268 14.628 9.2504 google.com 79.990 14.628 17.5284 myspace.com 77.202 11.998 2.7884 myspace 74.362 11.998 5.620

Page 32: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Grupos de consultas

Número de consultas Número de aparicionesde la primera consulta

60 GruposLong-tail en número de consultas y de apariciones

Page 33: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Grupos de sesiones

Número de sesiones Número de aparicionesde la consulta inicial

60 gruposLong-tail en número de apariciones

Page 34: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Relaciones entre grupos

Consultas y sesiones Sesiones y consultas

Relaciones con grupos ‘equivalentes’Relaciones con últimos grupos

Page 35: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Consultas (Longitud)

Más frecuentes las más cortasConsultas de términos comunesRepresentabilidad de estudios anteriores

Page 36: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Consultas (Resultados Visitados)

Número de resultados Posición de resultados

Número: Aumento en las consultas menos frecuentesPosición: Aumento en las consultas menos frecuentes

Page 37: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Consultas (Envíos fallidos)

Comportamiento inestable en primeros gruposDisminución en últimos grupos

Page 38: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Consultas (Coeficiente Navegacional)

Indica cuándo el usuario buscaba una página en concretoMayor coeficiente para las más frecuentes

Page 39: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Sesiones (Longitud)

Número de consultas

Mas consultas en losúltimos gruposPosibles desviacionesen los primeros

Longitud temporal

Disminución en losúltimos

Page 40: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Sesiones (Resultados)

Número de resultados

Aumento en los últimosgrupos

Tiempo por resultado

Tiempo hasta lasiguiente interacciónMayor en las consultasde grupos intermedios

Page 41: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Análisis estratificado

Resultados: Sesiones (Sesiones fallidas)

Mayor en las consultas de grupos intermedios

Page 42: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

Análisis de las características de los usuarios

3 Análisis de las características de los usuariosEstudios PreviosEl problemaAnálisis estratificadoConclusiones

Page 43: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

¿Poseen las consultas más populares característicasdistintas a las menos populares?

Las consultas más populares efectivamente exhiben unascaracterísticas diferentes a las de consultas menospopulares.

Page 44: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

Complejidad: Primeros grupos

Consultas más cortasMenor número de resultados visitadoMayor relación con ciertos resultados (CoeficienteNavegacional)Mayor cotidianeidad y menor complejidad.

Page 45: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

Complejidad: Últimos grupos

Consultas más largasMayor número de resultados visitadoMayor tiempo de sesiónMenos sesiones y envíos sin mirar resultadosResultados más lejanosMayor complejidad en esas consultas

Page 46: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

Importancia de la larga cola

Mayor parte de consultas realizadas pocas vecesMayor complejidad expresada por esas consultasMayor necesidad de ayuda por parte de SRIs

Page 47: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las características de los usuarios

Conclusiones

Ventajas del análisis

Percepción de complejidad de sus metasAnálisis del esfuerzo realizado

Page 48: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis de la intención de los usuarios

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 49: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

Análisis de la intención de los usuarios

4 Análisis de la intención de los usuariosEstudios Previos

AnálisisConclusiones

Page 50: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

¿Qué busca el usuario?

Primer interés básicoConocimiento de temas de búsqueda del usuarioModalidades

Términos o consultas más realizadosTaxonomía de temas de búsqueda

Más utilidad para webmasters y anunciantes

Page 51: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

¿Qué tareas puede realizar?

Acciones a realizar sobre una consultaAdición de términosModificación de términosEliminación de términos

Comprensión de accionesDiseño de herramientas de ayudaAdaptación de los SRIs a los usuarios

Tareas muy generales

Page 52: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

¿Con que intención?

Taxonomias

Intentos de categorización de consultasNo por la temática de la consultaBasado en el comportamiento del usuarioTradición en el área de Recuperación de Información

[Broder(2002)]Navegacionales:google, cnn, apple store

Informacionales:Acelerador de partículas, trenes alemania

Transaccionales:comprar entradas concierto, descarga películastorrent

Clasificación no unívoca

Page 53: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

¿Con que intención?

Intentos de categorizaciónIntentos manuales

Más sencillosMenos completosCaracterísticas léxicas y semánticas

Longitud consulta, significado de los términos...Resultados dependientes del analizadorContradicciones entre ellos

Intentos automatizadosMás completosInferencia de intenciones complicadaCaracterísticas léxicas y semánticas [Jansen et al.(2008)]Características de comportamiento

Page 54: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Estudios Previos

El Problema

Características de búsqueda no informan sobre elescenario de búsqueda del usuario.Las tematicas de búsqueda no informan sobre el tipo debúsqueda.Las tareas realizadas no aclaran las razones.El análisis basado en léxico y semántica introducedesviaciones

Page 55: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Análisis de la intención de los usuarios2

4 Análisis de la intención de los usuariosEstudios PreviosAnálisis

Conclusiones

2Artículo a presentar en Workshop on Information Retrieval

Page 56: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Objetivo

Identificar consultas navegacionales a partir decaracterísticas estadísticasEncontrar criterios de ‘navegabilidad’

Coeficientes NavegacionalesBasados en el comportamiento del usuarioCriterios comparables

Realizar pruebas sobre el log de AOL

Page 57: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Relevancia del resultado mas importante

Comportamiento esperadoAlta concentración de visitas a un resultadoRelación fuerte entre consulta y resultadoLa consulta es el ‘nombre’ del resultadoPlanteado por Lee et al (2005)

Page 58: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Relevancia del resultado mas importante

Formula planteada

NC =Visitas_al_resultado_mas_popular

Visitas_a_resultados

Porcentaje de visitas al resultado más popular.

Page 59: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Relevancia del resultado mas importante

Consultadrudge retortsoulfuldetroitcosmology bookttologin.comjjj’s thumbnailgallery postbeteagleyscufrumsupportcricketnext.commsitf

Consultas con pocasrealizacionesConsultas atípicasInfluencia de lasacciones de usuariosindividuales

Page 60: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Número de resultados distintos

Comportamiento esperado

PolisemiaPara distintos usuarios la misma consulta puede llevar adistintos sitiosDistintas versiones del mismo sitioComportamiento navegacional para cada sitio

Page 61: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Número de resultados distintos

Formula planteada

NC = 1 − Resultados_distintosVisitas_a_resultados

Cuantos más resultados menor caracter navegacional

Page 62: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Número de resultados distintos

Resultados

Consultagoogle

yahoo.commapquestyahooebay

google.combank of americawww.google.comwww.yahoo.comyahoo mail

Consultas más típicasAltos valores de‘navegabilidad’Características léxicasy semánticas similaresa otros estudios

Page 63: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Porcentaje de sesiones navegacionales

Comportamiento esperadoConsultas navegacionales aisladas en una sola sesiónEl resultado satisface la consulta realizada

Page 64: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Porcentaje de sesiones navegacionales

Formula planteada

NC =Numero_de_Sesiones_navegacionales

Numero_de_Sesiones

Porcentaje de sesiones con caracter navegacional

Page 65: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Análisis

Criterios: Porcentaje de sesiones navegacionales

natural gas futurescashbreak.comallstar puzzlestimes enterpriseinstapunditclarksville leafchroniclefirst charter onlinemission viejo nadadorescounty of san joaquinbooking logthomas myspace editorbeta

Consultas atípicasConsultas pococomunesCaracterísticas léxicasy semánticas ‘similares’a otros estudios

Page 66: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Análisis de la intención de los usuarios

4 Análisis de la intención de los usuariosEstudios PreviosAnálisisConclusiones

Page 67: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Comparación

Un resultado concentrando el tráfico suele indicar pocosresultados distintosA la inversa no se cumple

Page 68: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Comparación

Un resultado relevante o un pequeño conjunto de resultados noasegura sesiones navegacionales

Page 69: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Comparación

Un porcentaje alto de sesiones navegacionales suele implicarresultados relevantes y pocos

Page 70: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Combinación de CN

NC = CN_3 ∗ CN_1 + CN_22

Mayor importancia al resultado del análisis de sesionesnavegacionalesCompensación de los dos primeros coeficientes

Page 71: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Combinación de CN

Consulta Coeficiente Mediosoulfuldetroit 0,9964

aol people magazine 0,9940cashbreak.com 0,7894allstar puzzles 0,7832

first charter online 0,7796mission viejo nadadores 0,7758

instapundit 0,7731times enterprise 0,7678

clarksville leaf chronicle 0,7561el canario by the lagoon 0,7511

Page 72: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Características léxicas y semánticas

Algunos resultados presentan esas característicasEl estudio no las buscabaAlgunas consultas no habrían sido detectadas

Page 73: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de la intención de los usuarios

Conclusiones

Conclusiones: Relación entre estadística ycomportamiento

Comportamiento deducido de características estadísticasPosibilidad de evaluación automática de consultasExtensible, en principio, a otros tipos de consultas

Page 74: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis de las ayudas a la navegación

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 75: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Estudios Previos

Análisis de las ayudas a la navegación

5 Análisis de las ayudas a la navegaciónEstudios Previos

ProblemaAnálisisConclusiones

Page 76: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Estudios Previos

Aspectos técnicos

Propuestas de SRIsDesarrollo de ayudasEvaluación de uso

Page 77: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Problema

Análisis de las ayudas a la navegación

5 Análisis de las ayudas a la navegaciónEstudios PreviosProblema

AnálisisConclusiones

Page 78: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Problema

Escasa observación del impacto en los usuarios

De SRIs desarrolladosDe la evolución de la web

Page 79: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Problema

Complejidad de los SRIs

Conglomerado de ayudasDificil discernimiento de responsabilidades

Page 80: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Problema

Disgregación de datos

Necesidad de datos de comportamiento de usuariosMultitud de SRIs con datos almacenados sin coordinaciónSRIs propietarios con datos no accesibles

Page 81: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Análisis de las ayudas a la navegación3

5 Análisis de las ayudas a la navegaciónEstudios PreviosProblemaAnálisis

Conclusiones

3Artículo aceptado en Workshop for Ph.D. Students in Information andKnowledge Management

Page 82: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Objetivo

Taxonomía de AyudasDivisión de SRIs en ayudas atómicasAnalisis de características de las ayudas

Planteamiento de experimentosAlternativas a datos no accesiblesMedición de efecto sobre usuarios, no adecuaciónEfecto sobre usuarios ideales, no reales

Page 83: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Listas de referencias

EjemplosDirectorios Webdel.icio.usBuscadores

Ayuda más básicaDeja constancia de undocumento o aplicaciónweb

Page 84: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Listas de referencias

TamañoSobrecargan alusuarioRequieren otrasayudasnavegacionalesnormalmente (p.ej:clasificación opersonalizacion )Menor impacto de lasobrecarga si la listaes predecible por elusuario

EfectosRevisitación de sitiosweb

Page 85: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Ranking

EjemplosBuscadores

Ordenación de listas deelementos

Basado en criterio de‘calidad’Efecto psicológico deconfianza[Jansen et al.(2007b)]Desánimo trasprimeros resultadosinfructuosos

Page 86: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Ranking

EfectosPocas visitas deresultadosadicionales

Agravado porciertasherramientasConsistente conotros estudios

Revisitación deprimeros resultados

Page 87: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Sugerencias

Ayuda sobre quéintroducir en SRIEjemplos

Tags en del.icio.us obloggerConsultas en Yahooo Google

Efecto psicológico deconfianza

Page 88: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Sugerencias

EfectosRepetición debúsquedasrealizadasMenos variedad deresultados extraidos

Page 89: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Recomendaciones

Ayuda sobre resultadosdel SRI interesantesEjemplos

AmazonGoogle HistoryBarra de navegación

Efecto psicológico deconfianzaCentran la atención delusuario en elementosde su interés

Page 90: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Recomendaciones

EfectosLimitan el área debúsqueda delusuario

Comportamientosde revisitaciónFrustración albuscar cosasdiferentes

Page 91: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Clasificación

EjemplosFlickrLast.fmClusty

Diferenciación de lasáreas de búsquedaEfecto psicológico deconfianza entaxonomías yautomáticasPosible sobrecarga delusuario

Page 92: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Clasificación

EfectosNavegación decategoríasAbandono deconsultasespecíficas

Page 93: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Personalización

EjemplosLast.fmGoogle History

Recomendaciónbasada en perfil deusuario

Registro de accionespasadasFuerte desviación deresultados

Page 94: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Clasificación

EfectosRevisitación deresultadosRestricción del áreade búsquedaPosible frustraciónante necesidad denuevos resultados

Page 95: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Monitorización

Seguimiento denovedades en sitioswebLiberación deobligación derevisitaciónExpresión de interesesdel usuario

Page 96: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Ayudas navegacionales: Monitorización

EfectosMenos revisitaciónMás concentraciónde visitas

Page 97: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Experimentos

Estudios preliminaresExperimentos no realizadosPrimera aproximación

Page 98: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Experimentos

Efectos de RankingComparación de listas de referencias con y sin rankingconocidoListas ordenadas

Buscadores típicosLog de AOL

Listas sin OrdenLogs privados (p. ej. Flickr o del.icio.us)Desarrollo de SRIs propiosUso de APIs de tercerosÁmbitos más cerrados

Comparación de características de las consultas similar alrealizado en este TFMI

Page 99: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Experimentos

Sugerencia de consultas en buscadores

Comparación de las consultas realizadas y las sugeridas

Logs de consultas (AOL)Uso de API’s

Elección de sugerencia

Aspecto más complicado¿Se evalúan todas?Elección de consulta con más resultados en común con larealizada realmenteSimulación de confianza del usuario

Comparación de características de las consultas similar alrealizado en este TFMI

Page 100: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Análisis

Experimentos

Revisita en consultas navegacionales

Analizar costumbres de búsqueda de un usuario

¿Se concentran las búsquedas sobre diversos temas enterminos?

Análisis de cambios a lo largo del tiempo

Page 101: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Conclusiones

Análisis de las ayudas a la navegación

5 Análisis de las ayudas a la navegaciónEstudios PreviosProblemaAnálisisConclusiones

Page 102: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Análisis de las ayudas a la navegación

Conclusiones

Conclusiones

Posibilidad de dividir SRIs en elementos más simples yanalizables

Posibilidad de plantear experimentos a realizar

Estudio en estado menos avanzado que los anteriores

Page 103: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Conclusiones

Conclusiones

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 104: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Conclusiones

Respuestas a las cuestiones planteadas

Conclusiones

6 ConclusionesRespuestas a las cuestiones planteadas

Page 105: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Conclusiones

Respuestas a las cuestiones planteadas

Respuestas

¿Poseen las consultas más populares características distintasa las menos populares? Sí

¿Puede deducirse la intención de los usuarios en base acaracterísticas conductuales, de manera automatizada? Sí

¿Podemos dividir los SRIs en ayudas más simples de maneraque éstas puedan ser objeto de estudio? Sí

¿Pueden diseñarse experimentos que nos permitan evaluar losefectos que éstos tienen sobre los usuarios? Sí

Page 106: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Conclusiones

Respuestas a las cuestiones planteadas

Conclusión general

Es posible obtener información de cómo buscan los usuariosde una manera descriptiva diferenciando escenarios debúsqueda (estratos)

Es posible usar estadísticas para obtener información acercade la intención de los usuarios de modo automático

Esas estadísticas podrían ayudarnos a evaluar el impacto delas ayudas de navegación sobre el comportamiento de losusuarios

Page 107: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Futuras líneas de investigación

Futuras líneas de investigación

1 Introducción

2 Cuestiones planteadas

3 Análisis de las características de los usuarios

4 Análisis de la intención de los usuarios

5 Análisis de las ayudas a la navegación

6 Conclusiones

7 Futuras líneas de investigación

Page 108: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Futuras líneas de investigación

Futuras líneas de investigación

Uso de otros criterios de estratificación de logs

P.Ej: criterios basados en intencionalidad

Posibilidad de obtener otros escenarios de búsqueda

Estratificación de otros logs y comparabilidad

Repetibilidad de los experimentos

Verificación de conclusiones

Page 109: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Futuras líneas de investigación

Futuras líneas de investigación

Combinación de criterios de navegacionalidad

Obtención de un criterio mas unificado

Estudio de otros logs de consultas para realizar comparacionesentre ellos

Análisis de otras intencionalidades del usuario

Análisis de comportamientos esperados de los usuarios

Repetición de experimentos para cada intencionalidadPropuesta para el ‘Workshop on Web Search Click Data’

‘Survey and evaluation of query intent detection methods’Acceso a log de búsquedas Microsoft 2006 RFP.

Uso de intencionalidades del usuario para detección desesiones de búsqueda

Realimentación del algoritmo de detección de sesiones

Prevención de creación de sesioens artificiales

Combinación con otros criterios de segmentación

Page 110: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Futuras líneas de investigación

Futuras líneas de investigación

Estudio más profundo de cada ayuda navegacional

Variaciones

Requisitos

Análisis de interacción entre las ayudas

Realización de experimentos de estudio sobre las ayudasnavegacionales

Planteamiento de nuevos experimentos

Implementación de experimentos ya planteados

Page 111: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Fin

And Now...

Muchas gracias por su atención (y paciencia...)

¿Preguntas?

Page 112: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

T. Berners-Lee.Information management: A proposal, 1989.

Steve Krug.Don’t Make Me Think: A Common Sense Approach to WebUsability, 2nd Edition.New Riders Press, 2nd edition, August 2005.ISBN 0321344758.

Page 113: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

Martijn Koster.Aliweb - archie-like indexing in the web.In First conference on World-Wide Web, pages 175–182,Geneva, Switzerland, 1994. Elsevier Science Publishers B. V.

Brian Pinkerton.Finding what people want: Experiences with the webcrawler.In Second International World Wide Web Conference, 1994.

Page 114: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

Bernard J. Jansen, Amanda Spink, Judy Bateman, and TefkoSaracevic.Real life information retrieval: a study of user queries on theweb.SIGIR Forum, 32:5–17, 1998a.

Craig Silverstein, Monika Henzinger, Hannes Marais, andMichael Moricz.Analysis of a very large altavista query log, 1998.

Page 115: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

Tessa Lau and Eric Horvitz.Patterns of search: analyzing and modeling web queryrefinement.In Proceedings of the seventh international conference on Usermodeling, pages 119–128, Banff, Canada, 1999.Springer-Verlag New York, Inc.

Vivian Cothey.A longitudinal study of world wide web users’information-searching behavior.J. Am. Soc. Inf. Sci. Technol., 53:67–78, 2002.

Christoph Höscher and Gerhard Strube.Web search behavior of internet experts and newbies.Comput. Networks, 33:337–346, 2000.

Page 116: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

Andrei Broder.A taxonomy of web search.SIGIR Forum, 36:3–10, 2002.

Uichin Lee, Zhenyu Liu, and Junghoo Cho.Automatic identification of user goals in web search.In Proceedings of the 14th international conference on WorldWide Web, pages 391–400, Chiba, Japan, 2005. ACM.ISBN 1-59593-046-9.

Page 117: Presentación Lectura TFMI

Impacto del uso de realimentación colectiva sobre la recuperación de información en la Web

Bibliografía

Bibliografía

Bernard J. Jansen, Danielle L. Booth, and Amanda Spink.Determining the informational, navigational, and transactionalintent of web queries.Inf. Process. Manage., 44:1251–1266, 2008.

Bernard J. Jansen, Mimi Zhang, and Ying Zhang.The effect of brand awareness on the evaluation of searchengine results.In CHI ’07 extended abstracts on Human factors in computingsystems, pages 2471–2476, San Jose, CA, USA, 2007b. ACM.