las mathemáticas de búsqueda en internet gil bor, cimat [email protected]

39
Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT [email protected]

Upload: roman-ledesma

Post on 22-Jan-2016

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Las Mathemáticas deBúsqueda en Internet

Gil Bor, [email protected]

Page 2: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 3: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 4: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 5: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 6: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 7: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Información en internet

30,000 millones de páginas web = ~ 1 ZB = ~ libros

¿Cómo encontrar algo?

Page 8: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 9: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Información

1 bit = si/no

1 B = Byte = 8 bit = 1 letra1 kB = 1000 Byte = 1 hoja1 MB = 1000 kB = 1 libro

Page 10: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Información1 MB = 1000 KB = libro1 GB = 1000 MB = libros1 TB = 1000 GB = libros1 PB = 1000 TB = libros

Page 11: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Información1 PB = 1000 TB = libros1 EB = 1000 PB = libros1 ZB = 1000 EB = libros...

Page 12: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Números grandes Internet: 1 ZB = librosCélulas en el cuerpo = Átomos en el cuerpo= Atomos en el universo=

Page 13: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Jorge Luis Borges:“La biblioteca de Babel” (1941)

libros…

(1899-1986)

Page 14: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

“…Cuando se proclamó que la Biblioteca abarcaba todos los libros, la primera impresión fue de extravagante felicidad. Todos los hombres se sintieron señores de un tesoro intacto y secreto. No había problema personal o mundial cuya elocuente solución no existiera…

…se esperó entonces la aclaración de los misterios básicos de la humanidad…

Page 15: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 16: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

“La biblioteca de Babel”

libros…

Page 17: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

…Hay buscadores oficiales, inquisidores…

… toman el libro más cercano y lo hojean, en busca de palabras infames. Visiblemente, nadie espera descubrir nada…

…A la desaforada esperanza, sucedió, como es natural, una depresión excesiva.”

Page 18: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 19: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Búsqueda

1. Rápido2. Documentos más relevantes primeros

Page 20: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Búsqueda

1. Rápido2. Documentos más relevantes primeros

Page 21: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Rápido:

1. Índice invertido2. Muchas computadoras…

Page 22: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Rápido:

1. Índice invertido2. Muchas computadoras…

Page 23: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Índice Invertido

Page 24: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Página 1: “Eso es lo que es" Página 2: “Que es eso" Página 3: “Es una mariposa“

“eso": {1,2} “es": {1,2,3} “lo": {1}

“que": {1,2} “una": {3}“mariposa": {3}

Ejemplo: buscar “Que es eso”{1,2} ∩ {1,2,3} ∩ {1,2} = {1,2}

Índice Invertido

Page 25: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Rápido:

1. Índice invertido2. Muchas computadoras…

Page 26: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Rápido:

1. Índice invertido2. Muchas computadoras…

Page 27: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 28: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 29: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 30: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Búsqueda

1. Rápido2. Documentos más relevantes primeros

Page 31: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Búsqueda

1. Rápido2. Documentos más relevantes primeros

Page 32: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Búsqueda

1. Rápido2. Documentos más relevantes primeros

Page 33: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Documentos más relevantes primeros:

Algoritmo PageRank

Page 34: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Algoritmo PageRank (1998)

calificar páginas web por “popularidad”

Brin + Page (1973- )

Page 35: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

Trabajo matemático previo

Andrey Markov (1856-1922)

Oskar Perron (1880-1975 )

Georg Frobenius (1849 –1917)

Page 36: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 37: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 38: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx
Page 39: Las Mathemáticas de Búsqueda en Internet Gil Bor, CIMAT gil@cimat.mx

¿Cómo funciona el “ranking de popularidad”?

Un caso (muy) simple