¿cómo funciona google?
DESCRIPTION
Breve introducción al funcionamiento de Google. La presentación es parte de una charla que impartió Fernando Fominaya en el Centro de Competencias de Posicionamiento y Redes Sociales de Treelogic.TRANSCRIPT
1Treelogic S.L.
Centro de Competencias Posicionamiento y Redes Sociales
Fernando Fominaya
29 de julio de 2010
Google: cómo funciona y en qué nos afecta
2Treelogic S.L.
Cómo busca Google
WEB
Crawler Module
Repositorio de páginas
Módulo de indexación
Consulta
Módulo de clasificación
Índice Contenidos
usuario
Índice Estructura
Índice especial
3Treelogic S.L.
Módulos independientes de la consulta
Crawler Module: crea las arañas que peinan la red en busca de páginas web. A partir de una url inicial, el algoritmo va recorriendo urls vinculadas. Arroja dos valores:
• Una lista de urls identificadas.
• La estructura de vínculos de las urls.
1 0
00 1
0
0
0 01 1
1
url1 url2 url4
url1
url2
url4
0 11 1url3
url3
Ejemplo para cuatro urls:
• Cuando una url 1 contiene un hipervínculo a una url 2, la matriz contiene un 1 en (url1/url2).
4Treelogic S.L.
Módulo de Indexación: poda las páginas hasta dejar solo la información fundamental. Tiene especialmente en cuenta títulos, descripciones, hipervínculos, palabras en negrita o en tamaño destacado. La información se guarda en índices. Hay tres principales:
• Índice de contenido: guarda la información relevante del contenido de las páginas.
• Índice de estructura: guarda la información de la estructura de hipervínculos.
• Índice especial: información sobre imágenes, pdfs, etc.
Módulos independientes de la consulta
5Treelogic S.L.
Índice de contenido: guarda los términos que figuran en cada página indexada. Ejemplo:
• Término 1: (ábaco) – url 2,34,543
“
• Término 10: (azuzar) – url 12,23,323,433,825
“
• Término m: (zorro) – url 34,222,323,487,825
Módulos independientes de la consulta
6Treelogic S.L.
Procesado de consultas
Módulo de consultas (Query Module): cuando el usuario introduce la consulta, busca páginas con resultados relevantes.
• La consulta “azuzar zorro”, dará como resultado en el ejemplo anterior las páginas 323 y 825, que son las que tiene los dos términos.
• Muchos buscadores solo llegan hasta aquí. En Google los resultados son pasados al Módulo de clasificación (Ranking Module), que decide la importancia de cada resultado y, por tanto, el orden en el que deben aparecer.
7Treelogic S.L.
Clasificación de resultados relevantes
Módulo de clasificación (Ranking). Clasifica los resultados en función de la:
• Puntuación por contenido (relevancia)
• Puntuación por popularidad (autoridad o PageRank).
8Treelogic S.L.
Puntuación por contenido (relevancia):
• Tiene en cuenta, por ejemplo, si el término buscado está en el título, en los metatags y cuantas veces aparece en el texto.
• Ejemplo: zorro url 323 (1,1,5), 825 (0,0,3). La puntuación por contenido es de 7 para la url 323 y de 3 para la 825.
• Si la búsqueda es de dos términos (“azuzar zorro”), se multiplican las puntuaciones de cada término.
Clasificación de resultados relevantes
9Treelogic S.L.
Clasificación de resultados relevantes
10Treelogic S.L.
Puntuación por popularidad (autoridad o PageRank) de mi página.
• Es la suma de las puntuaciones por popularidad de todas las páginas que señalan a mi url.
• Cuanto más importantes son las páginas a las que está vinculada mi url, más autoridad tiene.
• Hay un factor corrector que penaliza el exceso de vínculos.
• También influye la antigüedad de la url.
• La barra de Google en el navegador da un PageRank aproximado de la página visualizada. El máximo es 10.
Clasificación de resultados relevantes
PageRank
11Treelogic S.L.
Un buen resumen:
12Treelogic S.L.
¿Cómo ha influido Google en el desarrollo de la red?
Antes de Google la web era estática y primaba el volumen.
La importancia de la vinculación de páginas recompensa el intercambio de información y el referenciar las fuentes.
Casi no se puede tener un portal popular si no hay un blog integrado. Se promociona la comunicación bidireccional.
Se puede llegar “arriba” solo con mérito. A menudo encontramos un modesto tweet en primera posición del buscador.
13Treelogic S.L.
Referencias
Referencias:
• PPCBlog
• Bloggingpro
• Inbound Marketing, B. Halligan, D.Shah
• Page Rank and beyond, Langville and Meyer