busquedas avanzadas en internet

31
TORRE ACADEMICA DE MAZATLAN MARCELINO RUIZ CAMACHO

Upload: celestino-nonthe-ramos

Post on 28-Jul-2015

52 views

Category:

Documents


0 download

TRANSCRIPT

TORRE ACADEMICA DE MAZATLAN

MARCELINO RUIZ CAMACHO

Según estimaciones de organismos que estudian la evolución de

la Web, actualmente, hay más de quince mil millones de

páginas Web con información, las cuales crecen a un ritmo de

mas de siete millones de páginas al día.

Cuanto más grande es Internet, cuanto más inmanejable es

el volumen de información que nos rodea, más importante es

la tarea de encontrar lo que buscamos. Quien controla el

mapa, controlará Internet.

Del total de sitios web, el 85 % pertenece a Estados unidos.

Existen aproximadamente, 10 millones de paginas web en español.

Con el objeto de ordenar, clasificar y así localizar los temas que interesan a los usuarios, dentro de esa

gigantesca maraña de información, se han desarrollado ciertos mecanismos automatizados de búsqueda (o

"buscadores de información") que en cuestión de segundos encuentran y presentan al usuario la

información solicitada por el mismo.

Para realizar tan compleja tarea, imposible para cualquier ser humano, los buscadores utilizan un tipo de

software denominado "spiders" ("arañas"). Éstas se deslizan a través de toda la Web visitando millones de

páginas y registrando sus direcciones en grandes bases de datos. A partir de allí, algunos buscadores

envían "robots" a cada una de estas direcciones, los cuales se encargan de almacenar el texto de dichas

páginas.

TELARAÑAS Y ARAÑAS

BUSCADORES

En la actualidad existen mas de 5000 buscadores de información, de los cuales el 10% pertenecen al

ámbito de Latinoamérica.

Obviamente, no todos los buscadores de información son iguales, ni tienen las mismas potencialidades

Diferencias:

1. El tamaño de la base de datos que contiene los índices de búsqueda.

2. La frecuencia de actualización de dichos datos.

3. La lógica de búsqueda, mediante la cual se va acotando la localización del tema solicitado.

4. La rapidez con la cual encuentra la información pedida.

5. La relevancia, con la cual se presenta la información, en orden de importancia.

DIFERENCIAS ENTRE BUSCADORES

RENOVARSE O DESAPARECER

Con más de quine mil millones de páginas Web para revisar y clasificar, además de todos los sitios

nuevos que nacen cada día al ciberespacio, los buscadores no dan abasto en la gestión de

información y se ven obligados a actualizarse permanentemente, refinando sus sistemas de

búsqueda y categorización.

LA LEY DE INTERNET

Hay dos tipos:

Los directorios, que organizan y clasifican la información en forma

jerárquica y estructurada en temas y subtemas. El usuario ingresa desde

un tema general hasta llegar al que le interesa y desde allí acceder a

las paginas que contienen información relativa al tema que busca.

Las búsquedas por palabras clave, que se encargan de rastrear toda la

información disponible sobre el tema solicitado en la base de datos

disponible.

MECANISMOS DE BUSQUEDA

Los buscadores no funcionan en tiempo real. Es decir, cuando ingresamos una palabra, una frase

y apretamos Enter , estos sitios no salen a buscar por la Web a ver si encuentran lo que pedimos.

Lo que hacen es revisar una base de datos razonablemente actualizada de los sitios conocidos. Si

buscaran el dato por la Web real, pasaríamos mucho tiempo esperando los resultados.

NO FUNCIONAN EN TIEMPO REAL

El éxito en la búsqueda depende no solo de la amplitud de la base de

datos del mecanismo de búsqueda, sino del “oficio” del usuario para

hacer su solicitud.

Recuerde:

A BUENAS PREGUNTAS, BUENOS RESULTADOS.

SE NECESITA OFICIO

Parece un error obvio, pero todos empezamos buscando con palabras sueltas, como si las

máquinas o Internet poseyeran la capacidad de leernos la mente y averiguar que cuando

ponemos sociales lo que estamos tratando de decir es que nos gustaría visitar la pagina de la

FACISO; o que cuando ponemos ingeniería lo que deseamos en realidad es ver el programa de

esa carrera en la Universidad… de vaya usted a saber de donde.

PALABRAS SUELTAS ES UN ERROR

La clave para encontrar algo en un índice Web de 2500 millones de páginas, es no usar palabras

sueltas. Esto es así porque una búsqueda fallida no es sólo aquella que produce cero resultados,

sino también la que enumera decenas de miles. Si pone arte o ingeniería en Google le está

pidiendo que liste todos los sitios que en su base de datos contienen la palabra arte o ingeniería .

Es cierto que lo que usted está buscando ( Museo de Arte de Mazatlán o Programa de la carrera

de ingeniería de la Universidad Autónoma de Sinaloa ) se encontrará entre los centenares de

miles de resultados listados. Pero no habrá avanzado ni un paso en su investigación, porque es

tan inútil una lista de 2500 millones de sitios que una de 700.000.

CERO Y DECENAS DE MILES

Lo mejor es ser lo más específico posible. Si busca museos en línea, opte por poner museos en

Internet y se acercará bastante al dato correcto, aunque la lista de resultados todavía será muy

grande (más de 95.000). ¿Por qué no colocar directamente "guía de museos en Internet" ? Al fin

de cuentas, es un titular muy verosímil para un sitio. Pruébelo y obtendrá un éxito raro de

conseguir en el espacio virtual: un solo resultado y, además, perfecto.

Pero en la búsqueda de arriba hay un truco: las comillas. Cuando usted pone un criterio

entrecomillado en un motor de búsqueda (por ejemplo, " pintores impresionistas" ) le está

diciendo que encuentre exactamente esa frase. De otro modo, el buscador listará todas las

páginas que contengan las palabras pintores e impresionistas.

SEA LO MAS ESPECIFICO POSIBLE

BUSCADORES

1. Google 56.9%

2. Yahoo 21.2%

3. MSN Search 8.9%

4. AOL Search 3.2%

EL BUSCADOR MAS POPULAR DEL MUNDO

CUAL ES EL MEJOR BUSCADOR?

Unos hippies contra Bill Gates

Los fundadores de Google, Larry Page y Sergey Brin

GOOGLE VS MICROSOFT

El nombre proviene de un juego de palabras con el término "googol", acuñado por Milton Sirotta, sobrino del matemático norteamericano Edward Kasner, para referirse al número representado por un 1 seguido de 100 ceros. El uso del término refleja la misión de la compañía de organizar la inmensa cantidad de información disponible en la web y en el mundo.

Antes, una pequeña curiosidad:

QUE SIGNIFICA GOOGLE?

ES EL MEJOR BUSCADOR QUE EXISTE EN ESTOS

MOMENTOS EN INTERNET

¿QUE ES GOOGLE?

PARA LOS HISPANOHABLANTES: 'GUGUEL'

¿COMO SE PRONUNCIA 'GOOGLE'?

GOOGLE SE COMENZO A GESTAR EN 1996 EN LA UNIVERSIDAD DE

STANFORD (ESTADOS UNIDOS), POR LOS ENTONCES ESTUDIANTES

SERGEY BRIN Y LARRY PAGE. EN 1998, SE CREO LA EMPRESA GOOGLE INC.

¿COMO COMENZO GOOGLE?

PRINCIPALMENTE, A SU TECNOLOGIA.

BRIN Y PAGE DISEÑARON UN ALGORITMO (PAGE RANK) PARA

PUNTUAR LAS PAGINAS WEB DE INTERNET, QUE ES REALMENTE

EFECTIVO.

TEMBIEN DISPONEN DE UNA DE LAS MAYORES REDES DE

SERVIDORES DE INTERNET.

ADEMAS, HAY TENER EN CUENTA SU DISEÑO MINIMALISTA Y MUY

EFICIENTE.

¿A QUE SE DEBE EL EXITO DE GOOGLE?

1. LA COMPUTADORA MAS CERCANA AL POLO NORTE

2. LA COMPUTADORA MAS ALEJADA DE LA TIERRA

3. GOOGLE: EL CENTRO DE DATOS MAS INTRIGANTE

4. EL PROYECTO CIENTIFICO MAS GRANDE DEL MUNDO: EGEE-

II

5. LA SUPER COMPUTADORA MAS GRANDE DEL MUNDO

6. LA COMPUTADORA MAS PEQUEÑA

7. EL NUCLEO DE LINUX

LAS 7 MARAVILLAS TECNOLOGICAS DEL MUNDO

PAGERANK ES UNA MARCA REGISTRADA Y PATENTADA POR GOOGLE

EL 9 DE ENERO DE 1999 QUE AMPARA UNA FAMILIA DE ALGORITMOS

UTILIZADOS PARA ASIGNAR DE FORMA NUMERICA LA RELEVANCIA DE

LOS DOCUMENTOS (O PAGINAS WEB) INDEXADOS POR UN MOTOR DE

BUSQUEDA.

PAGERANK

PageRank confía en la naturaleza democrática de la web utilizando su vasta

estructura de enlaces como un indicador del valor de una página en concreto.

Google interpreta un enlace de una página A a una página B como un voto,

de la página A, para la página B. Pero Google mira más allá del volumen de

votos, o enlaces que una página recibe; también analiza la página que emite

el voto. Los votos emitidos por las páginas consideradas "importantes", es

decir con un PageRank elevado, valen más, y ayudan a hacer a otras

páginas "importantes". Por lo tanto, el PageRank de una página refleja la

importancia de la misma en Internet.

PAGERANK

EL GOOGLE QUE TODOS CONOCEMOS

PRIMERO, DETENGAMONOS EN DOS GOOGLES

SEGUNDO, UNA PREGUNTA PARA CADA QUIEN

TERCERO, MANOS A LA OBRA