tobias trabajo de fuentes de informatica

8
1) Un buscador es una herramienta de búsqueda en internet que utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los ducumentos referenciados en ellas. 2) Sus elementos son: Un robot Un motor de indixación Los índices Un motor de búsqueda Un robot : Es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita. Un motor de indixación : Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación. Los índices : Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella. El motor de búsqueda : Es el encargado de procesar las consultas recibidas por los usuarios, para lo cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Finalmente los

Upload: tobias-trillo

Post on 12-Apr-2017

127 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Tobias trabajo de fuentes de informatica

1)  Un buscador es una herramienta de búsqueda en internet que utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los ducumentos referenciados en ellas.

2) Sus elementos son:Un robotUn motor de indixaciónLos índicesUn motor de búsqueda

Un robot: Es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita.

Un motor de indixación: Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.

Los índices: Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella.

El motor de búsqueda: Es el encargado de procesar las consultas recibidas por los usuarios, para lo cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario los resultados obtenidos. 

3) Entre los buscadores más importantes se encuentran:

Google (http://www.google.com.ar): el más utilizado.  Lycos(http://www.lycos.com/): un portal web que incluye un buscador que surgió como un proyecto de desarrollo de un motor de búsqueda.

 Bing(http://www.bing.com/): anteriormente Live Search, Windows Live Search y MSN Search, es un buscador Web de Microsoft.

Page 2: Tobias trabajo de fuentes de informatica

4)Los metabuscadores Son “buscadores en buscadores”, es decir, son servidores web querealizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información. Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.

  5) Los pasos en el funcionamiento de un metabuscador son los siguientes:

a) El usuario realiza su petición al metabuscador. b) El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud. c) Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet. d) Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos. e) El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario

6) Entre los metabuscadores más importantes se encuentran:

 Metacrawler (http://www.metacrawler.com/) /Zoo(http://www.zoo.com/) Metacrawler fue uno de los primeros metabuscadores disponibles para los usuarios. La empresa denominada Go2Net dueña de su franquicia fue comprada por InfoSpace o Blucora y desde marzo redirecciona a http://www.zoo.com/(nuevo nombre e imagen del metabuscador). Pero si se siente nostalgia todavía es posible acceder al original en el Reino Unido: http://www.metacrawler.co.uk/  

Page 3: Tobias trabajo de fuentes de informatica

iBoogie(http://www.iboogie.com/) Realiza búsquedas organizadas en “cluster”(conjuntos o conglomerados de ordenadores unidos entre sí normalmente por una red de alta velocidad y que se comportan como si fuesen una única computadora) y tiene un motor muy potente. Además, permite añadir pestañas solicitando buscar en bases de datos concretas que tienen a disposición del usuario y posee una búsqueda avanzada (http://iboogie.com/advanced_web.asp)  Ixquick (http://www.ixquick.com/esp/) El primer metabuscador que se ocupó de proteger la privacidad de los usuarios sin registrar su proceso de búsqueda y su dirección de IP. Dogpile(http://www.dogpile.com/) Es un metabuscador que retorna las búsquedas desde los motores About, Ask.com, FinWhat, Google, LookSmart, MSN Search, Teoma, Yahoo!, Bing y otros buscadores populares, incluyendo de audio y video.

7)   Los directorios organizan la información por medio de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de los diferentes sitios que han sido indexados.

8) Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de selección y categorización jerarquizada por parte de los editores.

9)  Entre los más buscados estan: 

Yahoo (http://ar.search.yahoo.com/) El equipo de Yahoo! se encargan de visitar, analizar y evaluar los sitios web y organizarlos según su contenido en categorías y/o subcategorías, como por ejemplo Educación y Formación, Salud, Gastronomía, Viajes, etc... como si de una gran biblioteca virtual se tratase. Las categorías del Directorio van de lo general a lo más específico.

Page 4: Tobias trabajo de fuentes de informatica

 DMOZ (http://www.dmoz.org/World/Español/) El Open Directory Project (ODP), también conocido como DMoz (por directory.mozilla.org su nombre de dominio original) es un proyecto colaborativo multilingüe, en el que editores voluntarios listan y categorizan enlaces a páginas web.Cualquier persona puede sugerir un enlace en una categoría determinada, que luego ha de ser aprobada por un editorEl proyecto está dividido en varias ramas según el idioma, y las categorías de páginas se organizan jerárquicamente dentro de cada una de las ramas. 

Portal SEO (http://www.portal-seo.com/directorio- web.php) Dedicado al SEO (Search Engine Optimization) es decir al posicionamiento en buscadores u optimización en motores de búsqueda, un proceso que busca mejorar la visibilidad de un sitio web en los resultados orgánicos de los diferentes buscadores.

Tabla comparativa

Herramientas

Resultados

Google (www.google.com.ar)

Page 5: Tobias trabajo de fuentes de informatica

Bing (www.bing.com)

InfoSpace (http://msxml.excite.com/)

Ixquick (https://www.ixquick.com/esp/)

Page 6: Tobias trabajo de fuentes de informatica

Yahoo (yahoo.com.ar)

1) ¿Se obtuvieron los mismos resultados? No, porque cada fuente es diferente

2) ¿ Por qué piensan que esto pasa? Porque los usuarios “clickean” diferentes sitios en diferentes fuentes

3) ¿ Encontraron alguna coincidencias en los resultados? Si,porque tratan de lo mismo

4) ¿ Por qué piensan que estos sitios están entre los resultados de herramientas diferentes? Porque cada fuente tiene distintas preferencias

Autores: Tobias Trillo y Alessandro Sallucci