4 1 buscadores de informacion
TRANSCRIPT
Pág
ina1
TECNOLÓGICO DE ESTUDIOS SUPERIORES
DE JOCOTITLÁN
Ingeniería en Gestión Empresarial
Software de Aplicación Ejecutiva
Unidad 4:Internet
4.1: Buscadores de Información
Docente: Ing. Armando Barrios Lovera
Alumno: José Alfonso García Molina
Grupo: IG-202
FECHA: 23 DE MAYO DEL 2013
Pág
ina2
ÍNDICE
INTRODUCCIÓN 3
CAPITULO I
BUSCADOR
1.1 Buscador 4
1.1.1 Historia. 4
1.1.2 Definición de buscador. 5
1.1.3 Función de los buscadores. 6
1.1.4 Objetivo de los buscadores. 6
1.1.5 Clasificación de los buscadores. 7
1.1.6 Tipos de buscadores. 8
1.1.7 Componentes de un buscador. 8
CAPITULO II
BUSCADORES DE INFORMACIÓN
2.1 Técnicas y estrategias de búsqueda. 10
2.2 Algunos consejos para la búsqueda. 11
2.3 Términos para acotar la búsqueda. 12
2.4 Los buscadores más actuales y los más conocidos 12
Preguntas 15
Referencias bibliográficas y cibergráficas. 18
Pág
ina3
INTRODUCCIÓN
En esta investigación, se encontrará lo más relevante información sobre los
buscadores de información, detallando su definición y concepto habitual que se
conoce de “buscador”.
Conociendo los conceptos más fundamentales, se localizara cuál es su función de
un buscador, así como su clasificación, su objetivo principal y los tipos de
buscadores que nosotros nos podemos encontrar en internet.
Al igual, se adentrará a fondo cual son los componentes de los buscadores; donde
se definirá sus mecanismos, como los los robots de rastreo, algoritmo de
indexación y el interfaz, ya que estos elementos son fundamentales, que nos
ayudan a generar nuestra búsqueda y encontrar la información que nosotros
requerimos.
Ya que también se mostraran cuales son algunas técnicas y estrategias, para
lograr una buena búsqueda por internet. Al igual que algunos consejos para ser
más fácil nuestra búsqueda.
Al final de esta investigación se darán a conocer algunos buscadores de
información, ya que estos buscadores son los más importantes y más actuales del
mundo. Por lo que hay muchas formas y herramientas que nos ayudan a lograr
una excelente búsqueda, por lo que hay que hay que considerar que no solo
existe un solo buscador, si no miles.
Pág
ina4
CAPITULO I
BUSCADOR
1.1 Buscador
1.1.1 Historia de los buscadores
1994:
EInet Galaxy--------Directorio de 1994
El primer directorio como tal y como ahora lo conocemos en la actualidad .
En abril de 1994 David Filo y Jerry Yang crearon Yahoo!. Comenzó como un
directorio, por lo que tuvo que evolucionar incorporando un buscador para ese
directorio
20 de abril de 1994
Brian Pinkerton presento WebCrawlerEn realidad este buscador era de escritorio
pero tiempo después ya era un buscador en un robot de la red
Dos años después; en 1996
El proyecto Google comienza a desarrollarse en enero de 1996 Sergey Brin y
Larry Page. Hay que destacar dos razones por las que Google se hizo muy
interesante: una interfaz muy clara y sencilla (como la de AltaVista en sus inicios)
y unos resultados muy relevantes
Pág
ina5
Ocho años después:
En marzo de 2004 algunos buscadores comenzaron a utilizar la base de datos de
Yahoo!
Comenzaron a aparecer nuevos proyectos muy interesantes. Uno de ellos es
Nutch, un motor de búsqueda en código abierto hecho por Java. Aunque su
desarrollo es costoso, ha conseguido el apoyo de Yahoo!
En noviembre de 2004, MSN Search y de la mano de Christopher Payne y
Oshoma Momoh pusieron en marcha una primera fase publicada del motor de
Microsoft, que se hizo publicada el 20 de enero del 2005. El 1 de noviembre de
2005 se presentaba la plataforma Windows Live que sería la nueva interfaz del
motor de búsqueda.
En 2006 y 2007
Hakia y Powerset motor de búsqueda semántica
La búsqueda semántica es un proceso utilizado para mejorar la búsqueda
por Internet mediante el uso de datos de las redes semánticas para desambiguar
las consultas y el texto de la webcon la finalidad de encontrar los resultados más
relevantes en relación a la demanda del usuario.
1.1.1 Definición de buscadores
Los buscadores son los sitios más frecuentados de internet, y por lo
general, el mejor punto de partida de todo recorrido por la red.
A los buscadores también se les denomina web “crawlers” ya que van
“avanzando” por la red (crawl, en inglés, “ir a rastras”.
Un buscador o motor de búsqueda es un sistema o
aplicación informática que permite la búsqueda de todo tipo de términos y
Pág
ina6
palabras clave a partir del desarrollo de índices de archivos almacenados
en servidores web.
La utilización de buscadores web se ha convertido en uno de los principales
motivos de uso de Internet, facilitando la obtención de información y el trabajo de
fondo investigativa pero también con fines sociales, recreativos y personales.
Los buscadores poseen enormes bases de datos que contienen información
referente a páginas web. Estas bases de datos se generan por las altas de
usuarios que han creado sus páginas web (esto equivaldría a poner tus datos en
un listín telefónico). En muchos buscadores, si el creador de la página no se da de
alta en el buscador, la página no aparecerá. Para las empresas es muy importante
promocionar sus páginas en los buscadores para que la gente las encuentre
fácilmente.
Los buscadores son o bien motores de búsqueda, es decir, bases de datos que
incorporan nuevos términos en forma constante y automática, o bien, índices
temáticos, sistemas que requieren de un componente humano y manual para el
ingreso y asignación de sitios web a palabras clave y categorías.
1.1.2 Función de los buscadores
Proporcionar al usuario información sobre todas las páginas Web relacionado con
el tema que le hemos indicado.
El internet es algo tan complejo que siempre es difícil encontrar exactamente la
información que busca.
Web spiders. Estas arañas (spiders, en inglés) son programas que registran la red
buscando documentos mientras usted va siguiendo hipervínculando de las
páginas web.
Los buscadores utilizan a menudo esas “arañas”. Cuando una de ellas descubre
una página relativa a la temática indicada, aparece un “agente de software”, que
envía el documento y, además, información sobre él y un software de indexación.
El software de indexación recibe del agente los documentos y las direcciones
URL.
Si busca información a través de un buscador, lo normal es introducir una palabra
clave relativa al área o al tema que le interese. La base de datos del buscador es
examinada según los datos que usted haya introducido.
Pág
ina7
1.1.3 objetivos de los buscadores
Encontrar los documentos que contengan las palabras claves introducidas.
Habitualmente localiza las páginas Web que mejor se adapten a las palabras
introducidas.
1.1.4 Clasificación de los buscadores
Los buscadores se pueden clasificar a través de navegación y el otro método es
buscando por medio de un buscador, el método de navegar es ir abriendo ligas en
las páginas, estas ligas son creadas por otros usuarios, sin embargo, para el
método de buscar se utiliza forzosamente un buscador.
CLASIFICACIÓN DE LOS BUSCADORES
1. ÍNDICES O DIRECTORIOS: Son los primeros buscadores que aparecieron. Un
directorio permite buscar información separando los temas en categorías
generales las cuales se dividen en subcategorías cada vez más específicas.
2. MOTORES DE BUSQUEDA: Se trata de la evolución natural de los directorios.
Permite localizar información al escribir con las palabras desplegando una lista
de páginas web que contiene datos relacionados con las palabras que se han
escrito.
3. METABUSCADORES: También llamados buscadres múltiples ya que realizan
varias búsquedas simultaneas en los demás buscadores y muestran los
resultados ordenados de acuerdo a cada buscador y el más conocido
es METRACRAWLER.
Metacrawler, uno de los meta buscadores más potentes de
internet ofrece un diseño renovado y una mejor organización
de los resultados de búsqueda gracias al nuevo sistema que
Pág
ina8
permite agrupar automáticamente los resultados bajo
determinadas categorías. El servicio avanzado de búsqueda
permite utilizar operadores booleanos o acotar pesquisas por
fecha, idioma, dominio o restringir los contenidos para
adultos.
4. BUSCADORES ESPECIFICOS: Son aquellos que solo contienen información
sobre un tema concreto es importante resaltar que utilizan índices
especializados para acceder a la información de una manera más específica y
fácil.
1.1.5 Tipos de buscadores
BUSQUEDAS BASICAS: Se llevan a cabo al escribir lo que se desea encontrar en
el cuadro de texto de los buscadores. A veces es necesario ser lo más específico
posible al momento de escribir para obtener el resultado deseado.
BUSQUEDAS AVANZADAS: Los mecanismos de la búsqueda nos permiten
utilizar palabras especiales llamadas operadores lógicos u operadores booleanos
para modificar su criterio de búsqueda y existen 3 tipos de operadores lógicos que
se utilizan en ocasiones en la búsqueda de la web y es: Y (AND), O (OR), y NO
(NOT).
1.1.6 Componentes de un buscador
Los tres componentes de un buscador
Un robot de rastreo, Un programa o algoritmo de indexación
interfaz de búsqueda.
Los robots de rastreo
Los robots de rastreo tienen otros nombres: arañas de rastreo, crawlers o bots
rastreadores. Pero en definitiva son simplemente programas automatizados que
Pág
ina9
recorren la web, buscando sitios web y las páginas que los componen, y en
general todos los archivos que pueda encontrar en la red.
Los robots de rastreo recorren la web y visitan los diferentes sitios web de una
manera generalmente aleatoria. Así pues, las visitas de las arañas rastreadoras
pueden ser ocasionales o muy frecuentes. Pero aun cuando sean ocasionales las
visitas, estas siempre llegarán y verificarán cambios en el contenido de la web o
de las páginas, modificaciones, eliminaciones, adiciones, etc.
La araña o robot de rastreo de Google se llama Googlebot, y en realidad no es
una sola araña, es decir, no hay un único Googlebot, sino varias copias del mismo
que se originan en diferentes máquinas de Google.
La araña de rastreo de Yahoo, tiene el nombre de Slurp, y la araña de rastreo de
Bing recibe el nombre de MSNBot por sus origines en el ahora extinto Microsoft
Live Search.
El trabajo de todos estos rastreadores es, de manera ideal, rastrear y recolectar
información de todas las páginas y archivos que existan en la web, sin embargo,
esto no siempre es así, de hecho de una manera indeseablemente frecuente son
incapaces de encontrar y rastrear el contenido total de muchos sitios web. En
otros casos, se les prohíbe rastrear y recopilar información. Son dos casos
diferentes: incapacidad y prohibición.
Hasta hace poco, los rastreadores sólo podían entender unos pocos tipos de
archivos, pero en la actualidad, casi todos los tipos de archivos pueden ser
accedidos y rastreados. Así, por ejemplo, evidentemente los archivos tipo html son
los primordiales, pero por ejemplo Googlebot es capaz de rastrear archivos pdf,
ps, rss, atom, dwf, kml, kmz, wk1 al wk5, wks, wku, lwp, mw, xls, ppt, doc, wkis,
wps, wdb, wri, odt, rtf, swf, ans, txt, wml, wap, jsp, asp y por supuesto php.
La Indexación de los resultados de búsqueda
La indexación de los motores de búsqueda consiste en la recolección, evaluación,
agrupación y almacenamiento de información de forma tal que se facilite y
garantice un acceso rápido y certero de su contenido. La búsqueda en estos
índices garantizará que puede recuperarse información relevante según el criterio
empleado.
La mayoría de los buscadores actualmente contienen en sus índices, miles de
millones de documentos indexados, probablemente Google sea el que posee la
mayor cantidad.
Pág
ina1
0
La Interfaz de búsqueda
La puerta de acceso a las páginas de resultados de los buscadores es la interfaz
de búsqueda. Todos y cada uno de los motores de búsqueda, llámese Google,
Bing, Yahoo, Ask, etc., tienen su propia y particular interfaz de búsqueda, desde
las minimalistas hasta aquella que constituyen verdaderos portales web, en los
cuáles la búsqueda es simplemente un elemento más.
Al parecer, a la mayoría de las personas les interesaba una interfaz de búsqueda
simple y exclusivamente dedicada a servir sólo como puerta de acceso a lo que
estaba buscando, de ahí que Google inicialmente terminó siendo la opción
elegida, aunque obviamente no fue ese el único motivo.
Se puede decir que la interfaz de búsqueda, se presenta bajo dos formatos: antes
de cualquier búsqueda y con los resultados de las búsquedas.
Antes de la búsqueda, muchos buscadores sólo muestran la casilla para introducir
nuestra palabra o frase de búsqueda, y con los resultados que esta devuelve la
página se puebla con enlaces patrocinados, o sea, aquellos que son promovidos y
pagados por algún anunciante, y el resto de resultados o enlaces que
corresponden a sitios que resultan relevantes al criterio de búsqueda usado, a
estos se denomina resultados de búsqueda orgánicos. Cada uno de los
buscadores usa algoritmos de calificación propios que, evaluando los diferentes
aspectos que considera pertinentes para un criterio de búsqueda determinado,
presenta los resultados de mayor a menor relevancia, de arriba a abajo en la
página, y así luego en las siguientes. Cada buscador ofrecerá un resultado de
búsqueda diferente al de otro buscador.
En Resumen de los componentes de un buscador
Un buscador está formado fundamentalmente por tres componentes. El primero de
ellos recoge información, se llama robot, spider o crawler y navega por internet de
forma totalmente automática. Toda montaña de información encontrada, el
“índice”, se envía a la administración. El segundo elemento es el software de
indexación, que estructura y hacen examinables los datos trasmitidos. El tercer y
último componente examina la consulta realizando por el usuario y envía el
término de búsqueda al ordenador con los datos para, desde ahí, presentar al
usuario los resultados de su búsqueda.
CAPITULO II
BUSCADORES DE INFORMACIÓN
Pág
ina1
1
2.1 Técnicas y estrategias de búsqueda.
TÉCNICAS DE BÚSQUEDA.
Planificar bien la búsqueda y saber que cada búsqueda es diferente.
Mirar la ayuda que cada buscador ya que hay pequeñas diferencias entre
uno y otro.
Acotar los términos de búsqueda que los operadores booleanos o de
cercanía, comodines, etc.
Usar si se puede varios búscadores.
Si es posible y lo permite la búsqueda hacer las acotaciones desde
búsqueda avanzada.
ESTRATEGIAS DE BÚSQUEDA.
Utilización de operadores booleanos: AND (+), NOT (-), NEAR.
Usar expresiones literarias, se ponen entre comillas
Uso de comodines: ejemplo. “comercio electrónico” + conta.
El uso de mayúsculas y minúsculas.
Acentos y ñ. es mejor consultar la ayuda de cada buscador
2.2 Algunos consejos para la búsqueda
Sugerencia: internet cuenta con diferentes servidores WWW que mantienen
contacto con todos los grandes buscadores.
Solo debe introducirse un término y será enviado a eso buscadores y catálogos.
En primer lugar se encuentran las conexiones lógicas entre términos de búsqueda
y, en segundo término, el contenido semántico del tema sobre el cual el usuario
busca información, es decir debe presentar sobre el cual el usuario busca
información. Por ello debe utilizar las opciones avanzadas de los buscadores.
También es necesario utilizar con precaución conexiones de varios términos con el
operador.
Puede unir palabras con “+”, Y o AND, es decir, los términos unidos por esos
operadores deben aparecer en las lista de resultados. Un signo “menos” (-), o
NOT excluye la palabra, que no debe aparecer en la presentación de resultados.
Pág
ina1
2
2.3 Términos para delimitar la búsqueda
2.4 Los buscadores más actuales y los más conocidos.
Pág
ina1
3
Como activa su éxito google.com? Es un resultado
alfanumérico que se inicia al consultar una duda,
ahí, en una espiral de resultados positivos, se
activan 54.000 servidores, luego 100.000
procesadores a los que activan 8.000 millones de
páginas web
Mención especial merece la transformación de
Yahoo!, cuya novedad más destacada es que el
usuario puede personalizar sus búsquedas a través
del servicio "My Yahoo! Search". De este modo, el
internauta puede ir guardando así los enlaces que
desee e incluso introducir comentarios personales.
Posteriormente, en la opción "Mi web", el internauta
encontrará sólo aquellas páginas que haya
consultado con anterioridad, similar a un servicio de
favoritos. Además, el portal permite almacenar
direcciones de sindicación de contenidos con el fin
de rescatarlas y utilizarlas más tarde.
Es un motor de búsqueda que encuentra y organiza
las respuestas que necesitas de manera que puedas
tomar decisiones con más información y rapidez.
La gran novedad en el sistema de Clusty es la forma
de organizar la información. Todos los enlaces
quedan agrupados en carpetas o 'clusters' en los
que las páginas 'web' se distribuyen por contenidos,
algo similar a lo que ocurre en el Explorador de
Windows.
Introduce la posibilidad de buscar documentos,
archivos o carpetas dentro del disco duro del
ordenador, y personaliza las búsquedas
inapropiadas o erróneas para ajustarlas a las
necesidades del usuario.
Ask Jeeves incluye sus conocidos 'prismáticos', que
permiten visualizar la página sin necesidad de
entrar.
Esta función permite a los usuarios despedirse del
'antiguo' método, con el que el usuario debe abrir
página por página y luego retroceder hasta la lista de
resultados
Wotbox es un Motor de búsqueda independiente de
búsqueda geográfico. "Estamos intentando brindar a
nuestros usuarios internacionales la mejor opción de
Pág
ina1
4
búsqueda geográfica. A la vez que pretendemos que
la interfaz de búsqueda resulte tan familiar y sencilla
personalizando su lengua materna."
Buscador de webs, imágenes, MP3/audio, video,
directorio, noticias. También ofrece otras
herramientas como un traductor, filtro familiar,
servicio de páginas amarillas, buscador de personas
y comparador de precios de diferentes productos a
través de Dealtime (http://altavista.dealtime.com).
La base de datos actual está ordenada según la
fórmula de relevancia de AltaVista.
Dispone de dos opciones de búsqueda avanzada.
Podemos utilizar el sistema clásico de operadores
booleanos y para los internautas menos
experimentados, existe la opción de recurrir al
método de formulario simple.
Este novedoso buscador francófono destaca por la
cantidad de información añadida sobre una página
que nos facilita cuando realizamos una búsqueda en
él (visualización previa desde el propio buscador,
localización y características del servidor donde se
aloja la página, propietario del dominio e información
de antiguas versiones de la página consultada.
"El buscador seguro para los niños", se asoció con
Google para crear lo que califica como la mayor
base de datos online de sitios "seguros para los
niños". OneKey usa una combinación de sitios ya
filtrados por mano humana con la información ya
filtrada por Google para determinar los sitios
disponibles para la búsqueda.
METABUSCADORES
Un meta buscador muy potente.
Metacrawler, uno de los meta buscadores más
potentes de internet ofrece un diseño renovado y
una mejor organización de los resultados de
Pág
ina1
5
búsqueda gracias al nuevo sistema que permite
agrupar automáticamente los resultados bajo
determinadas categorías. El servicio avanzado de
búsqueda permite utilizar operadores booleanos o
acotar pesquisas por fecha, idioma, dominio o
restringir los contenidos para adultos.
PREGUNTAS
1.- ¿Define buscador?
Es el punto de partida donde permite la búsqueda de todo tipo de términos y
palabras clave a partir del desarrollo de índices de archivos almacenados en
servidores web.
2.- ¿Qué ventajas tiene un buscador que se ubica en el país donde te sitúas?
Se encuentra información sobre el tema que se desea buscar del propio
país.
Las páginas web se muestran en el idioma del país.
3.- ¿Qué te tipo de buscador te envía más información?
Al utilizar los motores de búsqueda nos arroja más información de la deseada. Un
claro ejemplo es Google, ya que este buscador, al introducir la palabra clave nos
envía miles de sitios web, donde posiblemente va estar contenida la información
que el usuario este demandando.
4.- ¿Qué es mejor un buscador o un metabuscador?
Los metabuscadores, por qué; realizan varias búsquedas simultaneas en los
demás buscadores, y el buscador localiza la información al escribir las palabras
desplegando una lista de páginas web que contienen datos relacionados con las
palabras que se han escrito.
5.- ¿Cuál es el máximo de palabras que puedes utilizar en un buscador?
No hay límite de palabras, solo que, entre más palabras se inserten en el cuadro
de texto del buscador va ser más compleja la búsqueda y no se obtendrán los
resultados esperados.
6.- ¿El orden en el que aparecen las paginas a que se basa?
Pág
ina1
6
De acuerdo a la popularidad de las páginas web o las más demandadas y por
ende que contengan información relacionada con lo que el usuario demande.
7.- ¿Cuáles son las ventajas de los buscadores?
Proporcionan información relevante.
8.- ¿Los directorios como se mostraban?
9.- ¿Ventajas de Google contra otros?
Google:
Es un buscador mundial
Es más rápida la búsqueda
Resultados muy relevantes.
Su interfaz clara y muy sencilla.
Tiene millones de páginas web.
10.- ¿Qué beneficios te brinda como empresa tener un buscador?
Son muchos los beneficios, por que interviene lo que es la mercadotecnia y así dar
a conocer a la empresa y los servicios que ofrece la misma.
11.- ¿Qué desventajas tiene un buscador?
Pág
ina1
7
La información puede no ser verás.
Entre más palabras se ingresen al cuadro de texto del buscador no se
obtendrán resultados favorables.
No siempre se obtendrá la información deseada.
12.- ¿Dónde se almacena la información de los buscadores?
En una base de datos que se encuentran en discos duros almacenados
Pág
ina1
8
REFERENCIAS
http://seoesencial.com/info-general/historia-de-los-buscadores.php
19/05/2013 12:42pm
http://culturainformatica.es/articulos/historia-de-los-buscadores/ 19/05/2013
12:44 pm
http://www.definicionabc.com/tecnologia/buscador.php#ixzz2TlP6KzPr
19/05/2013 01:13 pm
http://es.slideshare.net/alixnaza/buscadores-especializados#btnNext
19/05/2013 01:38 pm
http://yerikendisvd.blogspot.mx/p/clasificacion-de-los-buscadores-y-
tipos.html 19/05/2013 10:45 pm.
http://saber-web.com/2010/11/como-funciona-buscador-google/ 19/05/2013
02:09 pm.
http://www.taringa.net/posts/info/979463/Los-buscadores-mas-importantes-
del-mundo.html 22/05/2013 1:28 a.m
http://javiercasares.com/seo/historia-de-los-buscadores/ 22/05/2013 1:11
am