lectura de sobre la internet profunda o invisible

12
LECTURA DE SOBRE LA INTERNET PROFUNDA O INVISIBLE

Upload: robertt-max

Post on 11-Aug-2015

84 views

Category:

Documents


1 download

TRANSCRIPT

LECTURA DE SOBRE LA INTERNET PROFUNDA

O INVISIBLE

DEFINICIÓN

SE DENOMINA 'INTERNET INVISIBLE' O INFRANET AL CONJUNTO DE RECURSOS ACCESIBLES ÚNICAMENTE A TRAVÉS DE ALGÚN TIPO DE PASARELA O FORMULARIO WEB QUE POR TANTO, NO PUEDEN SER INDICADOS DE FORMA ESTRUCTURAL POR LOS ROBOTS DE LOS BUSCADORES.

TIPOS DE INTERNET GLOBAL:

Red de información libre y gratuita que es accesible mediante la interconexión de ordenadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería o intercambio de protocolos (FTP, P2P).

Red de información libre y gratuita que es accesible mediante la interconexión de ordenadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería o intercambio de protocolos (FTP, P2P).

Es inaccesible mediante los procesos habituales de recuperación de la información que realizan buscadores, directorios y agentes de búsqueda. Los servidores o host que son totalmente inaccesibles desde nuestro ordenador.

La causa principal se debe a zonas restringidas con fines de seguridad nacional y militar, otros motivos son la configuración incorrecta de routers, servicios de cortafuegos y protección, servidores inactivos y finalmente " secuestro & quot; de servidores para utilización ilegal.

 TIPOS DE INFORMACIÒN: BASES DE DATOS: LOS

BUSCADORES SÓLO PROPORCIONAN ACCESO A LA PÁGINA DE INICIO PORQUE LAS RESTANTES SON DINÁMICAS. DOCUMENTOS EN FORMATO PDF, WORD: LOS MOTORES DE BÚSQUEDAS FUERON CREADOS SÓLO PARA LOCALIZAR E INDIZAR PÁGINAS HTML, AUNQUE ACTUALMENTE GOOGLE INDIZA DOCUMENTOS EN FORMATO PDF, DOC, XML. PÁGINAS WEB QUE NO SON INDIZADAS POR LOS MOTORES DE BÚSQUEDA: PORQUE SE EXCLUYEN ELLAS MISMAS A TRAVÉS DE UN PROTOCOLO.

CLASIFICACIÒN DE INTERNET INVISIBLE:

Web opaca

Web privada

Web propietari

a

WEB OPACA

• SE COMPONE DE ARCHIVOS QUE PODRÍAN ESTAR INCLUIDOS EN LOS ÍNDICES DE LOS MOTORES DE BÚSQUEDA, PERO NO LO ESTÁN POR ALGUNA DE ESTAS RAZONES:

Extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los buscadores.

Frecuencia de la indización: los motores de búsqueda no tienen la capacidad de indizar todas las páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indización no se realiza al mismo ritmo.

Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados de búsqueda, generalmente limitan el número de documentos que se muestran (entre 200 y 1000 documentos).

WEB PRIVADA

• CONSISTE EN LAS PÁGINAS WEB QUE PODRÍAN ESTAR INDIZADAS EN LOS MOTORES DE BÚSQUEDA PERO SON EXCLUIDAS DELIBERADAMENTE POR ALGUNA DE ESTAS CAUSAS:

Las páginas están protegidas por contraseñas (passwords).

Contienen un archivo “robots.txt” para

evitar ser indizadas.

Contienen un campo “noindex” para evitar que el buscador índice la parte correspondiente al cuerpo de la página.

WEB PROPIETARIA • INCLUYE AQUELLAS PÁGINAS EN LAS QUE ES NECESARIO REGISTRARSE PARA

TENER ACCESO AL CONTENIDO, YA SEA DE FORMA GRATUITA O PAGADA. SE DICE QUE AL MENOS 95% DE LA WEB PROFUNDA CONTIENE INFORMACIÓN DE ACCESO PÚBLICO Y GRATUITO (TURNER, 2003)

WEB REALMENTE INVISIBLE

SE COMPONE DE PÁGINAS QUE NO PUEDEN SER INDIZADAS POR LIMITACIONES TÉCNICAS DE LOS BUSCADORES, COMO LAS SIGUIENTES:

• PÁGINAS WEB QUE INCLUYEN FORMATOS COMO PDF, POSTSCRIPT, FLASH, SHOCKWAVE, PROGRAMAS EJECUTABLES Y ARCHIVOS COMPRIMIDOS.

• PÁGINAS GENERADAS DINÁMICAMENTE, ES DECIR, QUE SE GENERAN A PARTIR DE DATOS QUE INTRODUCE EL USUARIO. INFORMACIÓN ALMACENADA EN BASES DE DATOS RELACIONALES, QUE NO PUEDE SER EXTRAÍDA A MENOS QUE SE REALICE UNA PETICIÓN ESPECÍFICA. OTRA DIFICULTAD CONSISTE EN LA VARIABLE ESTRUCTURA Y DISEÑO DE LAS BASES DE DATOS, ASÍ COMO EN LOS DIFERENTES PROCEDIMIENTOS DE BÚSQUEDA.

CLASIFICACIÒN DE LA WEB INVISIBLE

ASÍ PUES, LA WEB INVISIBLE ESTÁ CONSTITUIDA POR TODA ESA:

Bases de datos bibliográficas: incluidos los catálogos de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc.

Bases de datos alfanuméricas y a texto completo: que incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios.

Revistas electrónicas y archivos de documentos

SITIOS DE INTERNET INVISIBLE

MOTORES DE BÚSQUEDA BUSCADORES: ESPECIALIZADOS- REGIONALES-GENERALES. EJEMPLO: GOOGLE YOUTUBE ALTAVISTA WEB CRAWLER

METABUSCADORES

UN METABUSCADOR ES UNA CLASE DE BUSCADOR QUE CARECE DE BASE DE DATOS PROPIA Y, EN SU LUGAR, USA LAS DE OTROS BUSCADORES Y MUESTRA UNA COMBINACIÓN DE LAS MEJORES PÁGINAS QUE HA DEVUELTO CADA BUSCADOR. EJEMPLO: IXQUICK MAMMA VIVISIMO GLUSTY

DIRECTORIO

ES UNA AGRUPACIÓN DE ARCHIVOS DE DATOS, ATENDIENDO A SU CONTENIDO, A SU PROPÓSITO O A CUALQUIER CRITERIO QUE DECIDA EL USUARIO. TÉCNICAMENTE EL DIRECTORIO ALMACENA INFORMACIÓN ACERCA DE LOS ARCHIVOS QUE CONTIENE: COMO LOS ATRIBUTOS DE LOS ARCHIVOS O DÓNDE SE ENCUENTRAN FÍSICAMENTE EN EL DISPOSITIVO DE ALMACENAMIENTO. EJEMPLO: EXIT YAHOO.