coordinación de la catalogación y búsquedas en la red académico científica

27
Coordinación de la catalogación y búsquedas en la red académico científica Jornadas Técnicas RedIRIS 98

Upload: bradford-jerry

Post on 02-Jan-2016

27 views

Category:

Documents


0 download

DESCRIPTION

Coordinación de la catalogación y búsquedas en la red académico científica. Jornadas Técnicas RedIRIS 98. Agenda de la reunión. Directorio (iris-x500) Estado actual del Directorio en España Revisión de acciones de la última reunión Piloto NameFLOW LDAP Piloto ES-LDAP - PowerPoint PPT Presentation

TRANSCRIPT

Coordinación de la catalogación y búsquedas en la red académico científica

Jornadas Técnicas RedIRIS 98

[email protected]. iris-search - 2

Agenda de la reunión

Directorio (iris-x500) Estado actual del Directorio en España Revisión de acciones de la última reunión Piloto NameFLOW LDAP Piloto ES-LDAP Experiencias con directorios en centros

españoles

Indexación (iris-index) Revisión de acciones de la última reunión Reunión del grupo de trabajo CHIC Incorporación del índice español al piloto CHIC

[email protected]. iris-search - 3

Estado actual del Directorio en España

Estadísticas Accesibilidad > del 80% Entradas: 78.600

Limpieza del Directorio Baja de 7 DSAs

ine, labein, rediris, udl, uma, unirioja, upv

Alta de 2 DSAs y 1 servidor LDAP feste, udr, unirioja

Diversidad de servidores de Directorio X.500 (Quipu 8.0, IC-R3.0, IC-R3.1, IC-R4.0, ...) LDAP (U.Michigan 3.3, OpenLDAP, Netscape D.S., ...)

[email protected]. iris-search - 4

Revisión de acciones de la última reunión - 1

Búsquedas potentes desde “de” con cuenta directorio No se usa LDAP

Piloto ES-LDAP Colaboración de GVA con scripts para

recolección de datos

altas de las entradas en el nuevo servidor LDAP

Utilidad SLURPD para piloto ES-LDAP Sirve para propagar cambios de un servidor

LDAP maestro a las copias esclavas. No nos vale

[email protected]. iris-search - 5

Revisión de acciones de la última reunión - 2

Librerías LDAP Pruebas en

CICA

UniRioja

Pasarela web500gw Colaboración con Frank Ritcher de Technical

University Chemnitz ([email protected]

Chemnitz.DE)

Traducción al castellano

Incorpora altas, bajas, modificaciones, cambio de claves, de RDN, consultas y manejo vCards

[email protected]. iris-search - 6

Piloto NameFLOW LDAP

Objetivos Evolución a una arquitectura con productos de

libre distribución, fácil mantenimiento y ampliación Proporcionar índices/centroides de la información

contenida en el Directorio Compatibilidad con Quipu (88) en caso de

necesidad

Estado Actual Incremento en el número de organizaciones y

DSAs Problemas con el protocolo DISP Problemas con Quipu en el año 2000 Infraestructura de servidores Quipu y X.500(93)

con servidores LDAP independientes

[email protected]. iris-search - 7

Reunión piloto NameFLOW LDAP - 1

Objetivo Test de un servicio de Directorio distribuido

basado en servidores LDAP Investigación de un servicio de directorio

híbrido como alternativa (hasta Junio 1999)

Infraestructura Interconexión de servidores LDAP mediante un

servidor LDAP padre que mantiene información de los servidores hijos

Existencia de servidores LDAP nacionales con índices de la información existente en el país

Esquema de nombres geográfico y por componentes

[email protected]. iris-search - 8

Reunión piloto NameFLOW LDAP - 2

Indexado Inicialmente índice de organizaciones (efecto

Altavista)

Problemas de escalabilidad Diseño de interfaces de búsqueda controlada

Necesidades Robots LDAP que sean capaces de recolectar

la información de los índices generados en cada servidor LDAP nacional

Mecanismos para intercambiar la información de índices/centroides LDAP

Realizar búsquedas usando índices y/o centroides

[email protected]. iris-search - 9

Piloto ES-LDAP

Tenemos un servidor LDAP con réplicas de lo que existe en c=es

Los usuarios realizan búsquedas en ese servidor

Se replica: Nombre, Apellidos, E-mail, Teléfono, Fax

Se incorpora: DN de la entrada original

para obtener el resto de los atributos

Fecha de última actualización

Name: ES-LDAP

LDAP Server:es-ldap.rediris.es

Search Root: c=es

UsuarioUsuariox500x500

x500/LDAPx500/LDAP

LDAPLDAP

o=zz, c=es

o=aa, c=es...

o=vv, c=es

es-ldap.rediris.eses-ldap.rediris.es

c=es

P.LDAPP.LDAP

[email protected]. iris-search - 10

Problemas encontrados en el piloto ES-LDAP

¿ Cómo actualizamos la información ? Volcados masivos Programa que interroga a la fuente y al destino y

vuelca las diferencias

¿ Cuando actualizamos la información? Periódicamente por la noche Cuando exista una modificación en una fuente

¿ Quien tiene permiso para hacerlo ? Los responsables de cada organización

¿ Cómo enlazamos con los datos de la entrada real ? Usando atributo seeAlso Mediante URL a:

Pasarela web/ldap correspondiente Pasarela web500gw de RedIRIS por defecto

[email protected]. iris-search - 11

Experiencias con LDAP/X.500 en España

openLDAP [email protected]

Generalitat Valenciana

Netscape Directory Server [email protected]

a.esUniversidad de La Rioja

IC-R4.0 [email protected]

Universidad de Murcia

[email protected]. iris-search - 12

Nuevos usos del Directorio en RedIRIS

Registro de servidores LDAP de España para el piloto ES-LDAP ou=ES-LDAP servers, o=rediris, c=es

o=cica, ou=ES-LDAP servers, o=rediris, c=es

Base de datos para administradores de listas de correo ou=Coordinacion de Servicios, o=rediris, c=es

ou=iris-mail, ou=Coordinacion de Servicios, o=rediris, c=es

Áreas Temáticas o=Areas Tematicas, c=es

ou=Docencia en Historia, ou=Educacion, o=Areas Tematicas, c=es

[email protected]. iris-search - 13

Grupo Sobre Indexación iris-index

Revisión de acciones de la última reunión

Reunión del grupo de trabajo CHIC

Incorporación del índice español al piloto CHIC

I

MET

A

[email protected]. iris-search - 14

Revisión de acciones de la última reunión

Índice de referencia Dublin Core en España http://www.rediris.es/metadata/

MetaWebber con formato Dublin CoreHerramientas de volcado de información

con control de metainformación Dublin Core explora + meteMeta http://www.rediris.es/si/iris-index/herramientas/explora/

Piloto de indexación iris-index Modificación de Harvest para adaptación a DC Adaptación de los interfaces de búsquedas

formato DC y No DC formato de salida simple y complejo

[email protected]. iris-search - 15

¿ Qué estamos indexando en iris-index ?

Universidades y Centros I+D Metainformación en formato Dublin Core Otros tags: <H*> y <TITLE>

CVUs. Comunidades Virtuales de Usuarios

PAI. Plan Andaluz de Investigación

¿ Registro de recursos ? Listas de distribución Servidores web Bibiliotecas

¿ Proyecto DisEven ? ¿ Directorio LDAP/X.500 ?

... Necesitamos más información

[email protected]. iris-search - 16

Centros Harvest 1.4, Harvest-NG, ... Uso de metainformación (Dublin Core)

Cada centro participante indexa sus servidores y genera un índice exportable (broker)

RedIRIS Tendrá varios brokers para buscar en

diferentes secciones del índice http://www.rediris.es/Harvest/brokers/i1-index http://www.rediris.es/buscar

Mostrará los resultados usando los valores contenidos en los campos de metainformación

Requisitos para participar en el piloto actual

[email protected]. iris-search - 17

Reunión TF-CHIC de Terena

Desarrollo de harvest-ng partiendo de cero Soporte de SOIF y RDF En fase de desarrollo

Piloto CHIC finalizado con éxitoInterés en incorporar nuevos índices

nacionales al nuevo piloto CHIC para la fase 2 ¿ Nos apuntaremos ?

... bueno, depende de vosotros, ...

Presentaciones ROADS, RDF, ASF - Advanced Search Facility

[email protected]. iris-search - 18

Piloto CHIC

AquitecturaSoporte de:

Dublin Core Soporte de metainformación

SOIF Descripción de recursos

Whois++ Protocolo de routing Lenguaje de consulta (posibilidad de Harvest Broker)

Otros protocolos RDF LDAP

[email protected]. iris-search - 19

Piloto CHIC - Arquitectura

Construcción de BD de un conjunto de descriptores de recursos

Proporcionar un interface de consultas al broker Proporcionar centroides sobre la BD para los

routings de consultas

Queries

SOIF

METASweb

Interface de búsquedas a los usuarios Routing de preguntas por la red de

servidores indexados Transformar las preguntas en lenguaje

original al lenguaje de la base de datos Mezclar los resultados de múltiples fuentes

Recolección de datos y metadatos Transformación de éstos en registros de

descripción de recursos (SOIF) Ofrecer los registros de descripción de

recursos a los servidores de índices o a los nodos que recopilan registros de descripción de recursos

Usuario

Brokering

Indexing

Gathering

[email protected]. iris-search - 20

Incorporación de iris-index al piloto CHIC

El nodo central de CHIC necesita un centroide con la información de España

RedIRIS genera un centroide de la información de iris-index

CHIC reenvía preguntas whois++ al nodo de RedIRIS cuando es necesario

Tenemos una pasarela whois++ al broker central iris-index

[email protected]. iris-search - 21

Proceso de una consulta

CHICCHICUsuarioUsuario

centroide c=EScentroide c=ES

centroide c=UKcentroide c=UK

centroide c=DEcentroide c=DE

UKUKESES

brokerbroker

1. Pregunta: PEPE

2. ¿ PEPE ?

3. c=ES y c=UK

4. Pregunta: PEPE a c=ES en formato whois++

4. Pregunta: PEPE a c=UK en formato whois++

6. Busca PEPE en broker iris-index

6. Busca PEPE en BD c=UK

7. Resultado: 40 PEPEs en broker iris-index y 1 PEPE en BD c=UK

5. Conversión a BD

BDBD

9. Rdo: PEPE en whois++

11. Rdo: 41 PEPEs

10. Reordenar

respuestas

8. Conversión a whois++

5. Conversión a broker Harvest

[email protected]. iris-search - 22

Herramientas

Desarrolladas en iris-index Metawebber

Incorporación de metainformación a páginas diseñadas

Herramientas para CVU (explora + meteMeta) Volcado de ficheros a un servidor web desde

netscape controlando la incorporación de metainformación

Brokerstats - hermann straus, dit, upm

Estadísticas de consulta a los brokers

Otras Robot watcher

Estadísticas de tráfico producido por los robots en nuestro servidor

[email protected]. iris-search - 23

Sistema de carga de páginas web

Aplicación desarrollada en RedIRIS(explora + meteMeta)

Permite: Gestión del espacio web

Creación y borrado de directorios Borrado de ficheros y directorios Comprobación de ficheros

Volcado de páginas desde el navegador Incorporación de metainformación controlada

Formularios simple y extendido

Indexado por palabras clave y por área temática

Posibilidad de integración con BSCW

[email protected]. iris-search - 24

Carga con explora + meteMeta

[email protected]. iris-search - 25

Incorporación de Metainformación

Modo Simple

Modo Avanzado

[email protected]. iris-search - 26

Otros Temas

Alguna cosilla ...

[email protected]. iris-search - 27

Direcciones de interés

Para que estemos en contacto [email protected] [email protected]

Sobre Directorios [email protected]

Más información http://www.rediris.es/x500 http://www.rediris.es/si/iris-index