Herramientas de Documentalistas
Recolector de Documentos
Recolector de Documentos
Diversidad DocumentalBlogs
Revistas electronicas
Prensa Historica
Tesis
Paginas Web
Correo electronico
RSS
Fotografias
Etc...
Recolector de Documentos
Diversidad de Formatos y Normas
PDF de Adobe
MS Office PPT, DOC, XLS
Imagenes JPG, GIF
RSS, ATOM, RSS2...
HTML, XML...
Dublin Core
HL7
Ascii, UTF-8, ANSI...
Recolector de Documentos
Recolector de Documentos ¿Que informacion se extrae?
Metadatos
Texto Completo
Informacion introducida manualmente
.....
Recolector de Documentos
Base de datos
Internet
Medios de almacenamiento como discos...
Difusion
Entrada Procesos Salida
Entrada Procesos Salida
1 Recolectar enlaces URLExtrae los enlaces URL de una pagina a partir de una direccion URL
2 Lector de XMLLee XML de medios, RSS, ATOM...
3 Importa ficheros de disco De directorios, cds, dvd..
4 Introduccion manual de registros Permite el registro manual de documentos.
1 Recolectar enlaces URLExtrae enlaces URL a partir de una direccion
2 Lector de XMLLee XML de medios,rss, atom....
3 Importa ficheros de discoDe directorios, cds, dvd..
4 Introduccion manual de registros Permite el registro manual de documentos.
El recolector hace su trabajo pero... ¿Como organizar la entrada de miles de
documentos diarios?
Desde las 16:59:10 hasta
las 16:59:12 recolecta 26 documentos.
Entrada Procesos Salida
Entrada Procesos Salida
Metodos tradicionalesTesauro, Cuadro de Clasificacion, Materias, Metadatos Dublin Core...
Tesauro
Metadatos Dublin Core
Estructura jerarquica
Cuadro de Clasificacion / Expediente / Volumen / DocumentoPublicacion / Numero / Pagina
Calculo de la materia
Calcula la materia probable comparando los terminos con una base de terminos por materia
Entrada Procesos Salida
Entrada Procesos Salida
Envio automatico a nuestra base de datos en internet
Informes y listados
Exportar a formato Wordpress y SQL
Para mas informacion sobre las funciones de HDD vease: http://funciones.wordpress.com/
CREDITOSEste es un software para uso no comercial, para otros usos consulte las respectivas licencias
Utiliza el siguiente software de apoyo, integrandolo en la gestor de base de datos:
Exiftool para la extraccion de metadatos, ExifTool by Phil Harveyhttp://www.sno.phy.queensu.ca/~phil/exiftool/
Gettext para la extraccion de texto plano de documentos, Kryloff Technologies, Inc. http://www.kryltech.com/
Vbscript y Cscript para facilitar y optimizar el uso de programas externos y para extraer XML, URL y metadatos de paginas HTMLhttp://www.microsoft.com
La base de datos esta realizada con Velneo para trabajar sobre plataformas windows.http://www.velneo.comv