3.2.1 localització i compleció de les col·leccions

23
10es Jornades Catalanes d’informació i Documentació (World Trade Center 25 i 26 de maig de 2006) Títol de la comunicació: El Portal ARCA (Arxiu de Revistes Catalanes Antigues) Nom complet, càrrec i lloc de treball de les autores de la proposta: Eugènia Serra Aranda. Coordinació General de la Biblioteca de Catalunya M. del Tura Molas i Alberich. Direcció de l’Hemeroteca de la Biblioteca de Catalunya Paquita Navarro Romero. Unitat de Digitalització de la Biblioteca de Catalunya Dades de contacte: [email protected] Tel. 932702300 (ext. 124) [email protected] Tel. 934526900 (ext. 120) [email protected] Tel 932702300 (ext. 115) Resum descriptiu: El portal, dins de l’entorn web, és el mitjà que es revela actualment com un dels més efectius en les tasques de donar visibilitat i fer accessibles les coleccions de les biblioteques. La comunicació presenta el portal ARCA (Arxiu de Revistes Catalanes Antigues) que s’emmarca dins del Pla d’Actuació de la Biblioteca de Catalunya per a la identificació i l’accessibilitat del patrimoni català a la Xarxa Internet. ARCA és un portal que facilita l’accés unificat i obert a les publicacions periòdiques digitalitzades, preferentment completes i ja tancades, que han estat representatives dins de la cultura i la societat catalanes, siguin d’àmbit local, nacional o internacional. Aquesta eina cooperativa liderada per la Biblioteca de Catalunya incrementa la visibilitat de les coleccions de les institucions participants, contribueix a la recuperació i a la compleció virtual d’aquestes i a garantir la preservació del patrimoni hemerogràfic. 1

Upload: dangbao

Post on 08-Feb-2017

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 3.2.1 Localització i compleció de les col·leccions

10es Jornades Catalanes d’informació i Documentació(World Trade Center 25 i 26 de maig de 2006)

Títol de la comunicació: El Portal ARCA (Arxiu de Revistes Catalanes Antigues)

Nom complet, càrrec i lloc de treball de les autores de la proposta:Eugènia Serra Aranda. Coordinació General de la Biblioteca de CatalunyaM. del Tura Molas i Alberich. Direcció de l’Hemeroteca de la Biblioteca de CatalunyaPaquita Navarro Romero. Unitat de Digitalització de la Biblioteca de Catalunya

Dades de contacte: [email protected] Tel. 932702300 (ext. 124)[email protected] Tel. 934526900 (ext. 120)[email protected] Tel 932702300 (ext. 115)

Resum descriptiu:El portal, dins de l’entorn web, és el mitjà que es revela actualment com un dels més efectius en les tasques de donar visibilitat i fer accessibles les col·leccions de les biblioteques. La comunicació presenta el portal ARCA (Arxiu de Revistes Catalanes Antigues) que s’emmarca dins del Pla d’Actuació de la Biblioteca de Catalunya per a la identificació i l’accessibilitat del patrimoni català a la Xarxa Internet.

ARCA és un portal que facilita l’accés unificat i obert a les publicacions periòdiques digitalitzades, preferentment completes i ja tancades, que han estat representatives dins de la cultura i la societat catalanes, siguin d’àmbit local, nacional o internacional.

Aquesta eina cooperativa liderada per la Biblioteca de Catalunya incrementa la visibilitat de les col·leccions de les institucions participants, contribueix a la recuperació i a la compleció virtual d’aquestes i a garantir la preservació del patrimoni hemerogràfic.

Durant el 2005 s’ha realitzat la fase de preparació i en el 2006 s’entrarà en la fase de difusió i ampliació de continguts.

En la comunicació s’exposarà el model, metodologia, característiques i abast del portal, així com una visió global de la col·lecció virtual obtinguda.

Paraules clau: Biblioteca de Catalunya, portals d’Internet, publicacions en sèrie, cooperació entre biblioteques, digitalització.

1

Page 2: 3.2.1 Localització i compleció de les col·leccions

1. INTRODUCCIÓ

A Catalunya ha existit durant tot el segle XX una gran sensibilitat vers les publicacions periòdiques. Es van consolidar com a mitjà privilegiat de comunicació, tant d’informació general com de difusió de cultures i tendències: a finals del segle XIX i a principis del segle XX van ésser una finestra oberta a Europa i es va assolir tal qualitat en l’edició i els continguts que aquests anys són l’època d’or de les publicacions periòdiques catalanes. Sempre han estat considerades font d’estudi i d’investigació històrica, literària i artística entre d’altres.

La societat catalana tant en moments de llibertat com en moments de repressió s’ha expressat mitjançant el diari, la revista, el butlletí, el full, etc. De vegades amb més qualitat en el suport i en la part gràfica, de vegades molt modestament tant en el paper com en el disseny.

Els investigadors hemerogràfics conscients de la vitalitat de les publicacions periòdiques catalanes les van intentar reunir en dues bibliografies cabdals dins del nostre món hemerogràfic: la Bibliografia Catalana. Premsa (Givanel, 1931-1937)1 i Història de la Premsa Catalana (Torrent; Tasis, 1966)2.

Particulars i institucions: biblioteques, arxius, centres de lectura, ateneus, cases de cultura, etc., amb il·lusió i esforç s’han dedicat a col·leccionar publicacions periòdiques. Tanmateix col·leccionar publicacions periòdiques és molt costós: per la seva primera funció efímera, per la seva dinàmica vital, per la fragilitat del suport i per l’espai que ocupen.

Les dificultats enumerades, la seva consulta, el pas del temps i les distintes catàstrofes, naturals o no, fan que les col·leccions de publicacions periòdiques siguin en bona part incompletes o destruïdes. Malgrat tot, segueixen essent la font primera de tota recerca històrica i social i posar-les a l’abast dels ciutadans contribueix a fer present el passat més immediat de la nostra societat catalana.

El món universitari, estudiós i investigador i els usuaris en general reclamen una eina que els permeti un fàcil accés a aquelles revistes, butlletins i diaris representatius de les distintes etapes històriques i culturals catalanes per tal de poder dedicar més temps a la recerca sense necessitat d’haver de fer costosos desplaçaments tant per consultar les publicacions disperses com per, fins i tot, haver de consultar una mateixa publicació disponible parcialment en distintes institucions

El patrimoni hemerogràfic es troba distribuït doncs entre diferents institucions que, conscients de la importància de la preservació de les publicacions periòdiques han iniciat la digitalització dels seus fons a títol individual i n’han propiciat la difusió adreçada als seus usuaris. En aquests moments es podrien trobar uns 300 títols digitalitzats, alguns accessibles des de diferents servidors a Internet i d’altres de consulta a les seus de les institucions.

2. ELS ANTECEDENTS

1 Givanel i Mas, Joan (1931-1937). Bibliografia Catalana. Premsa. Barcelona: Institució Patxot.2 Torrent, Joan; Tasis, Rafael (1966). Història de la Premsa Catalana. Barcelona: Bruguera

2

Page 3: 3.2.1 Localització i compleció de les col·leccions

Una de les missions de la Biblioteca de Catalunya és la vetlla per a la conservació i la preservació dels fons bibliogràfics patrimonials catalans. Per aquest motiu l'Hemeroteca de la Biblioteca de Catalunya, l’any 1999, va realitzar un treball de camp que va consistir en concretar quines biblioteques, arxius i entitats públiques o privades conservaven col·leccions de publicacions periòdiques, especialment catalanes, i de quins períodes històrics. A grans trets es van establir les dates següents: anteriors a 1800, 1800-1939, 1940-1981 i 1982-1999. D’aquesta manera es van obtenir dades empíriques que ens permetien dibuixar el mapa de col·leccions de premsa a Catalunya i el seu directori.

Una de les primeres actuacions per a la preservació de la premsa ha estat la seva microfilmació, per la qual cosa, paral·lelament, es va efectuar una altra petició a les institucions referida a si tenien algun pla de microfilmació o de digitalització. Les dades obtingudes van permetre iniciar una tercera fase que va consistir en sol·licitar, als centres identificats, les llistes de publicacions periòdiques que havien microfilmat o d’aquelles que havien adquirit còpia microfilmada, tot especificant determinats elements d’informació amb la finalitat de poder elaborar un inventari3 de publicacions periòdiques, majoritàriament catalanes, que s’havien microfilmat o digitalitzat a Catalunya.

L’objectiu primer de l’inventari era i és dotar les hemeroteques catalanes -i per descomptat la Biblioteca de Catalunya- d’un instrument per a la cooperació en matèria de preservació de les publicacions periòdiques. El fet d’identificar les còpies, tant siguin de seguretat com de comercialització, possibilita l’estalvi de costos, atès que una còpia és més econòmica que una microfilmació o digitalització originals.

Així doncs es va demanar a l’Àrea de Tecnologia de la Informació de la Biblioteca de Catalunya que dissenyés una aplicació mitjançant una base de dades relacional per poder fer efectiu l’inventari i que aquest es pogués consultar mitjançant la pàgina web de la Biblioteca de Catalunya.

3 Inventari de fons reproduïts de publicacions en sèrie a Catalunya (2001- ). Barcelona: Biblioteca de Catalunya. <http://www.bnc.es/catalegs/fonsrpp/inici.php>

3

Page 4: 3.2.1 Localització i compleció de les col·leccions

El resultat va ésser una base de dades amb 1541 registres corresponents a cada col·lecció específica de les 59 hemeroteques participants.

Cada registre consta de tres parts ben diferenciades:1.dades bibliogràfiques i de col·lecció2.centre dipositari3.dades de la reproducció

L’inventari es va fer públic a través de la Web de la BC l’any 2000 i s’ha anat actualitzant anualment, amb una mitjana de més de 150 registres per any; actualment conté uns 2500 registres. Aquesta base de dades ha permès identificar el creixement de les col·leccions catalanes digitalitzades dipositades a Catalunya que en aquests moments són més de 300.

2.1 El Programa de digitalització de publicacions periòdiques a la Biblioteca de Catalunya

Paral·lelament al treball de prospecció de col·leccions hemerogràfiques a Catalunya i al disseny i posada en marxa de l’inventari, es va iniciar el projecte de digitalització de les publicacions periòdiques a la Biblioteca de Catalunya.

Dins d’aquest projecte es va efectuar un treball de recerca de programes externs relacionats amb la digitalització de les publicacions periòdiques. Es van determinar com a col·leccions prioritàries per digitalitzar dels fons propis de la Biblioteca de Catalunya la “Reserva de revistes catalanes” i la “Premsa de gran format”, tots dos fons genuïnament catalans i sobre els quals s’ha d’exercir una acció decidida perquè no desapareguin. A partir d’aquí es van establir els objectius i les prioritats del pla de digitalització de les col·leccions hemerogràfiques, que van quedar fixats de la manera següent:

Criteris de selecció:- Estat de conservació - Completesa- Llengua- Format - Freqüència d’ús i consulta

Altres factors per a una millor qualitat i impacte de la digitalització:- Estat de la indexació (inventari o catalogació disponibles)- Qualitat dels documents- Consistència dels documents- Facilitat d’escaneig- Facilitat de separar i unir

Amb aquests criteris es va iniciar la digitalització de forma puntual a la Biblioteca de Catalunya, que l’any 2005 s’ha consolidat en un programa estable i amb continuïtat de digitalització de documents de diverses tipologies –entre les quals també les publicacions periòdiques- de la Biblioteca de Catalunya

3. EL PORTAL ARCA (ARXIU DE REVISTES CATALANES ANTIGUES)

4

Page 5: 3.2.1 Localització i compleció de les col·leccions

La Biblioteca de Catalunya dins del seu Pla Estratègic 2004-20084, presentat i aprovat al Consell Rector de juliol de 2004, defineix com una de les seves actuacions prioritàries l’impuls a projectes de digitalització per a la preservació i la difusió del patrimoni català mitjançant productes virtuals, concebuts, dissenyats i creats especialment per a entorn Web. Dins d’aquest marc d’actuació s’inscriu el projecte ARCA (Arxiu de Revistes Catalanes Antigues).

El projecte ARCA consisteix en la creació d’un portal únic d’accés obert a publicacions periòdiques ja tancades que han estat representatives dins de la cultura i la societat catalana siguin d’àmbit local, nacional o internacional.

Els objectius del projecte són:- Possibilitar la consulta sobre les publicacions periòdiques completes. Els usuaris

podran accedir a les col·leccions completes de les publicacions sense haver de perdre temps i esforços en la seva localització i consulta a diferents institucions.

- Recuperar, incrementar i preservar el patrimoni hemerogràfic català. El fet de disposar de substituts digitals dels documents minimitza l’ús dels originals i el seu desgast.

- Incrementar els continguts catalans a Internet en accés obert. Les publicacions periòdiques recollides a ARCA són testimoni de la història, societat i manifestacions artístiques de Catalunya al llarg de diferents èpoques. Fer-les accessibles a Internet contribueix a donar a conèixer la cultura i llengua catalana arreu del mon.

- Promoure la cooperació entre institucions per a completar les col·leccions, millorar la seva oferta de serveis, compartir recursos i rendibilitzar les col·leccions documentals.

3.1 La cooperació com a clau de l’èxit

Les experiències a Catalunya en la cooperació entre biblioteques per dur a terme projectes de recursos digitals són força nombroses, només per citar-ne algunes tenim TDX-Tesis Doctorals en Xarxa (http://www.tesisenxarxa.net), RECERCAT-Dipòsit de la Recerca de Catalunya (http://www.recercat.net/index.jsp) o RACO-Revistes Catalanes amb Accés Obert (http://sumaris.cbuc.es/raco), impulsats pel Consorci de Biblioteques Universitàries de Catalunya, del que la Biblioteca n’és membre.

La Biblioteca de Catalunya, a banda de cooperar en els projectes esmentats del CBUC, participa des de pràcticament la seva creació l’any 2000 en la Biblioteca Virtual Miguel de Cervantes, on disposa d’un portal institucional propi (http://www.cervantesvirtual.com/portal/BC/), fet que li ha permès adquirir experiència en el tractament i gestió de documents digitalitzats.

També en l’àmbit de la cooperació, la Biblioteca de Catalunya forma part des de l’inici del Catàleg Col·lectiu de les Universitats de Catalunya (http://www.cbuc.es/ccuc/), manté i incrementa el Catàleg Col·lectiu del Patrimoni Bibliogràfic de Catalunya (http://www.bnc.es/catalegs/patrimoni/catalan/inici.php) i ha impulsat i proporciona suport tècnic al Catàleg de les Biblioteques Especialitzades de Catalunya (http://beg.gencat.net/vtls/catalan/vtls-basic.html).

4 Pla Estratègic de la Biblioteca de Catalunya 2004-2008 (2004). Barcelona: Biblioteca de Catalunya. <http://www.bnc.es/bc/qualitat/pestrategic2004_2008.doc>

5

Page 6: 3.2.1 Localització i compleció de les col·leccions

Amb aquest mateix esperit de cooperació neix el projecte ARCA. La cooperació, sempre essencial per millorar processos, reduir costos i compartir coneixement, és en el cas d'ARCA absolutament imprescindible, fins al punt que sense aquesta cooperació perdria gran part del seu sentit. El valor diferencial del portal ARCA resideix principalment en que té l’objectiu de completar les capçaleres a partir de les col·leccions que es troben disperses a Catalunya.

El portal ARCA és un projecte de país, que vol proporcionar les eines, context i plataforma perquè les biblioteques i institucions catalanes puguin donar a conèixer les seves hemeroteques, i que té com a resultat un servei tant per als investigadors -bàsic per a desenvolupar la seva tasca- com per a qualsevol ciutadà, facilitant-li l’accés al seu patrimoni. Impulsa doncs la recerca i la difusió de la cultura catalana.

Les institucions que col·laborin en el projecte resultaran beneficiades perquè oferiran als seus usuaris una eina única d’accés a publicacions històriques catalanes, incrementaran la visibilitat de les seves col·leccions i contribuiran a garantir la preservació del patrimoni hemerogràfic català.

ARCA a més a més ajuda a crear sinèrgies i promou l’ús d’estàndards i normativa internacional en uns àmbits relativament poc estesos encara a Catalunya.

3.2 La col·lecció

Les col·leccions de publicacions periòdiques catalanes que han estat més significatives al llarg del temps han estat revistes d’informació general i d’informació local, culturals, artístiques, literàries, humorístiques i evidentment la premsa diària, sense oblidar algunes magnífiques revistes especialitzades.

Les condicions genèriques per a la formació de la col·lecció a oferir des d’ARCA són: - Publicacions periòdiques catalanes (editades en qualsevol llengua)- Significatives des del punt de vista patrimonial (sigui a nivell local o nacional)- Tancades (que s’han deixat de publicar)- Preferentment completes- Llegibles- En bon estat de conservació per a una digitalització òptima

3.2.1 Localització i compleció de les col·leccions

L’inventari abans esmentat ha estat una eina imprescindible per a identificar i conèixer les col·leccions susceptibles d’integrar-se en el portal ARCA. A partir de la informació de l’inventari -des de l’Hemeroteca de la BC- es manté una relació de capçaleres que permet evitar la duplicitat entre institucions a l’hora de planificar els seus programes de digitalització.

Per disposar de dades útils i fiables es treballa de forma continuada en:- Reelaborar i actualitzar el directori de Centres que conserven col·leccions

hemerogràfiques - Petició de les capçaleres que s’han digitalitzat i de la previsió de les que es

digitalitzaran

6

Page 7: 3.2.1 Localització i compleció de les col·leccions

- Inclusió de les anteriors a l’inventari

3.2.2 Anàlisi

De l’anàlisi de les dades de l’inventari es desprèn que actualment, pel que fa a la digitalització de publicacions periòdiques catalanes, podrien formar part d’ARCA a curt termini ja que disposen de programes de digitalització en curs:

- Fons locals per part de la Diputació de Barcelona5 i de les Biblioteques Públiques Provincials catalanes digitalitzades pel Ministerio de Cultura6

- Fons locals per part dels arxius municipals i comarcals- Projectes de digitalització de revistes artístiques i literàries catalanes de la

Universitat de Lleida, de la Universitat Autònoma de Barcelona i de l’Ateneu Barcelonès

- Projectes de digitalització de premsa de l’Arxiu Històric Municipal de Barcelona i de l’Arxiu Històric Municipal de Girona

- Fons de la Biblioteca de l’Esport

A partir d’aquesta anàlisi s’ha contactat, entre d’altres, amb les següents institucions per presentar el projecte ARCA i establir marcs de col·laboració:

- Arxiu Comarcal de Ripoll- Arxiu Històric de Sabadell- Aula Màrius Torres de la Universitat de Lleida- Biblioteca de l’Ateneu Barcelonès- Biblioteca de l’Esport- Biblioteca Pública de Girona- Consorci de Biblioteques Universitàries de Catalunya- Hemeroteca de l’Arxiu Històric de la Ciutat de Barcelona- Ministerio de Cultura- Servei de Biblioteques de la Diputació de Barcelona- Servei de Biblioteques de la Universitat Autònoma de Barcelona

Aquests primers contactes, han donat com a resultat, la compleció d’algunes col·leccions virtuals a partir dels fons complementaris proporcionats per diferents hemeroteques, i la coordinació entre les institucions per evitar la duplicitat de digitalitzacions.

3.3 La digitalització

Tenint en compte que l’objectiu de la digitalització és doble, preservació i difusió, la digitalització de les publicacions periòdiques de la Biblioteca de Catalunya es fa en format d’alta resolució (per disposar d’un màster de preservació) del qual se n’obté la còpia de difusió.

Totes les especificacions que segueixen són d’aplicació per a la Biblioteca de Catalunya, i també són les recomanacions que es fan a les institucions que es vulguin sumar al projecte. Tot i amb això no són requisits indispensables sinó només desitjables,

5 Fons local de publicacions periòdiques digitalitzades. Servei de biblioteques de la Diputació de Barcelona. <http://www.diba.es/xbcr/default.htm>. 6 Biblioteca Virtual de Prensa Histórica (2003). Madrid: Ministerio de Cultura. <http://www.mcu.es/prensahistorica/es/consulta/busqueda.cmd>

7

Page 8: 3.2.1 Localització i compleció de les col·leccions

especialment per a les noves digitalitzacions que es planifiquin.

3.3.1 Estàndards

S’utilitzen els estàndards7 de resolució, format, definició i compressió que s’establiren l’any 2000 en el marc del CBUC (Consorci de Biblioteques Universitàries de Catalunya), i que al juliol del 2005 la Biblioteca de Catalunya va validar a partir de la comparació amb els utilitzats per projectes de digitalització8 de prestigi arreu del món (fet pel qual s’han convertit “de facto” en estàndards internacionals).

D’acord amb aquests estàndards els paràmetres de digitalització són:- Màster o còpia de preservació: en format TIFF (sense compressió), a 300 punts

per polzada (dpi); per original b/n: 8 bits i per original en color: 24 bits- Còpia de difusió: en format JPEG (compressió baixa), a 150 punts per polzada

(dpi)

Sempre que sigui possible s'obtindrà la transcripció dels textos mitjançant OCR per facilitar la recuperació de la informació mitjançant text lliure.

3.3.2 Procediment

Per realitzar la digitalització de les publicacions periòdiques de la Biblioteca de Catalunya s’ha optat per externalitzar aquesta activitat a una empresa especialitzada, enlloc de crear una infraestructura pròpia (personal tècnic, escàner i/o càmera digital de gama alta de captació d’imatges, sistema d’il·luminació i estació de treball amb els programaris informàtics necessaris per al tractament d’imatges).

Actualment existeix l’opció que l’empresa es desplaci a la institució, estalviant d’aquesta manera els costos de transport i d’assegurança que suposaria que els documents patrimonials surtin de la biblioteca.

La Biblioteca ha establert una sèrie de recomanacions vinculades al procés de la digitalització, que són extrapolables a qualsevol altra institució:

- Prèviament a la digitalització cal comprovar l’estat de les publicacions i valorar si és necessari realitzar alguna actuació de restauració prèvia per garantir la qualitat de la imatge resultant, o si per al contrari aquesta restauració podria dificultar la llegibilitat de la imatge i convé doncs fer-la posteriorment.

- La biblioteca definirà l’estructura de carpetes i la nomenclatura que haurà d’utilitzar l’empresa per identificar les imatges i les transcripcions, per garantir la correcta organització del fons.

- Garantir la disponibilitat d’espai, que caldrà habilitar per a que l’empresa ubiqui el seu maquinari i facilitar-li l’accés al material a digitalitzar.

- Abans de començar el treball definitiu de digitalització, l’empresa haurà de lliurar una prova de qualitat per garantir que els requeriments de la biblioteca es respecten.

- El suport de lliurament de les imatges digitalitzades dependrà de la infraestructura d’emmagatzemament amb que compti cada institució, en el cas de les digitalitzacions de la Biblioteca de Catalunya per al Portal ARCA es fa en DVD’s.

- Una vegada finalitzada la digitalització s’efectuarà un control de qualitat sobre

8

Page 9: 3.2.1 Localització i compleció de les col·leccions

una mostra aleatòria que ha de suposar almenys un 5% del total de la col·lecció.

3.4 Gestió i accés a les publicacions digitalitzades

Existeixen en el mercat diversos productes per a la gestió de recursos electrònics en general i també, encara que menys, aplicacions per a la gestió i difusió específica de col·leccions digitalitzades. Les característiques bàsiques que es buscaven en la selecció del gestor eren:

- Definició de diferents nivells d’usuaris (administrador, operador, catalogador, ...)

- Flexibilitat en la creació de col·leccions i subcol·leccions- Facilitat en el procediment de creació d’objectes digitals - Capacitat d’incorporació d’objectes digitals amb les seves jerarquies

preestablertes en una sola transacció- Descripció de les imatges amb metadades, definició de plantilles i

importació/exportació de metadades- Cercador predefinit sobre tots els camps de les metadades- Adaptabilitat en la definició de la interfície de consulta- Personalització de l’usuari de la seva visualització

A partir de les característiques esmentades, per a la creació del Portal ARCA s’ha optat per la utilització del programari CONTENTdm d'OCLC, que té una àmplia utilització en el mercat d'Estats Units9, un dels països amb més generalització de dipòsits de col·leccions digitalitzades. Aquest programari, adquirit de forma conjunta per a les institucions del CBUC, proporciona eines per a l’organització i gestió de col·leccions digitals, per a la seva publicació i per a fer recerques sobre les col·leccions des d’Internet, és a dir, permet, a partir d’una simple interfície web, una gestió integral àgil de col·leccions les digitals independentment dels formats de documents que les integrin.

3.4.1 Càrrega de documents

Els documents introduïts actualment a la col·lecció han estat escanejats a una resolució de 300 dpi i guardats en format TIFF, en un sistema organitzat de directoris i subdirectoris, jerarquia que després es reprodueix en el Portal. A partir de les imatges màster es van extreure imatges de difusió a una resolució de 150 dpi en format JPEG. També es va realitzar la transcripció dels textos mitjançant OCR (Optical Recognition Character), generant els corresponent arxius .txt, que mantenen la mateixa estructura organitzativa.

L’aplicació permet la importació en lot d’aquests arxius de imatge i text mantenint l’estructura original, i crea les miniatures corresponents, així com les marques d’aigua o identificació institucional que es cregui oportuna.

3.4.2 Creació de metadades

9 A tall d’exemple és interessant consultar la pàgina d’usuaris d’aquest mateix programari, on es troba una bona mostra de col·leccions digitalitzades per biblioteques, arxius i museus d’Estats Units. <http://www.contentdmdemo.com/customers/index.html>

9

Page 10: 3.2.1 Localització i compleció de les col·leccions

Un cop generat el document es procedeix a la introducció de les metadades definides. El gestor CONTENTdm ofereix diferents possibilitats en la creació de metadades com són:

- Flexibilitat a l’hora de configurar quines metadades s’inclouen al document i a les diferents pàgines que el formen, quines són visibles i quines són recercables per a l’usuari final

- Ús de plantilles de metadades predeterminades d’acord amb Dublin Core- Ús de vocabularis controlats per a una creació de metadades uniformes i

consistents

Un cop generat el document es procedeix a la descripció del recurs mitjançant els elements establerts del Dublin Core. Les metadades que inicialment s’han definit com a mínimes per a les publicacions que integren el portal ARCA són les següents:

- Títol: títol donat al recurs i que coincideix amb el títol de la publicació original- Matèria: termes extrets d’un vocabulari controlat que defineixen el contingut del

recurs- Descripció: explicació del contingut del recurs- Creador: entitat (persona, organització o servei) que té la responsabilitat

principal de la creació del contingut del recurs- Editor: entitat responsable de fer el recurs disponible- Contribuïdors: persona, organització o servei responsable de fer contribucions al

contingut del recurs- Data d’edició: data de creació del recurs- Data de creació: data de creació del contingut intel·lectual del document- Tipus de recurs: naturalesa o gènere del contingut del document, i que en aquest

cas serà “Text”- Format: tipus de document- Font: referència a la publicació de la qual se’n deriva el recurs - Llengua: llengua del contingut del document- Gestió dels drets: condicions d’ús i reproducció del recurs

Per a la descripció s’utilitzarà la informació de la catalogació respectiva, sempre que aquesta existeixi, i es recomanarà a les institucions dipositàries que mitjançant l’etiqueta 856 del format MARC enllacin la catalogació amb l’aplicació on es trobin les imatges digitalitzades. Donada l’especificitat del tipus de material, s’afegiran a les metadades mínimes anteriors aquelles relacionades amb termes de preservació i que es poden agrupar en:

- Descripció de l’objecte: amb la descripció física de l’original, incloses les mides- Informació de la reproducció digital: amb les dades dels estàndards i del

maquinari utilitzat

3.4.3 Validació del document

Un cop el document i les seves corresponents metadades han estat creades aquest passa a un estat provisional, en el qual encara no ha ingressat a la col·lecció, i queda pendent de revisió i validació per part de l’administrador de la col·lecció. És aquest administrador el que finalment validarà el document i procedirà a la càrrega final. Aquest mateix pot portar a terme altres tasques relacionades amb l’administració de la

10

Page 11: 3.2.1 Localització i compleció de les col·leccions

col·lecció com la modificació de l’estructura del document, la creació d’informes, l’eliminació o integració de pàgines, etc.

3.4.4 Cerca i accés a les col·leccions

Per rendibilitzar qualsevol col·lecció digital cal que sigui accessible als usuaris de manera fàcil a partir de la web. El portal ARCA ofereix diferents possibilitats de recerca que van des de una simple navegació a través de tots els documents que integren la col·lecció per a usuaris no familiaritzats, a les cerques simples o avançades, que inclouen l’utilització d’operadors booleans, cerques per camps definits o en tots els camps, per frases, etc., obtenint els resultats de qualsevol cerca en un temps molt curt d’espera.

Els resultats es despleguen en pantalla com a imatges en miniatures que donen accés als documents i als camps de metadades associades. Aquesta pantalla de visualització de

11

Page 12: 3.2.1 Localització i compleció de les col·leccions

resultats es pot personalitzar per l’usuari desplegant imatges i títols, només imatges o només títols.

Un cop localitzat el document també s’ofereixen diferents possibilitats de visualització i navegació a través de les pàgines.3.4.5 Altres funcionalitats per als usuaris

Sempre que l’usuari final visualitza una imatge en miniatura o una descripció té l’opció de guardar aquest document i les seves metadades, en l’arxiu “Els meus favorits”, per a futurs usos personals, com poden ser la importació a presentacions en PowerPoint, la comparació de dos imatges a l’hora, o enviar el document per correu electrònic a qualsevol altre usuari de CONTENTdm.

3.5 El maquinari

ARCA forma part d’un projecte global de portal patrimonial cooperatiu -com s’ha explicat a la introducció- motiu pel qual es preveu ubicar el portal i les col·leccions d’imatges al CESCA (Centre de Supercomputació de Catalunya), aprofitant així una infraestructura potent que ja existeix.

El CESCA disposa del maquinari i capacitat de comunicació adequats per garantir un accés eficient al portal (imprescindible quan tractem amb la transmissió d’imatges), i a la vegada pot contribuir en l’avaluació i aplicació de les estratègies de preservació que a llarg termini s’hauran de dur a terme per garantir la perdurabilitat del Portal (migració de dades i suports, actualització de versions, ...).

3.6 Continguts addicionals

Per proporcionar valor afegit a la col·lecció s’inclourà una pàgina de presentació bibliografia i webgrafia dels títols que formin part del Portal ARCA, així com, sempre que sigui possible, el text complet de la ressenya de la Història de la Premsa Catalana (Torrent; Tasis, 1966)10.

4 AVALUACIÓ

Com amb qualsevol producte o servei s’efectuarà un seguiment periòdic de l’ús de la col·lecció. S’utilitzaran eines d’obtenció d’estadístiques d’accessos (com per exemple, WebTrends o OneStat), i periòdicament s’efectuarà una avaluació qualitativa en base a questionaris virtuals adreçats als usuaris ubicats en la mateixa pàgina de presentació de la col·lecció.

El qüestionari breu i concís, farà èmfasi en obtenir propostes de millores i prestacions per part dels usuaris, que seran essencials per a la correcte evolució del Portal.

Periòdicament s’efectuarà una avaluació conjunta amb les institucions participants.

5 CONCLUSIONS

12

Page 13: 3.2.1 Localització i compleció de les col·leccions

El portal ARCA se sumar als dipòsits digitals ja existents a Catalunya. La prioritat en aquests moments es començar a construir-los i a omplir-los de continguts, independentment de les eines que s’utilitzin.

La tecnologia sabem que evoluciona molt ràpidament i les prestacions i capacitats que ofereix canvien i s’incrementen progressivament. En pocs anys hem assistit a un canvi espectacular de model de gestió i de recursos tecnològics a l’abast de les biblioteques.

La prioritat, ara, ha de situar-se en els continguts i en l’ús d’estàndards. Si ho fem així, la feina feta serà sempre aprofitable ja que es podrà recuperar, migrar o gestionar amb les noves eines que puguin aparèixer, donant lloc a nous dipòsits físics o virtuals ajustats a les necessitats dels usuaris.

BIBLIOGRAFIA CONSULTADA

Agenjo Bullón, Xavier; Hernández Carrascal, Francisca. Influencia del ICABS en el futuro digital de las Bibliotecas. <http://www.anabad.org/admin/archivo/docdow.php?id=121> [Consulta: 17 oct. 2005]

Colorado Digitization Project. Western States Digital Standards Group (2003). Western States Digital Imaging Best practices. Version 1.0, January 2003. <http://www.cdpheritage.org/resource/scanning/documents/WSDIBP_v1.pdf>

Conjunt dels elements de metadades del Dublin Core, Versió 1.1: Descripció de referència (2001). Barcelona:Biblioteca de Catalunya <http://www.bnc.es/sprof/normalitzacio/dc/dces.php > [Consulta: 17 oct. 2005]

Estàndards de digitalització: elements mínims (2005). Barcelona: CBUC. <http://www.cbuc.es/5digital/Public0507Minims.pdf> [Consulta: 17 oct. 2005]

Recomanacions del CBUC per a la catalogació en Dublin Core de recursos web en bases de dades multidisciplinàries mantingudes per una institució del CBUC (2005). Barcelona: CBUC <http://www.cbuc.es/5digital/DCdoc2-WebCBUC.doc > [Consulta: 17 oct. 2005]

Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas y archivos (2004). Madrid: Ministerio de Cultura <http://travesia.mcu.es/documentos/pautas_digitalizacion.pdf> [Consulta: 17 oct. 2005]

Handbook for Digital Projects: a Management Tool for Preservation and Access. Maxime K. Sitts, editor. First ed. (2000). Andover, Massachusets: Northeast Document Conservation Center <http://www.nedcc.org/digital/dighome.htm> [Consulta: 17 oct. 2005]

Herbert, John; Arlitsh, Kenning (2004). “The Digital Newspapers Program at the University of Utah”. Serials Librarian, 47, 1-2

Hixson, Carol (2005). “When Just Doing It Isn't Enough: The University of Oregon

13

Page 14: 3.2.1 Localització i compleció de les col·leccions

Takes Stock”. RLG DigiNews, December 15. <http://www.rlg.org/en/page.php?Page_ID=20865> [Consulta: 30 nov. 2005]

Kenney, Anne R.; Buckley, Ellie (2005). “Developing Digital Preservation Programs: the Cornell Survey of Institutional Readiness, 2003-2005”. RLG DigiNews, August 15.<http://www.rlg.org/en/page.php?Page_ID=20865> [Consulta: 30 nov. 2005]Llevando la teoría a la práctica: tutorial de digitalización de imágenes. Cornell University Library, Department of Preservation and Conservation, (2002-2003) <http://www.library.cornell.edu/preservation/tutorial >[Consulta: 17 oct. 2005]

Mc.Meneny, D.; Hughes, Corna M. (2004). “Digitizing Collections:strategic issues for the information manager”. Alexandria, 16-2

National Digital Library Program (NDLP) for American Memory (1995- ). Library of Congress. <http://memory.loc.gov/ammem/dli2/>

Qualificadors del Dublin Core (2002). Barcelona:Biblioteca de Catalunya. <http://www.bnc.es [Consulta: 17 oct. 2005]

Quintero, Alfonso (2005). “Digitalización de la prensa latinoamericana del Sg. XIX”. En: World Library and Information Congress: 70th IFLA General Conference and Council, 22-27 august, 2005. <http://www.ifla.org/IV/ifla70/papers/057s-Quintero.pdf > [Consulta: 17 oct. 2005]

Schweder, Caren (2004). “The Retrospective Digitization of Journals from Specialized Collections in Germany”. Serials Librarian, 47, 1-2

Unesco Archives Portal. Digital Preservation http://www.unesco.org/webworld/portal_archives

Trusted Digital Repositories: Attributes and Responsibilities (2002). An RLG-OCLC Report. Mountain View, CA: RLG

NOTES

7 L’any 2001 es definiren els primers estandards mínims d’ús per a les institucions del Consorci tant a nivell de preservació com de difusió per Internet. Estàndards de digitalització: elements mínims (2005). Barcelona: CBUC. <http://www.cbuc.es/5digital/Public0507Minims.pdf>8 Els projectes consultats per la Biblioteca de Catalunya l’any 2005 per a la revisió i validació dels estàndards establerts en el marc del CBUC han estat: National Digital Library Program (NDLP) for American Memory. <http://memory.loc.gov/ammem/dli2/>; Colorado Digitization Project. Western States Digital Standards Group (2003). Western States Digital Imaging Best practices. Version 1.0, January 2003. <http://www.cdpheritage.org/resource/scanning/documents/WSDIBP_v1.pdf>; Cornell University. Report of the Digital Preservation Policy Working Group on Establishing a Central Depository for Preserving Digital Image Collections. Part 1, Responsabilities of transferee, Version 1.0, March 2001 <http://www.library.cornell.edu/preservation/IMLS/image_deposit_guidelines.pdf>; North Carolina ECHO. Guidelines for Digitization. 2005 Edition. <http://www.ncecho.org/Guide/toc.htm> i Digital Library Federation, The Digital Library Federation Benchmark Working Group (2001-2002). Benchmark for Faithful Digital Reproductions of Monographs and Serials. Version 1. December 2002. <http://www.diglib.org/standards/bmarkfin.htm>10 Torrent, Joan; Tasis, Rafael (1966). Història de la Premsa Catalana. Barcelona: Bruguera

14