la organización del conocimiento en internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... ·...

61
La organización del conocimiento en Internet Pablo Lara Navarra y José Ángel Martínez Usero

Upload: others

Post on 23-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

La organizacióndel conocimientoen InternetPablo Lara Navarra y José Ángel Martínez Usero

Page 2: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

Diseño de la colección: Editorial UOCDiseño del libro y de la cubierta: Natàlia Serrano

Primera edición digital: marzo 2018

© Pablo Lara Navarra y José Ángel Martínez Usero, del texto© Editorial UOC, de la edición© Editorial UOC (Oberta UOC Publishing, SL) de esta edición, 2018Rambla del Poblenou, 156, 08018 Barcelonahttp://www.editorialuoc.com

Realización editorial: Oberta UOC Publishing, SLISBN: 978-84-9180-179-5

Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada, reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico, químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita de los titulares del copyright.

Page 3: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

3

Nuestro contrato

Este libro le interesará si quiere saber:  

· Cúal es la diferencia entre datos, información yconocimiento.

· Cuáles son las principales características de la gestióndel conocimiento electrónico y de la sociedad delconocimiento.

· Cómo utilizar los lenguajes de marcado pararepresentar el conocimiento en los servicios web.

· Qué es la arquitectura de la información web y quéherramientas y vocabularios controlados se puedenutilizar para mejorar los sistemas de navegación yrecuperación de la información electrónica.

· Qué son los metadatos, cómo se codifican y cuálesson sus principales aplicaciones.

Page 4: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura
Page 5: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

5

Índex de continguts

Nuestro contrato 3

1. Introducción 7

2. La organización del conocimientoelectrónico

9

2.1. Los datos, la información y elconocimiento

9

2.2. De la información al conocimiento 112.3. La gestión del conocimiento 162.4. La sociedad del conocimiento 17

3. Los lenguajes de marcado en laorganización del conocimiento

21

3.1. La familia de normas SGML/XML 223.2. Las DTD de SGML 243.3. El lenguaje XML 273.4. Mecanismos para representación delconocimiento

29

3.5. Servicios de información web basadosen XML

31

3.6. XML en la organización delconocimiento interno

33

Page 6: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

6

4. Arquitectura de la información,navegación y recuperación

37

4.1. La arquitectura de la información 384.2. Sistemas de clasificación delconocimiento electrónico

41

4.3. Navegación y recuperación de lainformación web

45

5. Los metadatos y la recuperación delconocimiento

47

5.1. La función de los metadatos 475.2. Métodos para registrar y transferirmetadatos

49

5.3. Las ventajas de RDF 57

Bibliografía 59

Page 7: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

7

1. Introducción

En este libro se aclaran los conceptos de dato, in-formación y conocimiento. Se especifican los tipos deconocimiento existente. Se introducen las caracterís-ticas básicas de la gestión del conocimiento y se acla-ra la influencia de la sociedad del conocimiento en laproducción de contenidos electrónicos y la necesidadde representar el conocimiento de éstos. 

A continuación se analizan las posibilidades queofrecen los lenguajes de marcado para la clasificacióny organización del conocimiento. Se describen los ti-pos de lenguajes de marcado para estructurar la in-formación. Se presenta la familia de normas SGML/XML y las relaciones con otros lenguajes de marca-do. Se analizan las posibilidades de los lenguajes demarcado en la representación del conocimiento, paramás tarde presentar algunos ejemplos de utilizaciónde XML para el desarrollo de servicios de informa-ción y la propia gestión del conocimiento organizaci-onal. 

En el siguiente apartado se tratan las principalesherramientas y vocabularios estructurados para orga-nización del conocimiento electrónico: listas de cate-

Page 8: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

8

gorías, taxonomías, tesauros, clasificaciones facetadasy ontologías. Se destaca la función de los vocabulariosestructurados para la organización de contenidos, elfomento de la interoperabilidad de la información y eldesarrollo de sistemas de navegación y recuperaciónde la información en los servicios electrónicos. 

Finalmente, se expone la necesidad de incorpo-ración de metadatos en los recursos de informaciónweb como método para facilitar la interoperabilidadde los datos y la integración de datos heterogéneos, asícomo mejorar la recuperación de la información. Sedestaca el modelo de metadatos Dublin Core y se es-pecifican los métodos para registrar y transferir meta-datos: HTML, XML, RDF, y ciertos repositorios co-mo bases de datos y los sistemas de gestión de con-tenidos web. 

Page 9: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

9

2. La organización del conocimiento electrónico

2.1. Los datos, la información y el conocimiento

Los datos son los resultados de observacioneshumanas sobre el estado del mundo y están asociadosa un objeto o hecho concreto. Esto es, los datos sonexpresiones mínimas de información, que aisladas notienen sentido en sí mismas, pero que adquieren valordentro de un contexto determinado. Los datos pose-en tres características esenciales.  · En primer lugar, pueden ser identificados con

claridad, sin posibilidad de confusión, por conjuntosde símbolos.

· En segundo lugar, tienen un nivel elevado deestructura, es decir, la posibilidad de error en lacomunicación entre emisor y receptor es mínima.

· Finalmente, las tecnologías de la información sonmuy útiles cuando se aplican al procesamiento de losdatos.

La información está compuesta de datos orga-nizados, agrupados o clasificados en categorías que

Page 10: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

10

les dotan de significado. Además, la información estáasociada a un contexto que facilita su interpretación.Por tanto, información son datos elaborados con unsignificado para el receptor. De esta forma, la infor-mación puede entenderse como la significación queadquieren los datos como resultado de un procesoconsciente e intencional de adecuación de tres ele-mentos los datos del entorno, los propósitos y el con-texto de aplicación, así como la estructura de conoci-miento del sujeto. 

El conocimiento es la información interpretada,personalizada, que tiene valor y que está orientada a laacción, esto es, que propicia la toma adecuada de de-cisiones. El conocimiento está asociado al individuo ya la acción, constituyendo un instrumento para la to-ma de decisiones en el marco de una organización.  

Se pueden identificar dos tipos de conocimientoen una organización, y que es precisamente la conver-sión constante de un tipo al otro lo que explica la ge-neración de nuevo conocimiento.  

El conocimiento tácito es aquel que difícilmen-te puede ser formalizado, expresado en palabras (ladestreza de un músico, la inspiración de un artista, yotras), así como las habilidades personales más sim-ples que son muy difíciles de transmitir de una a otrapersona (utilizar el ordenador, montar en bicicleta,conducir un coche, y otras). Por tanto, el conocimi-ento tácito reside individualmente en cada persona.

Page 11: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

11

Las organizaciones disponen de conocimiento tácito"encapsulado" en forma de personas y difícilmente sepuede almacenar en otras formas. 

El conocimiento explícito es aquel que se pue-de expresar en forma de palabras y números, y que escompartido entre personas a través de datos, fórmu-las, especificaciones, etc. (un programa de ordenador,una patente, un catálogo, un manual, etc.). Por tanto,el conocimiento explícito es más fácilmente transmi-sible entre personas. Las organizaciones disponen degrandes cantidades de conocimiento explícito, en for-ma de procesos estandarizados, procedimientos, ma-nuales, guías, y otros documentos. 

2.2. De la información al conocimiento

Las diferencias esenciales entre datos e informa-ción se pueden sintetizar en dos. En primer lugar, lainformación es sólo aquello que el usuario consideraque le informa; los datos, aunque sean relevantes, nole aportan nada nuevo o nada que se pueda predecira partir de lo que ya sabía, el usuario no los conside-ra información. En segundo lugar, las tecnologías dela información pueden manejar muy bien los datos,pero convertir los datos en información es un proce-so básicamente humano, todavía no puede automati-zarse.  

La diferencia esencial entre información y cono-cimiento radica en que el conocimiento se refiere a

Page 12: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

12

la habilidad de entender el contexto y descubrir lasconexiones y el significado de la información. Estoes, información y conocimiento son en principio con-ceptos diferentes, pero no puede existir el uno sin elotro. La información no tiene valor por sí misma, suvalor reside en la habilidad de un individuo para apor-tarle significado y crear nuevo conocimiento. El cono-cimiento, de igual forma, carece de valor por sí mis-mo, el valor aparece cuando el conocimiento se utilizapara solucionar un problema o generar nueva infor-mación. El conocimiento sería la experiencia y capa-cidad de los individuos, unidas a los procesos y a lamemoria corporativa; y la información sería la materiaprima que el conocimiento utiliza para generar nuevoconocimiento. 

En el siguiente gráfico se representan las interre-laciones existentes entre los conceptos de dato, infor-mación y conocimiento.  

Page 13: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

13

Figura 1. Relaciones entre datos, información y conocimiento

En un sentido genérico y siguiendo la tendenciaen la evolución cualitativa del trinomio datos, infor-mación y conocimiento, se puede construir un mode-lo piramidal de esta evolución. Los datos, que son en-tidades independientes y sin significado intrínseco seconvierten en información cuando son contextuali-zados (se conoce el propósito de los datos recogidos),categorizados (se conocen las unidades de análisis olos componentes clave de los datos), calculados (losdatos son analizados matemática o estadísticamente),corregidos (se eliminan los errores existentes en losdatos), o bien, condensados (los datos se resumen enuna forma más concisa). Por tanto, usando uno o másde los cinco criterios anteriores, los datos se convier-ten en información.  

Page 14: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

14

De igual forma, la información puede transfor-marse en conocimiento cuando se producen una ovarias de las siguientes situaciones: comparación (lainformación se compara con otras informaciones yaconocidas), consecuencia (la información supone ci-ertas implicaciones para la toma de decisiones o la ac-ción), conexión (la información está o no relaciona-da con otros conocimientos), y conversación (la opi-nión de otras personas sobre la información). Se tra-ta, por tanto, de una progresión lineal donde los datosse convierten en información y ésta en conocimientomediante un proceso de agregación de valor, que sepuede representar mediante un modelo piramidal. 

Figura 2. Modelo piramidal de la información

Page 15: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

15

El conocimiento es la información internalizada,esto es, integrada en las estructuras cognitivas de lapersona, por tanto, si no hay persona, no hay conoci-miento. Pero, en los últimos años, con la influencia delas tecnologías de la información ha surgido un nue-vo punto de vista que considera que el conocimientopuede ser generado mediante la información almace-nada en la memoria humana o en la memoria artificial(electrónica).  

Cuando el conocimiento se produce a partir delprocesamiento de la información contenida en la me-moria humana, se obtiene el denominado conocimi-ento simbólico.  

Cuando el conocimiento se produce a partir delprocesamiento de la información codificada y organi-zada documentalmente (técnicas de almacenamiento,procesamiento y recuperación de la información), seobtiene el conocimiento figurativo. 

Un paso más allá, partiendo del conocimiento fi-gurativo, cuando generamos nueva información pormedio de técnicas de inteligencia artificial, se obtie-ne nuevo conocimiento, denominado conocimien-to productivo, que podría ser descrito como un tipode conocimiento artificial o información electrónicaútil. 

  

Page 16: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

16

2.3. La gestión del conocimiento

La gestión del conocimiento se ha consideradodesde una simple moda hasta que es el principio dela solución a todos los problemas de incompetenciaorganizacional. El análisis del concepto de gestión delconocimiento se inicia con el estudio de los tipos deconocimiento que se pueden dar en una organización.Una clasificación tradicional diferencia el conocimi-ento por su facilidad de comunicación y explotación.De esta forma, en una organización existen dos tiposde conocimiento: el conocimiento explícito, entendi-do como las habilidades, experiencias y hechos queestán escritos o pueden escribirse, y se comunican confacilidad; y conocimiento tácito, entendido como lashabilidades, experiencias e intuiciones de las perso-nas, que se almacenan en su mente y que no puedentransmitirse con facilidad.  

Otra forma de clasificar el conocimiento se fun-damenta en su valoración económica, diferenciandoentre tres tipos de capital:  · el capital humano se refiere al conocimiento útil

para la empresa que poseen las personas y equipos dela misma, así como su capacidad de aprendizaje,

· el capital estructural está formado porconocimientos estructurados como sistemasde información y comunicación, tecnología,procedimientos de trabajo, patentes, y otros,

Page 17: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

17

· el capital relacional hace referencia al valor quepara la organización tienen el conjunto de relacionesestablecidas con el exterior, como alianzas, contratos,colaboraciones, y otras.

Desde una perspectiva basada en la facilidad decomunicación y explotación, la gestión del conocimi-ento pretende identificar, organizar y explotar racio-nalmente el conocimiento explícito (el registrado osusceptible de serlo por la organización) y transfor-mar la mayor cantidad posible de conocimiento táci-to (el poseído por los individuos de la organización)en explícito. Por el contrario, desde una perspectivabasada en la valoración económica de los activos, lagestión del conocimiento es el arte de crear valor apartir de los activos intangibles de una organización.  

2.4. La sociedad del conocimiento

La aparición de la sociedad y economía del cono-cimiento viene impulsada por cuatro factores.  1. El fenómeno de la globalización, que interrelaciona

las economías de zonas geográficamente dispersasmediante la internacionalización de las empresas, elflujo de capitales, bienes, servicios y personas, y laapertura de nuevos mercados.

2. El fenómeno de las TIC, y en especial de Internet,que ha supuesto un incremento significativo en

Page 18: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

18

las posibilidades de comunicación y transmisión deinformación y conocimiento.

3. La tendencia de las empresas e instituciones aorganizarse de forma más distribuida, fomentandola aparición de redes geográficamente dispersas ydescentralizadas.

4. La creciente intensidad en la aplicación delconocimiento en la producción de bienes y servicios.

A partir de la segunda mitad de la década de losaños noventa del siglo XX, las tecnologías digitaleshan permitido, fomentado y ampliado notablementela importancia económica del conocimiento, median-te dos vías principales. La primera vía ha sido la espec-tacular mejora del acceso y la gestión de los flujos deinformación y conocimiento, que ha minimizado lasbarreras para la difusión de estos dos recursos, y, porconsiguiente, se ha producido un notable incrementodel conocimiento explícito. La segunda vía, estrecha-mente vinculada a la primera, ha sido la mejora de lasposibilidades de acceso y difusión de los elementosque inciden en el conocimiento tácito, básicamente,las habilidades formativas y la experiencia. 

En esta nueva sociedad/economía, el conocimi-ento pasa a ser un recurso tan significativo o inclusomás que el capital y la mano de obra. Esto es, el au-mento de conocimiento explícito, la transformaciónde conocimiento tácito en explícito y el desarrollo de

Page 19: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

19

nuevas habilidades han generado un círculo virtuosoen la producción de conocimiento, que se constituyecomo uno de los recursos estratégicos de la actividadeconómica de la actualidad. En el nuevo contexto so-cial y económico en torno al conocimiento, se otorgauna gran importancia a la generación, difusión y usode la información y conocimiento en las organizacio-nes. El buen uso del conocimiento determinará el ni-vel de éxito tanto de las organizaciones, como de laseconomías nacionales. 

Las organizaciones se enfrentan al reto deproyectarse y adaptarse a un proceso de cambio queviene avanzando muy rápidamente. Se trata de unproceso dinámico, caracterizado esencialmente por eldesarrollo de nuevas tendencias en la generación, di-fusión y utilización del conocimiento, que están de-mandando la revisión y adecuación de muchas organi-zaciones y procurando, asimismo, la creación de otrasnuevas con capacidad para asumir y orientar el cam-bio.  

En este contexto, la sociedad del conocimiento es unatendencia social y económica con capacidad para ge-nerar, apropiar, y utilizar el conocimiento para aten-der las necesidades de su desarrollo y así construir supropio futuro, convirtiendo la creación y transferen-cia del conocimiento en herramienta de la sociedadpara su propio beneficio. En la sociedad del conoci-miento, las comunidades, empresas y organizaciones

Page 20: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

20

avanzan gracias a la difusión, asimilación, aplicacióny sistematización de conocimientos creados u obteni-dos localmente, o conseguidos del exterior. El proce-so de aprendizaje se potencia en común, a través deredes, empresas, comunicación inter e intrainstitucio-nal, entre comunidades y países.  

Page 21: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

21

3. Los lenguajes de marcado enla organización del conocimiento

Un lenguaje de marcado es un conjunto de reglasque establecen qué tipo de marcas han de ser utiliza-das, de qué modo se distinguirán las marcas del textodel documentos y cómo se insertarán éstas (la gramá-tica y su sintaxis), y cuáles son las marcas permitidasen cada una de las partes del texto. De forma gené-rica, se pueden distinguir dos tipos de lenguajes demarcado: · Los lenguajes de marcado procedimentales:

orientados a la presentación de los documentos,especifican cómo debe ser procesado el testo parasu salida a través de diversos medios (pantallaordenador, impresora, etc.) Estos lenguajes noaportan información de tipo semántico o estructura;son poco flexibles, dado que cualquier cambio enla presentación del documento implica modificar sumarcado; y suelen ser lenguajes específicos de unsistema de procesamiento propietario, lo cual reducesla "portabilidad" de dichos documentos. Algunosejemplos de estos lenguajes son RTF (Rich Text

Page 22: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

22

Format) de Microsoft y PDF (Portable DocumentFormat) de Adobe.

· Lenguajes de marcado descriptivos: orientados ala descripción formal y de contenido de losdocumentos. Estos lenguajes aportan informaciónsobre la estructura del documento y describen elcontenido informacional del mismo, además, sonlenguajes más flexibles, que diferencian entre elcontenido real del documento y su representación.Algunos ejemplos son SGML, HTML, XML, etc.

3.1. La familia de normas SGML/XML

El lenguaje de marcado SGML comenzó a ges-tarse en 1969, cuando un equipo de investigadores deIBM desarrollaron GML (Generalized Markup Lan-guage). GML se desarrolló como una vía para crearla documentación básica de la empresa en un forma-to electrónico transferible y fácil de gestionar. Se tra-ta del primer lenguaje no propietario de marcado detexto (independiente del sistema en le que se creanlos documentos y de la plataforma en la que circulan)capaz de definir las estructuras lógicas de cualquier ti-po de documento basándose en un serie de normas. 

GML consiguió el estatus de norma ANSI (Ame-rican National Standards Institute) y bajo la denomi-nación de SGML (Structured Generalized Mark-upLanguage) en 1978. Esta norma fue adoptada como

Page 23: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

23

norma ISO 8879 en 1986 y forma parte de un conjun-to más amplio de normas bajo la denominación gené-rica de Information processing-text and office sys-tems-standard generalized markup language. Ademásde este conjunto de normas genéricas, la literatura ci-entífica reciente ha empezado a referirse a la familiade normas sgml/xml como al conjunto de normasy/o especificaciones subsidiarias y/o complementa-rias que constituyen un grupo normativo en tornoa la ISO 8879 de 1986. Dos ejemplos muy clarosde esta familia y ligados directamente al desarrollode SGML son, por una lado, la norma ISO 10744-1992 Information technology hypermedia/time-ba-sed structuring language, que proporciona normas es-pecíficas para establecer enlaces hipertexto en docu-mentos sgml; por otro, la norma ISO 10179-1996document style semantics and specification language,que especifica el sistema de definición de estilos. 

Hay tres características de sgml que lo distinguende otros lenguajes de marcado. Por un lado, sgml po-ne un mayor énfasis en el marcado descriptivo queen el procedimental. Por otro, introduce el conceptode tipo de documento (document type) y, por exten-sión, el concepto de definición de tipo de documento(DTD–document type definition), que se emplea pa-ra definir un tipo de documento de acuerdo con suspartes constituyentes y la estructura lógica que adop-tan dichas partes. Finalmente, sgml es independiente

Page 24: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

24

de cualquier sistema de representación del alfabeto enque esté escrito el texto. 

3.2. Las DTD de SGML

Una DTD (definición de tipo de documento) de-fine la estructura de un tipo de documento específi-co, que abarca varios aspectos: los elementos que pu-eden formar parte del tipo de documento, el nombrede los elementos y si son repetibles, el orden de loselementos, los contenidos de los elementos, que tiposde marcado pueden ser omitidos, los atributos y suvalores por defecto y los nombres de las entidadespermitidas. 

Una DTD puede desarrollarse para un documen-to en concreto o para muchos documentos. La cre-ación de una DTD para un solo documento no eseficiente, por tanto, tiene mucho más sentido crearDTDs que puedan ser usadas para muchos documen-tos. Desde la aparición de SGML se han creado nu-merosas DTDs para uso general, algunos ejemplos delas DTD de SGML que han tenido mayor repercu-sión son:  

HTML (HyperText Markup Language) 

El W3C ha desarrollado una DTD de SGML des-tinada a la presentación de la información a través deInternet. HTML iba destinado al gran público por su

Page 25: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

25

sencillez, por tanto, se primó la apariencia visual, sintener en cuenta la importancia de marcar la estructu-ra lógica de un documento electrónico. A partir deHTML 4.0 se incorporan los elementos META deHTML que pueden ser usados para describir las pro-piedades de un documento y posibilitan la incorpora-ción de los metadata Dublin Core. 

 TEI (Text Encoding Initiative)  Surge en 1987 como un proyecto del área de las

humanidades, promovido en un congreso de la Asso-ciation for Computers in the Humanities (ACH), perosu publicación efectiva para la codificación de textos,fundamentalmente literarios, es posterior (1994). Setrata de una DTD (definición del tipo de documento)madura y bien formada de SGML para asegurar unformato estándar con amplias capacidades de marca-do para la indización y el intercambio de informacióntextual. 

El esquema TEI presenta algunas ventajas conrelación a las particularidades de la metainformaciónnecesaria para la documentación de recursos infor-mativos electrónicos debido a su control documen-tal. TEI se compone de un encabezamiento seguidodel texto en sí. El encabezamiento consta, a su vez,de cuatro elementos que proporcionan información

Page 26: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

26

(principalmente bibliográfica) relativa al documentocomo fichero electrónico. 

El encabezamiento TEI constituye una de lasprincipales contribuciones para la codificación sgmlde información bibliográfica. Además, las directricesTEI incluyen un a sección especial (24.3) sobre loselementos de este encabezamiento y su relaciones conlos registros MARC. 

EAD (Encoded Archival Description) DTD. 

La DTD de EAD define una clase de documen-tos, que, en términos generales, constan de una pági-na de título opcional, la descripción de una unidad dematerial archivístico y unas apéndices también opci-onales. Esta DTD posibilita el empleo de xml a partirde su versión 1.0 y ha sido diseñada para reflejar lajerarquía natura que presenta la organización de losfondos, en conjunción con el orden intelectual queimponen los archiveros con sus prácticas descripti-vas. 

MARC (Machine Readable Catalogue)DTD. 

La DTD de MARC, trata el formato MARC co-mo un tipo de documento específico. La DTD defi-ne todos los elementos que pueden aparecer en un

Page 27: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

27

registro MARC y especifica como se deben codificary representar en sgml. El objetivo principal de MARCDTD fue que los registros se pudieran importar y ex-portar a sgml automáticamente, para ello se ha segui-do la estructura de un registro MARC, incluyendo lasetiquetas, indicadores y códigos de subcampo. 

3.3. El lenguaje XML

XML es un proyecto del World Wide Web Con-sortium (W3C) y su desarrollo está coordinado porel XML working group. Se trata de un subconjunto(o simplificación) adaptado de SGML que tiene la in-tención de aprovechar sus máximas ventajas posibles,pero permitiendo su implementación en Internet. 

El lenguaje XML consta de cuatro especificacio-nes (recomendaciones de W3C): 

DTD (Document Type Definition): Definiciónde tipo de documento. Se trata de un archivo que en-cierra una definición formal de un tipo de documentoy, a la vez, especifica la estructura lógica de cada docu-mento. El DTD en XML es opcional. En tareas sen-cillas no es necesario construir una DTD, entonces setrataría de un documento "bien formado" (well-for-med). Si se construye una DTD, entonces será un do-cumento "validado" (valid). 

XSL (eXtensible Stylesheet Language): Lengua-je de estilo para XML. Se trata de un lenguaje paraelaborar hojas de estilo. Consta de tres partes: XSL

Page 28: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

28

Transformations (XSLT), que es un lenguaje paratransformar documentos XML; XML Path Language(Xpath), que es un lenguaje de expresión usado porXSLT para acceder o referir partes de un documen-to XML (Xpath se usa también en la especificaciónXML Linking); XSL Formatting Objects, es un voca-bulario para especificar la semántica del formato. 

XLL (eXtensible Linking Language): Lenguaje deenlaces en XML. Define el modo de actuación en-tre diferentes enlaces. Se considera un subconjuntode HyTime (ISO 10744) y sigue algunas especificacio-nes de TEI. XLL tiene dos importantes componen-tes: Xlink y Xpointer, con los que se va mucho másallá de los enlaces simples soportados por HTML, losenlaces pueden ser bidireccionales, múltiples (anillos,múltiples ventanas, etc.), agrupados (múltiples oríge-nes). 

XUA (XML User Agent): Estandarización de na-vegadores XML. Se aplica a los navegadores para quesean capaces de reconocer todas las especificacionesXML. 

Las características esenciales de XML son:  · XML es una arquitectura abierta y extensible.

No necesita versiones para funcionar en futurosnavegadores.

· XML posee mayor consistencia, homogeneidad yamplitud de los identificadores descriptivos del

Page 29: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

29

documento (RDF), en comparación con los atributosde la etiqueta de HTML.

· XML permite agrupar una amplia variedad de datos yaplicaciones, desde páginas web hasta bases de datos.

· XML consigue que la estructura de la informaciónresulte más accesible, por tanto, los motores debúsqueda devolverán respuestas más adecuadas yprecisas.

· XML permite el desarrollo de búsquedaspersonalizables para robots y agentes inteligentes.

· XML desarrolla ampliamente el concepto de"hipertexto" mediante enlaces bidireccionales,enlaces que pueden especificarse y gestionarse desdefuera del documento, hiperenlances múltiples, enlacesagrupados, atributos para enlaces, etc.

· XML facilita la exportabilidad a otros formatos depublicación (papel, web, cd-rom, etc.)

3.4. Mecanismos pararepresentación del conocimiento

Cada lenguaje de marcado de información utili-za mecanismos diferentes para la representación delconocimiento contenido en un documento. En esteapartado vamos a tratar de los dos lenguajes de mar-cado más extendidos para la publicación de conteni-dos en Internet: HTML y XML. Para ambos lengua-

Page 30: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

30

jes determinaremos los mecanismos que podríamosdenominar de representación del conocimiento do-cumental o codificación de la meta información do-cumental. 

Dublin Core (DC) 

La Iniciativa de Metadatos Dublin Core es actu-almente una iniciativa consorciada para el desarrollodel modelo de metadatos Dublin Core, surgido ori-ginariamente en 1995 en el ámbito bibliotecario. Sudesarrollo, acorde con la evolución de Internet, lo haconvertido en un formato altamente normalizado yutilizado en distintos sectores. El modelo DC se com-pone de un conjunto de 15 elementos que describenel conocimiento contenido en un recurso de una for-ma estructurada. 

Resource Description Framework (RDF)

RDF es sin duda alguna el estándar en desarro-llo más importante para la descripción de contenidosweb. Su importancia reside, por un lado en la enti-dad Consorcio Web (W3C) quien fomenta el proyec-to, y por otro, el hecho de ser una aplicación de me-tadatos que utiliza XML a fin de proporcionar unmarco estándar para la interoperabilidad entre dis-tintos modelos de metadatos para la representación

Page 31: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

31

de los conocimiento (metainformación) contenido enun documento (como por ejemplo el DC, que admitelas especificaciones RDF a partir de la versión DC5). 

Desde que RDF se convirtió en una recomenda-ción de W3C en febrero de 1999, se han desarrolladoun buen número de herramientas que permiten tra-bajar con RDF de una forma más eficiente. 

RDF ofrece una variedad de aplicaciones, ta-les como: catálogos de biblioteca y directorios web(ejemplos: Dublin Core Metadata Initiative, OCLCConnexion, Open Directory Project, etc.); categori-zación y gestión de listas de noticias, software y con-tenidos (PICS, XMLNew, UK Mirror Service), asícomo, colecciones de música, fotos y eventos (Mu-sicBrains metadata initiative, RDFPic, etc.); usandoXML como sintaxis de intercambio.  

3.5. Servicios de informaciónweb basados en XML

Las organizaciones que prestan servicios de in-formación deben diseñar sistemas eficaces para ges-tionar y difundir la información. Con la aplicación delas tecnologías de la información en el desarrollo eimplementación de sistemas de información y la uti-lización de la tecnología web, un porcentaje muy altode los servicios de información se fundamentan eninformación electrónica. En este contexto la familiade normas sgml resulta clave, puesto que asegura la

Page 32: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

32

consistencia (en la producción, el procesamiento, elalmacenamiento y la distribución) y proporciona unaenorme flexibilidad (en la presentación y en el forma-to, por ejemplo). 

Los profesionales de la información están muyinteresados en el potencial de XML para la organiza-ción de la información. Uno de los campos de mayoractividad consiste en la sustitución de MARC usandotecnología XML, de hecho la Library of Congress yotras organizaciones ya han llevado a cabo este tipode proyectos.  

Cada día son más numerosos los proyectos xmlque se están emprendiendo en el ámbito de los ser-vicios de información comercial. Se trata de aplicaci-ones relacionadas con dominios muy variados: ban-ca, telecomunicaciones, revistas electrónicas, etc. Es-ta proliferación de aplicaciones xml no significa queéste vaya a sustituir a sgml. En principio, manteneruna o varias bases de datos sgml y filtrarlas a xml paralas operaciones de indización, otros tratamientos delos datos y distribución en la web, se conforma comouna estrategia a largo plazo con gran posibilidad deéxito. De hecho, la mayoría de las bibliotecas digitalesmantienen sus datos en sgml, pero distribuyen la in-formación en xml. 

Page 33: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

33

3.6. XML en la organizacióndel conocimiento interno

La literatura científica reciente se centra en lasventajas de XML para el desarrollo de sitios web y suaplicación a las tecnologías de búsqueda y recupera-ción de información web. En esta ocasión es necesa-rio tener en cuenta los usos de XML para la gestióndel conocimiento organizacional. XML es un lenguajeque presenta simultáneamente el contenido para serpublicado en Internet y describe este contenido deforma que otro software puede entender y usar esteconocimiento. La clave de XML es que, en oposicióna HTML, proporciona información sobre el significa-do de los datos, lo que va a facilitar el procesamientoautomático de la información contenida en la infor-mación (meta información) y la consiguiente gestióndel conocimiento.  

XML se empieza a considerar como "la próximarevolución en la gestión del conocimiento", y las or-ganizaciones están empezando a entender el potenci-al de esta tecnología para el desarrollo de arquitectu-ras de información corporativas. 

La tecnología XML por sí misma no reportanningún valor a la organización, su valor depende decómo se use esta tecnología dentro de la organización.Su implementación no debe ser departamental e, ide-almente, debería incluir a partners estratégicos y otras

Page 34: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

34

organizaciones con las que se necesita compartir da-tos e información. Un ejemplo claro de los beneficiosde XML en la gestión de la información corporativaconsiste en la creación de portales corporativos queofrecen prestaciones para diferentes funciones de ne-gocio, tales como: ERP, datwarehousing, sistemas deapoyo a la decisión y gestión del cocimiento organi-zacional.  

Entre las aplicaciones estratégicas que XML pu-ede tener dentro de una organización podemos des-tacar: 

Cadena de suministro: La gestión eficiente delconocimiento organizacional depende del acceso a lainformación externa. XML puede ayudar a mejorar elfuncionamiento de la cadena de suministro y la extra-net de la organización. Muchas organizaciones nece-sitan compartir información y no siempre tienen unavía para hacerlo, puesto que tienen infraestructurastecnológicas diferentes y no compatibles con algunosagentes de la cadena de suministro o con los clientes.XML puede proporcionar una forma estándar paraintercambiar información con proveedores, distribui-dores y clientes, lo cual se convierte en una diferenciacompetitiva para la organización capaz de gestionarla cadena de suministro mediante XML. 

Page 35: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

35

Retorno de Inversiones (ROI): Los documen-tos XML pueden producir diferentes outputs y unavez que la información organizacional está organiza-da en documentos XML, se pueden elaborar multi-tud de productos y servicios de información vía web,así como en diferentes plataformas: PDA, telefoníamóvil, televisión digital, etc. La creación de un cor-pus de conocimiento organizacional en XML suponeun gran esfuerzo de inversión, pero pronto reportaun ahorro en los costes directos relacionados con lainversión en tecnologías de la información, la forma-ción de los empleados y los servicios de soporte. 

 Gestión integral del conocimiento: XML po-

see un conjunto de características que lo conviertenen una aliado para la gestión del conocimiento orga-nizacional. Si se combina el potencial de XML y lasposibilidades de RDF, como herramienta para la ges-tión del conocimiento que permite organizar, interre-lacionar, clasificar y anotar el conocimiento conteni-do en los documentos XML, se puede obtener un in-cremento considerable del valor añadido de los datosalmacenados en los documentos XML y conlleva unagestión automática del conocimiento explícito de laorganización. 

 

Page 36: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura
Page 37: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

37

4. Arquitectura de la información,navegación y recuperación

Los servicios electrónicos generalmente adoptanuna estructura hipertextual y un formato web que pu-eden ocasionar una serie de problemas en cuanto a lanavegación por los contenidos y la recuperación deinformación útil. Estos problemas suelen estar rela-cionados con la sobrecarga cognitiva y la desorien-tación. Para superar tales problemas los sistemas declasificación, como herramientas para la organizaciónde contenidos web, contribuyen a facilitar la recupe-ración de información y el aprendizaje de estrategiasde navegación. A este respecto, la característica prin-cipal del aprendizaje que se produce a través de la na-vegación hipertextual estriba en la posibilidad de or-ganizar determinados conocimientos según estructu-ras diferentes que permitan al usuario conseguir suobjetivo. 

Tradicionalmente, un sistema de clasificación serefiere a un lenguaje documental que organiza lógica-mente una estructura de conceptos y/o notaciones, yque está destinado a permitir la clasificación de docu-mentos conforme a sus respectivas temáticas. El sis-

Page 38: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

38

tema de clasificación, como todo lenguaje documen-tal, establece tres tipos de relaciones básicas entre losconceptos que lo integran: de sinonimia o identidad,jerárquicas o asociativas. En cuanto a su tipología pu-eden ser muy diversos: por su cobertura temática pu-eden ser universal o especializado; pueden tener bajo,medio o alto nivel de especificidad según el detalle yla profundidad de su desarrollo; y pueden clasificarsecomo enumerativo, prefacetado o facetado, de acuer-do con sus características estructurales. En general,los sistemas de clasificación son aplicables a un uni-verso indeterminado de objetos y por ello favorecenla organización lógica de un ámbito de conocimien-to. 

4.1. La arquitectura de la información

En el ámbito de la información electrónica y la ar-quitectura de contenidos web se entiende por clasifi-car la actividad de agrupar los elementos de informa-ción de acuerdo a atributos o propiedades comunesentre ellos. Los elementos de información en realidadson contenidos, esto es, aquellos 'trozos' de informa-ción u objetos informativos a organizar, estructurar yclasificar, que pueden ser: textos, imágenes, videos, yotros Por tanto, un sistema de clasificación consisteen elegir en base a qué atributos se agrupan los con-tenidos y cómo se organizan estos atributos.  

Page 39: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

39

Siguiendo a Rosenfield y Morville, los sistemas declasificación pueden ser exactos o ambiguos. En lossistemas de clasificación exactos, los contenidos estánperfectamente definidos y diferenciados del resto; unejemplo de este tipo de sistemas son la clasificaciónalfabética, la cronológica y la geográfica. En los siste-mas de clasificación ambiguos, los contenidos estánorganizados en categorías no definidas de forma ex-acta y precisa; un ejemplo de este tipo de sistemasson la clasificación temática o por categorías, la clasi-ficación orientada a tareas, la clasificación orientada ala audiencia o tipología de usuarios, y la clasificaciónmetafórica. Todos ellos son sistemas válidos para or-ganizar los contenidos web de una organización y seutilizan actualmente para facilitar el acceso a la infor-mación corporativa, y a los servicios y productos delas organizaciones públicas. 

La visión tradicional de sistemas de clasificaciónenlaza con la actual perspectiva de la disciplina de Ar-quitectura de la Información. El término arquitecturade la información fue utilizado por primera vez porRichard Saul Wurman en 1975, quién la define comoel estudio de la organización de la información con elobjetivo de permitir al usuario encontrar su vía de na-vegación hacia el conocimiento y la comprensión dela información. Por tanto, la arquitectura de la infor-mación restringida al ámbito web sería el arte y la ci-encia de estructurar y clasificar sitios web con el fin de

Page 40: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

40

ayudar a los usuarios a encontrar y manejar la infor-mación. De esta definición se desprende que la arqui-tectura de la información de un sitio web, comprendelos sistemas de organización y estructuración de loscontenidos, los sistemas de rotulado o etiquetado dedichos contenidos, y los sistemas de recuperación deinformación y navegación que provea el sitio web. 

Teniendo en consideración la visión tradicionalde los sistemas de clasificación y combinándolos conlas nuevas tendencias en cuanto a sistemas de clasifi-cación en el entorno web, las herramientas tradicio-nales, como las listas de términos, las taxonomías, lostesauros, y otros, se pueden utilizar para proceder ala clasificación y organización del conocimiento elec-trónico, fundamentalmente en los sistemas de clasifi-cación ambiguos. La arquitectura de la informaciónincluye muchos aspectos diferentes sobre la creacióny organización de un sitio web, pero sus herramientasprincipales son las técnicas de organización de infor-mación desarrollada en otras disciplinas. De hecho, lamayoría de estas técnicas provienen de la Documen-tación, en particular en lo referente a vocabularios es-tructurados.  

    

Page 41: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

41

4.2. Sistemas de clasificacióndel conocimiento electrónico

Para realizar las tareas de clasificación de los con-tenidos en un sitio web corporativo, se pueden utili-zar diferentes herramientas de clasificación temáticao por materias, que van a contribuir a la orientacióndel usuario de los servicios web y a la mejoría en larecuperación de información, puesto que ésta ha sidoorganizada a priori mediante listas de categorías, taxo-nomías, tesauros o clasificaciones facetadas, de acu-erdo con las características del servicio o producto deinformación web. Todas las herramientas menciona-das son vocabularios controlados y estructurados quese utilizan para etiquetar contenidos y para la posteri-or localización de estos contenidos mediante sistemasde navegación o búsqueda. Sin embargo la definiciónespecífica de estas herramientas es muy difusa y noexiste una definición única y consensuada, que per-mita diferenciar claramente, por ejemplo, entre listade categorías y taxonomía, dado que las definicionesexistentes en la literatura científica tienden a ser muyheterogéneas entre sí. Por tanto, se aporta una defini-ción muy escueta y genérica que se adapte al propó-sito de este artículo. 

Una lista de categorías es una lista controlada de tér-minos que denota una materia y que se utiliza para cla-sificar, indizar y recuperar recursos de información.

Page 42: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

42

La función de la lista de categorías consiste en evitaral usuario definir términos sin un significado específi-co, términos demasiado amplios o excesivamente res-trictivos, o términos muy semejantes en cuanto a laforma. 

El término taxonomía proviene del área de las Ci-encias Naturales, en particular de la Biología, que es-tudia la clasificación de los seres vivos en estructu-ras jerárquicas. Se trata de un término muy utilizadoen Arquitectura de la Información, y según en quécontexto se utilice, se le podría asignar un significadou otro. De forma muy esquemática, una taxonomíaes una lista estructurada y jerárquica de elementos ogrupos de elementos, que presenta una forma arbó-rea. Una taxonomía es la organización jerárquica delconjunto de categorías (palabras clave) bajo las queclasificar las unidades de contenido. Por ejemplo, enel caso de un servicio de administración electrónicabasado en eventos de la vida, se identifican bajo la ta-xonomía "estudios", las categorías: "estudios prima-rios", "estudios secundarios", "estudios universitari-os", y "otros estudios". Por tanto, la función de la ta-xonomía en la organización de los contenidos webreside en la posibilidad de agrupar términos jerárqui-camente relacionados bajo una taxonomía que facili-te encontrar el término correcto para la búsqueda odescripción de un contenido específico. 

Page 43: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

43

Los tesauros se pueden considerar una taxonomíacon extras, ya que permiten representar la realidadmediante términos no sólo organizados de formajerárquica, sino permitiendo otro tipo de relacionesentre ellos, como son la relación de equivalencia y deasociación. La tesauros están normalizados mediantela norma ISO 2788, en la que se define tesauro co-mo "un vocabulario controlado y dinámico, compu-esto por términos que tienen entre ellos relacionessemánticas y genéricas y que se aplica a un dominoparticular del conocimiento". Además de la mencio-nada función de control del vocabulario, el tesauroconstituye una herramienta que representa, por unaparte, la estructura de los conocimientos transmitidospor los creadores de la información (arquitectos dela información), y, por otra, la estructura cognitiva delos usuarios que formulan la expresión de búsqueda.  

La clasificación facetada parte de la premisa de queuna unidad de contenido puede ser descrita a travésde varias dimensiones o facetas, cada una de las cua-les contiene su propia relación de posibles valores ocategorías. La clasificación por facetas fue propues-ta en 1933 por Ranganathan, y es también conocidacomo clasificación colonada. Las clasificaciones face-tadas se utilizan para organizar conjuntos de objetos(sitios web, productos, documentos, y otros), con unahomogeneidad suficiente como para que puedan serdescritos por un número determinado de atributos o

Page 44: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

44

propiedades (facetas y categorías) y sus valores (per-tenencia a categorías). En principio, la clasificaciónpor facetas parece muy diferente de un tesauro, pero,de hecho, una clasificación facetada puede ser consi-derada como una vía adecuada para construir un te-sauro o bien para ser utilizada con propósitos de cla-sificación de contenidos. En el ámbito de los servici-os web existe un lenguaje con sintaxis XML para de-finir, distribuir e intercambiar metadatos en forma detaxonomías facetadas. Este lenguaje ha sido desarro-llado por Peter van Dijck y se denomina XFML (eX-changeable Faceted Metadata Language). 

Ontologías son los instrumentos o modelos deestructuras con una traducción tecnológica que pue-den usarse para la presentación y uso en web de catá-logos, bases de datos, listas de encabezamiento, glo-sarios, tesauros, por ejemplo; e implican una especi-ficación, conceptualización y modelización del cono-cimiento que se recoge en cada uno de los lengua-jes documentales. Como se observa por la definiciónaportada, se puede establecer cierto paralelismo entreontología y tesauro; fundamentalmente, en la delimi-tación de los términos que deben formar parte de unaconstrucción de representación del conocimiento, yde las relaciones que se establecen entre los términos. 

Page 45: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

45

4.3. Navegación y recuperaciónde la información web

Existen dos formas básicas de arquitectura de lainformación en los que se utiliza control del vocabula-rio para la clasificación de contenidos con el objeto deorganizar el conocimiento electrónico: los esquemasde navegación y los sistemas de recuperación. Los es-quemas de navegación no pueden ser ambiguos, y seutilizan para orientar a los usuarios sobre la tipologíade los recursos de información disponibles en un si-tio web. En los sistemas de recuperación de informa-ción, el usuario utiliza términos o frases para expresarsu necesidad de información, en general, utilizandoun formulario de consulta que puede incluir uno omás campos. La cuestión radica en que ambas formasde acceso a la información son necesarias, puesto queson complementarias y para ambas es necesario cier-to control del vocabulario. 

La información debe organizarse de una formacoherente, de tal manera que el usuario pueda accedera la información deseada e importante para él/ella deuna manera rápida y eficaz. La organización de la in-formación es esencial para que el sistema de informa-ción sea útil.  

La arquitectura de la información de un sitio webcomprende los sistemas de organización y estructu-ración de los contenidos, los sistemas de rotulado o

Page 46: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

46

etiquetado de dichos contenidos, y los sistemas de re-cuperación de información y navegación que proveael sitio web.  

Un buen sistema de información requiere algomás que la materia prima. Y esta necesidad de organi-zación es cada vez más clara conforme el usuario dis-pone de menos tiempo para poder dedicar a moversepor las fuentes. La organización de la información esesencial para que el sistema de información sea útil.La organización de la información en un sistema, porejemplo en una página web, es responsabilidad del ar-quitecto de información. 

Page 47: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

47

5. Los metadatos y larecuperación del conocimiento

Metadato es toda aquella información descripti-va sobre el contexto, calidad, condición o caracterís-ticas de un recurso que tiene la finalidad de facilitarsu recuperación, autentificación, evaluación, preser-vación o interoperabilidad. Para la aplicación de me-tadatos se han desarrollado distintos modelos, esque-mas o estándares de metadatos, que si bien compartenuna sintaxis y estructura de la información XML, di-fieren atendiendo a los propósitos de la informaciónque describen y a sus necesidades de especificidad ygestión remota de los recursos en cuestión 

5.1. La función de los metadatos

La aplicación de metadatos supone una mejoraen la organización y recuperación de la información,tanto de forma humana como automatizada. La granincógnita en este sentido consiste en determinar losbeneficios específicos que aportan los metadatos enla búsqueda y recuperación de la información web,sobre todo cuando muchos motores de búsqueda noutilizan los metadatos como un criterio en la inde-

Page 48: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

48

xación de los recursos electrónicos y, por tanto nose utilizan para la búsqueda. Si embargo, existe unaamplia gama de software de motor de búsqueda parala indexación de los recursos del sitio web, la Intra-net y los productos electrónicos (CD-ROMs, DVDsy otros productos que utilicen tecnología web) de lasorganizaciones que indexan y gestionan metadatos.  

Algunos motores de búsqueda (como Convera,Harvest, Blue Angel, Microsoft Site Index, etc.) soncapaces de utilizar los metadatos y otras herramien-tas de representación del conocimiento (como onto-logías y topic maps) para obtener mejores resultadosen la recuperación. Por tanto, aunque las organizacio-nes públicas pueden sentirse reticentes ante la incor-poración de metadatos en sus recursos de informa-ción debido al esfuerzo económico que ello supone(coste de personal y tecnología), es importante que lasorganizaciones que desarrollan servicios y productosweb tomen conciencia de la importancia de los meta-datos para mejorar la relevancia de los sistemas de re-cuperación de información, así como para facilitar laintegración y combinación de recursos heterogéneosen el desarrollo de servicios electrónicos y mejorar elacceso de los usuarios a los recursos.  

Los sistemas de recuperación de la informaciónen Internet de propósito general (motores de búsque-da) se basan en la extracción automática de la infor-mación y utilizan sencillas técnicas para representar

Page 49: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

49

el conocimiento contenido en los recursos electróni-cos. Por tanto, no pueden dar una respuesta precisa auna pregunta concreta sobre el contenido semánticode los documentos y por ello, recuperan mucho rui-do. Sin embargo, los sistemas de recuperación en sec-tores específicos, como la información pública, dadoque todos los recursos de información son objeto dedescripción, organización y control del vocabulario,ofrecen mayor relevancia en la recuperación.  

La existencia de un compromiso para que la in-formación de carácter público se adapte a unos están-dares, y contemple el uso de metadatos en todos losrecursos electrónicos y digitales, favorece la recupera-ción de la información en este ámbito de conocimi-ento. La clave esencial reside en la aplicación de meta-datos de forma sistemática, normalizada y coherente.Con este proceso se facilita la descripción de todos losrecursos de la organización (aplicación sistemática), elintercambio de información (mediante la normaliza-ción), y su adaptación a nuevas formas tecnológicas(aplicación coherente). 

5.2. Métodos para registrary transferir metadatos

Los metadatos, por el momento, son la herrami-enta más extendida de representación del conocimi-ento web para favorecer la recuperación de informa-ción. El modelo de metadatos más difundido y utiliza-

Page 50: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

50

do es Dublin Core, que originalmente se aplicaba so-bre el lenguaje de marcado HTML, y que actualmen-te puede aplicarse a diferentes entornos tecnológicos.La situación ha variado considerablemente en los úl-timos años, de forma que para garantizar la interope-rabilidad entre los propios metadatos se han desarro-llado múltiples métodos para registrar y transferir me-tadatos Dublin Core. Los más comunes son: HTML,XML, RDF y las bases de datos relacionales.  

La Iniciativa de Metadatos Dublin Core es actu-almente una iniciativa consorciada para el desarrollodel modelo de metadatos Dublin Core, surgido ori-ginariamente en 1995 en el ámbito bibliotecario. Sudesarrollo, acorde con la evolución de Internet, lo haconvertido en un formato altamente normalizado yutilizado en distintos sectores. El modelo DC se com-pone de un conjunto de 15 elementos que describenel conocimiento contenido en un recurso de una for-ma estructurada. En la siguiente tabla se agrupan loselementos según su función: descripción de conteni-do, determinación de la propiedad intelectual o la ins-tanciación de recursos. 

Page 51: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

51

 Tabla de los 15 elementos DC  Contenido:   

· Title (titulo)

· Subject (tema)

· Description (descripción)

· Source (fuente)

· Languaje (lenguaje)

· Relation (relación)

· Coverage (cobertura).

 Propiedad intelectual:  

· Creator (autor)

· Publisher (editor) y, otras colaboraciones

· Contributor (otros autores/colaboradores)

· Rights (derechos).

 Instanciación:  

· Date (fecha)

Page 52: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

52

· Type (tipo de recurso)

· Format (formato)

· Identifier (identificador)

Para la codificación de los metadatos se puedenutilizar diferentes métodos dependiendo del nivel dedesarrollo tecnológico de la organización. En princi-pio la codificación de los elementos DC se realizabaen la cabecera de un documento HTML, en el con-texto de los elementos META y embebido en el con-tenido del propio documento.  

Page 53: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

53

Ejemplo de registro DC en HTML

La evolución de las tecnologías web ha permiti-do que en XML, los elementos de metadatos se regis-tren de una forma más estructurada, por ejemplo enforma de namespaces o esquemas XML (XML Schemeso XMLS). Por su parte, RDF (Resource Description

Page 54: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

54

Framework / Marco para la Descripción de Recur-sos) es el estándar más importante para la descripciónde contenidos web y posee el mayor potencial para laexpresión de metadatos. De forma similar, la gestiónde metadatos también puede realizarse en el contextode un sistema de gestión de bases de datos e inclusoen un sistema de gestión de contenidos web. Ello ase-gura que se utilicen procedimientos para garantizarla consistencia y sincronización entre los metadatos ylos recursos web que describen.  

La noción de namespaces (espacios de nombres)es parte fundamental de la infraestructura web y par-ticularmente de XML. Son una parte crítica de lainfraestructura necesaria para desplegar sistemas demetadatos modulares en la web. Las declaracionesde namespace permiten al diseñador de esquemas demetadatos definir el contexto para un término par-ticular, asegurando que el término tiene una única de-finición dentro de los límites del namespace declara-do. 

Page 55: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

55

Ejemplo de registro DC en RDF

Page 56: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

56

Ejemplo de registro DC en XML

Page 57: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

57

5.3. Las ventajas de RDF

De los sistemas de codificación de metadatosdestaca RDF, que es un sistema de metadatos que sir-ve tanto para la descripción por sí mismo de recur-sos electrónicos, como para envolver otros sistemasde metadatos con el fin de lograr un marco genéricode trabajo, facilitando de esta forma la interconexiónentre diferentes métodos de descripción. Su impor-tancia reside en que una organización como el W3Cfomenta el proyecto, y en el hecho de ser una aplica-ción de metadatos que utiliza XML, a fin de proporci-onar un marco estándar para la interoperabilidad en-tre distintos modelos de metadatos para la representa-ción del conocimiento (metainformación) contenidoen un recurso. RDF está constituido por un conjuntode especificaciones técnicas desarrolladas por W3Cpara la normalización de los metadatos en XML. Des-de que RDF se convirtió en una recomendación deW3C, en febrero de 1999, se han desarrollado un bu-en número de herramientas que permiten trabajar conRDF de una forma más eficiente. 

El sistema de metadatos RDF proporciona unaherramienta genérica para la creación, gestión y bús-queda de datos inteligibles por máquinas en la web; yse trata de una capa adicional (semántica) sobre XML(sintáctica) que simplifica la reutilización de términosde vocabulario entre namespaces. Las ventajas esenci-

Page 58: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

58

ales de RDF son las siguientes: proporciona las basespara la interoperabilidad en los metadatos; proporci-ona una semántica para la creación de metadatos in-teligibles por máquinas; ofrece mayor precisión en larecuperación de recursos que las búsquedas a textocompleto; y permite la automatización del descubri-miento de recursos (como los motores basados en ro-bots) y la indexación de los recursos inteligentemente(como los motores basados en directorios).  

Page 59: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

59

Bibliografía

· CORKERN, Carla. XML application integration andknowledge management. XML Europe 2001. How XMLpowers industry applications. 21-25 May 2001. Berlin.

· DíAZ ORTUÑO, Pedro Manuel. "Problemática ytendencias en la arquitectura de metadatos web". En: Analesde documentación, 2003, n. 6, pp. 35-58.

· EDEN, Brad. Metadata standards. Library technologyreports, September-October 2002.

· GARCíA JIMÉNEZ, Antonio. Instrumentos derepresentación del conocimiento: tesauros versus ontologí­as.Anales de documentación, 2004, num. 7. p. 79-95.

· GARDNER, John Robert. Information architectureplanning with XML. Library Hi Tech, vol. 19, num. 2,2001, p. 231-241

· MARTíN GALAN, Bonifacio; RODRíGUEZMATEOS, David. Estructuración de la informaciónmediante XML: un nuevo reto para la gestión documental.VII Jornadas Españolas de Documentación: lagestión del conocimiento, retos y soluciones de losprofesionales de la información, Bilbao, octubre de2000. p.113-123

Page 60: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

60

· MARTINEZ USERO, José Angel. El uso demetadatos para mejorar la interoperabilidad del conocimientoen los servicios de administración electrónica. El profesionalde la información, 2006, vol.15, n. 2, pp. 114 -126.http://www.ucm.es/eprints/5638/

· MARTÍNEZ USERO, José Ángel; BELTRÁNORENES, María Pilar. Ontologies in thecontext of knowledge organization and interoperability ine-government services. EN: Conference on Digital Divide,Global Development and the Information Society,2005,Túnez. http://www.ucm.es/eprints/5631/

· MENDOZA, Cornelius. Another useof XML: internal knowledge management.Serverworld Magazine, June 2000,Issue 6. http://www.serverworldmagazine.com/compaqent/2000/06/anotheru.shtml

· MONTERO, Yusef Hassan; NUÑEZ PEÑA,Ana. (2005).Diseño de arquitecturas de información:descripción y clasificación.

· PEIS, Eduardo; MOYA, Felix de. SGML y serviciosde información. El profesional de la información, vol. 9,num. 6, junio 2000, p. 4-17

· Resource Description Framework (RDF). W3CSemantic Web Activity. http://www.w3c.org/RDF/

· ROSENFELD, Louis; Morville, Peter. Informationarchitecture for the World Wide Web: designing large-scale websites. O'Reill, 2002.

Page 61: La organización del conocimiento en Internetopenaccess.uoc.edu/webapps/o2/bitstream/10609... · 4.Arquitectura de la información, navegación y recuperación 37 4.1. La arquitectura

61

· SAN SEGUNDO, Rosa; BELTRÁN, Pilar.Aplicación de ontologí­as en la organización de información enInternet. En: CISCI 2003. Memorias. 2da. Conferenciaiberoamericana en sistemas, cibernética e informática.Orlando (Florida).

· SERRADELL LÓPEZ, Enric; JUAN PÉREZ,Ángel A. La gestión del conocimiento en la nueva economí­a.(2003). http://www.uoc.edu/dt/20133/index.html.