· web viewjunto con el título, resumen y datos identificativos habría que mostrar extractos...

39
PRESENTE Y FUTURO DE LAS BASES DE DATOS JURÍDICAS EN ESPAÑA I Convención Internacional de Derecho Informático, Documentación y Documento Electrónico Universidad Externado de Colombia, Bogotá 18 DE OCTUBRE DE 2006 WOLTERS KLUWER ESPAÑA, S.A. C/ Collado Mediano 9 28230 Las Rozas (Madrid) Tf.: 91 602 00 00 / 70 Ponentes:

Upload: others

Post on 03-Jan-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

PRESENTE Y FUTURO DE LAS BASES DE DATOS JURÍDICAS EN

ESPAÑAI Convención Internacional de Derecho

Informático, Documentación y Documento Electrónico

Universidad Externado de Colombia, Bogotá

18 DE OCTUBRE DE 2006

WOLTERS KLUWER ESPAÑA, S.A.C/ Collado Mediano 928230 Las Rozas (Madrid)Tf.: 91 602 00 00 / 70

Ponentes: Salvador Fernández [email protected], Ingeniero Superior de Caminos, Canales y Puertos; CEO - Consejero Delegado de Wolters Kluwer España, S.A. (LA LEY, CISS, A3 SOFTWARE, ESPECIAL DIRECTIVOS, PRAXIS, ECOIURIS, COLEX DATA, TELESOFTWARE, WK PORTUGAL).Cristina Retana [email protected], Licenciada en Derecho por la Universidad Complutense de Madrid; Directora de Procesos Editoriales de Wolters Kluwer España, S.A.

Page 2:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

2

Page 3:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

ÍNDICE

1. INTRODUCCIÓN.........................................32. LAS BASES DE DATOS JURÍDICAS EN ESPAÑA. SITUACIÓN ACTUAL..........................43. FUTURO...................................................8

HACIA LA GESTIÓN DEL CONOCIMIENTO................8LA TECNOLOGÍA AL SERVICIO DE LA INFORMACIÓN10

1. GLOBALIDAD DE LA INFORMACIÓN JURÍDICA...................102. USABILIDAD Y AUTOAPRENDIZAJE................................123. FORMAS DE ACCESO A LA INFORMACIÓN.......................14

4. PERSONALIZACIÓN DE LA INFORMACIÓN POR LOS USUARIOS 165. INTEGRACIÓN DE HERRAMIENTAS DE CONSULTA Y DE GESTIÓN

186. EVOLUCIÓN DE LOS ALGORITMOS DE BÚSQUEDA............19

A) RELEVANCIA...............................................................20B) SEMÁNTICA Y MULTILENGUAJE....................................22C) LENGUAJE NATURAL Y SÍNTESIS DE VOZ...................24

Futuro de los actuales sistemas de clasificación y consulta (Thesaurus, Metadatos y Relaciones entre documentos directas e indirectas)........................................................................25

3

Page 4:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

1. INTRODUCCIÓN

La aportación de la informática al derecho, como en tantas otras actividades, es sin duda de una importancia extraordinaria. Los programas de gestión de despachos y de gestión de documentos en las oficinas judiciales; las comunicaciones por e-mail; la firma electrónica; la consulta on line de datos registrales; las páginas webs de los despachos de abogados en las que existen “sitios seguros” para el intercambio de documentos; las comunicaciones judiciales vía Internet... son algunos ejemplos de cómo la informática se ha introducido en el mundo del derecho. Pero sin duda son las bases de datos jurídicas, que permiten el almacenamiento de enormes volúmenes de documentos públicos y de autor y su recuperación rápida y segura, la contribución de la informática al mundo jurídico más extendida y donde centraremos nuestra atención.

Las bases de datos son hoy en día esenciales para una de las actividades básicas en el trabajo de un jurista: la búsqueda de la documentación precisa. Un profesional del derecho que se enfrenta a un problema necesita en primer lugar conocer la legislación aplicable y la interpretación que los Tribunales han dado a esa legislación. Si además puede conocer lo que otros profesionales o la doctrina científica han opinado sobre el tema mucho mejor. Pero conocer la legislación y la jurisprudencia es absolutamente esencial.

Cuando no existían bases de datos jurídicas, todos los profesionales trabajaban con las mismas armas:

o Todos consultaban tomos que forzosamente tenían sólo una selección de sentencias, ya que era materialmente imposible incluirlas todas.

o No podían acceder a las últimas sentencias, pues su selección, su análisis y la producción física de los tomos exigían un tiempo no inferior en su conjunto a los seis meses. Esta es una de las razones por las que los diarios jurídicos en papel supusieron una revolución en el conocimiento de la jurisprudencia, ya que permitían que el jurista se mantuviera al día de las últimas sentencias, aunque fuera a través de una selección estricta.

o La legislación se recibía en la redacción que ofrecía el Boletín oficial correspondiente y las modificaciones posteriores que una norma pudiera sufrir las tenía que anotar cuidadosamente el profesional, y sólo en

4

Page 5:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

los Códigos que editaban y siguen editando las editoriales podía encontrar una reconstrucción de la norma con el texto consolidado, lo que forzosamente sólo podía afectar a un número reducido de disposiciones.

o Los documentos de autor, ya fueran artículos, formularios anotados, casos prácticos o respuestas a consultas, sólo podían encontrarse a través de las revistas especializadas y la búsqueda de documentos antiguos dependía de índices mejor o peor desarrollados y de la buena memoria del interesado.

La aparición de las bases de datos jurídicas cambia por completo este panorama y provoca un gran cambio en las costumbres de los juristas:

o Se puede acceder a un enorme volumen de jurisprudencia, sin problemas de almacenamiento ni de manejo. Ya no se trabaja sólo con un número limitado de sentencias, sino que se cuenta con muchísima información pero ésta está fácilmente accesible si se conoce lo suficiente el manejo del programa. Ser un buen abogado exige además de saber derecho, saber lo suficiente de informática como para poder manejar el ordenador y recuperar la información que se está buscando. Susskind dice que a los abogados se los denominará “ingenieros de información jurídica”.

o Se puede contar con la seguridad, si se acude a un proveedor de garantía, de que la información que se está manejando está actualizada, constando las disposiciones derogadas, las modificaciones que una norma ha sufrido, e incluso en las bases de datos más evolucionadas si la sentencia que se está consultando ha sido revocada por un tribunal superior. Ya no es preciso que el profesional dedique horas a mantener sus textos legales a texto vigente.

o Se puede “saltar” de una sentencia a una disposición que está aplicando, o de una norma a la jurisprudencia que la está interpretando con un simple clic. El trabajo de interrelación de la información se simplifica y se “democratiza” el conocimiento del derecho.

5

Page 6:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

2. LAS BASES DE DATOS JURÍDICAS EN ESPAÑA. SITUACIÓN ACTUALEn España, las bases de datos jurídicas han experimentado desde su lanzamiento en 1987 por la editorial LA LEY (hoy integrada en el grupo Wolters Kluwer) hasta hoy, un desarrollo que podemos calificar de espectacular. Ello se debe a la gran competencia entre empresas privadas que además se ven presionadas por la actuación de la Administración Pública.

Efectivamente, en España existe hoy en día una competencia superior a la existente en cualquier otro país europeo: tres grandes multinacionales (Wolters Kluwer, Thomson y Lefebvre) están compitiendo con bases de datos jurídicas, y al menos otras cinco empresas de ámbito nacional ofrecen bases de datos jurídicas suficientemente conocidas en el mercado (Bosch, El Derecho, Europea del Derecho, Tirant lo Blach y V-Lex).

Todas estas editoriales a su vez se ven presionadas por los desarrollos llevados a cabo por la Administración Pública. En este sentido, ha tenido una importancia fundamental la creación del CENDOJ (Centro de Documentación Judicial), dependiente del Consejo General del Poder Judicial y creado en 1997 para ser el organismo centralizador de las sentencias de todos los Tribunales y el encargado de su entrega a las editoriales jurídicas.

El CENDOJ recibe en la actualidad unas 300.000 sentencias al año, que entrega en formato electrónico y con los datos personales eliminados a las editoriales, quienes a su vez pagan por el número de sentencias que adquieren. De esta manera, todas las editoriales pueden disponer de toda la jurisprudencia y todas en las mismas condiciones.

Pero además de ello, el CENDOJ ha creado una página web, de acceso gratuito, con las sentencias del Tribunal Supremo y de otros tribunales de inferior rango. Si bien en un primer momento se creó con la intención de dar cumplimiento a la normativa europea sobre publicidad de los documentos públicos, se ha convertido recientemente en una completísima base de datos de jurisprudencia con diversos criterios de búsqueda que compite, pero en su caso sin exigir precio, con las bases de datos de las editoriales. Estas a su vez se encuentran con la necesidad de ofrecer a sus clientes nuevos valores añadidos que justifiquen el precio que cobran frente a la competencia que ejerce el poder público.

6

Page 7:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006También la legislación se ofrece por los Boletines Oficiales del Estado y de las distintas Comunidades Autónomas, pero en este caso siempre mediante precio.

Otros organismos públicos, como la Agencia Tributaria, se han volcado en el desarrollo de páginas web con la información que el ciudadano necesita para relacionarse con ella e incluso en el desarrollo de programas de software descargables gratuitamente para la liquidación de impuestos personales.

Sin duda, todas estas acciones han forzado el desarrollo y la evolución de las empresas que hacen de la preparación y venta de información y de programas de software su objetivo empresarial.

Y paralelamente han hecho que los profesionales jurídicos reciban una gran variedad de ofertas de bases de datos (públicas y privadas), con precios muy diferentes (desde la gratuidad de las públicas a más de 3.000 € por un acceso), consiguiendo que hoy en día prácticamente ningún abogado, Juez, Magistrado, Notario o Registrador, trabaje sin consultar una base de datos. Podemos asegurar que en la actualidad la herramienta básica de trabajo de un jurista es la base de datos de legislación y jurisprudencia.

Es claro que en las bases de datos algunas de las limitaciones a las que antes nos referíamos dejan de existir y pueden contener tantos documentos como se desee, sin necesidad de acudir a una selección, y no sólo públicos sino de autor.

En estos momentos, en España, la tendencia en la creación y mantenimiento de las bases de datos jurídicas generales, por contraposición a las especializadas en una materia determinada, sigue los siguientes parámetros:

o La legislación se incluye de todos los rangos y de todos los territorios. El valor añadido que se ofrece al usuario normalmente es la clasificación por voces, las notas de vigencia, las notas de relación con otras normas y el salto automático a otras disposiciones citadas. Solamente algunas de las editoriales son capaces de reconstruir los textos legales con las modificaciones que hayan sufrido a lo largo del tiempo y de navegar por las versiones anteriores, lo que supone siempre una gran inversión continuada en el tiempo, al exigir no sólo disponer de la plataforma tecnológica adecuada sino también de un equipo de juristas que permanentemente analicen la legislación y consoliden los textos, sin contar con la

7

Page 8:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

inversión que supone la recuperación de textos antiguos.

o En la jurisprudencia no existe selección para cargar los documentos en la base de datos pero sí para dotarlas de valor añadido. Este valor consiste en la clasificación por voces de la información contenida en la sentencia, creando y utilizando un Tesauro, en la preparación de cabeceras explicativas y en el salto automático a otras sentencias citadas y a las disposiciones aplicadas. Mayor valor que sólo las bases de datos más caras pueden ofrecer (por el mayor coste que su preparación lleva consigo) es la redacción de extractos de los parágrafos de mayor interés, la inclusión del iter procesal (permitiendo el salto a la sentencia recurrida o a la sentencia revocadora o confirmadora de la decisión tomada) y la cita de otras sentencias en el mismo sentido o en sentido contrario.

o Por último, y dependiendo de si la editorial publica revistas o libros de los que puedan obtener documentos de autor, como artículos doctrinales, formularios, o anotaciones, se incluyen o no interrelacionados con la legislación y la jurisprudencia.

Pero el valor añadido que en la creación de bases de datos jurídicas se puede ofrecer radica también, y de manera esencial para el usuario, en las posibilidades de búsqueda y en el rendimiento en las búsquedas.

Efectivamente, de poco valdrá una base de datos que contenga millones de documentos y con un alto grado de análisis e interrelación, si no es posible llegar a ellos. Esto es lo esencial para un usuario: encontrar el documento que estaba buscando o el que le sirva para argumentar su caso. Sin embargo, y al mismo tiempo, el usuario rechaza búsquedas complicadas que le exijan formación previa y que fácilmente puede olvidar y se decanta por búsqueda en texto libre, cada vez más condicionado por su experiencia en Internet, donde los buscadores tipo Google le han acostumbrado a iniciar una búsqueda, encontrar el resultado en la primera pantalla y, si no es así, intentar otra.

Ante esta situación, las editoriales tratan de desarrollar sistemas intuitivos de búsqueda que al mismo tiempo ofrezcan al jurista exactitud en la información ofrecida. Algo verdaderamente difícil.

Por ello, junto a búsquedas simples, en las que el usuario introduce las palabras que cree que le pueden conducir al resultado que está buscando, se introducen búsquedas

8

Page 9:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006avanzadas, para el que es capaz de manejar distintos campos de búsqueda e incluso operadores boléanos (Y, O, NO).

También, y en esto Wolters Kluwer es la editorial pionera en España, es posible ofrecer los resultados no sólo según las palabras exactas introducidas en la base de datos, sino también reconociendo los términos que quieren decir lo mismo que las palabras introducidas, es decir, utilizando la expansión semántica, y a lo que más adelante volveremos al referirnos al futuro de las bases de datos.

Otro claro valor añadido en las búsquedas es la llamada búsqueda universal, cuando la búsqueda se puede restringir a una base de datos o puede extender a todas las que se decida.

Pero ahora que se incluyen en las bases de datos jurídicas millones de documentos y a unos criterios de búsqueda puede responder un número elevado de resultados, es esencial que la ordenación de los mismos añada valor a esa búsqueda. Hasta ahora la ordenación siempre había sido por fecha y por rango (de Tribunal, de organismo..) y así sigue siéndolo en la mayoría de las bases de datos. Nuevamente aquí Wolters Kluwer en España ha sido pionera y ha introducido la ordenación por relevancia. Ello quiere decir que se ofrecerán como primeros resultados aquellos que son los que más probablemente el cliente está buscando. También más adelante y de manera más concreta nos referiremos a la ordenación por relevancias.

La experiencia de uso y la satisfacción que se puede obtener está, por otro lado, muy condicionada a la velocidad de la propia base, lo que se hace especialmente delicado en el mundo de Internet. Es por tanto necesario tener en cuenta en el diseño de la base de datos todos los elementos que pueden suponer su ralentización: imágenes, encriptación, marcaje...

Pero tampoco está dispuesto el usuario a aceptar de buen grado que la razón de no encontrar lo que busca es que se ha equivocado al escribir las palabras, de ahí la importancia de reconocer los errores de escritura y preguntar al usuario si quería decir algo similar (¿Quiso usted decir...?), o que no existe nada con los términos empleados (ni siquiera con expansión semántica) pero se le sugieren otras posibilidades con conceptos un poco más amplios, que normalmente son los que utiliza el legislador.

En último término, la ilusión de cualquiera que utiliza una base de datos es saber utilizarla desde el primer momento y encontrar en primer lugar y destacada la información –ni siquiera el documento- que está buscando en el menor tiempo posible.

9

Page 10:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006Hacia allí se dirigen todos los esfuerzos en el desarrollo de las bases de datos jurídicas.

3. FUTURO

HACIA LA GESTIÓN DEL CONOCIMIENTO

Nos encontramos en la era de la información, más concretamente de la hiperinformación (information glut), donde gran magnitud de datos, documentos, archivos recorren la red Internet y están a disposición de cualquier internauta1. En esta situación cotidiana lograr encontrar el verdadero conocimiento cuesta mucho tiempo y esfuerzo, pese a los grandes avances tecnológicos y a la sencillez de los buscadores.

Si nos situamos en el entorno de la Administración Pública, vemos cómo ha reconvertido sus documentos papel a formato electrónico y en muchos países europeos está iniciando una evolución hacia la administración digital, gracias a las posibilidades que le brinda Internet. En este sentido, la Unión Europea (arts. 163 a 172 Tratado CE) está también fomentando y apoyando con diferentes programas todo el desarrollo en materia de tecnologías de la información y las comunicaciones (TIC).

Si nos fijamos en concreto en la Administración de Justicia en Europa observamos que ha contribuido a la difusión de información mediante la publicación on line de la Jurisprudencia y de los Boletines Oficiales con la legislación diaria, subvenciones y concursos.

En España el volumen anual de información jurídica es enorme. 14.000 disposiciones de carácter jurídico general (de diferentes ámbitos territoriales) y 300.000 sentencias judiciales cada año, conforman el espectro documental, al que un abogado tiene que poder acceder para mantenerse al día en sus conocimientos y en su práctica profesional.

En esta situación, una base de datos jurídica no puede ser simplemente el repositorio de miles de documentos. El proceso de creación de una base de datos jurídica ha de evolucionar a un sistema de gestión del conocimiento.

En el ámbito que analizamos hoy, la Gestión del Conocimiento constituirá un proceso continuo de análisis, tratamiento, aporte 1 Estadísticamente se prevé que aproximadamente cada lustro se multiplicará el volumen de la información disponible.

10

Page 11:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006de valor añadido y suministro de la información jurídica para que los profesionales del sector puedan dar una respuesta más rápida a sus necesidades y sean más precisos en la toma sus decisiones más críticas (un abogado analiza un supuesto de hecho concreto y si al buscar en la base de datos jurídica localiza una sentencia que resuelve una situación semejante, le habremos proporcionado un elemento clave para la decisión de la defensa que está llevando).

La gestión no es del conocimiento en sí mismo, sino de diversas condiciones y aspectos que harán que el flujo del conocimiento mejore, tanto en la fase de creación, como de divulgación.

Nonaka y Takeuchi 2 diferencian el conocimiento explícito (que puede ser estructurado, archivado y distribuido), del tácito (experiencia personal de cada individuo y difícilmente puesto en común). Aparentemente sólo el conocimiento explícito puede ser compartido, pero la labor fundamental y la gestión mas importante en la creación de una base de datos jurídica va a consistir en exteriorizar el conocimiento tácito, hacer de intermediario entre la información y la realidad operativa de los profesionales jurídicos. El conocimiento explícito, como sabemos, es público y está disponible, lo complicado es encontrarlo justo cuando lo necesitas, sin dedicarle grandes esfuerzos.

Conocer el proceso de trabajo de cada profesional jurídico y poder dar respuesta a preguntas como las que siguen hará que una base de datos jurídica se adapte cada vez más a las necesidades de los usuarios:

Según la fase de trabajo del profesional ¿Cómo buscan la información los usuarios? ¿qué criterios de consulta utilizan más habitualmente? ¿qué instrumentos documentales esperan encontrarse al realizar una búsqueda?

¿Qué tipo de tareas necesitan hacer los usuarios cuando consultan documentación jurídica? ¿Leen en pantalla, imprimen, copian textos para “pegarlos” en sus propios archivos?

¿Qué tipo de información les resulta de interés encontrar?

¿Cuál es el contexto en el que el usuario está trabajando?

¿Qué debe dejarse en manos del programa o aplicación? ¿Qué debe depender exclusivamente del usuario y su actuación?

2 IKUJIRO NONAKA Y HIROTAKA TAKEUCHI, The Knowledge Creating Company. How Japanese Companies Create the Dynamics of Innovation. Oxford University Press, New York, 1995.

11

Page 12:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

LA TECNOLOGÍA AL SERVICIO DE LA INFORMACIÓN

Los grandes avances de las Tecnologías de la Información y la Comunicación (TIC) en la última década han logrado evolucionar todo lo que gira alrededor de la difusión de contenidos: las editoriales, la administración pública y la enseñanza. Todos estos actores han contribuido a una mejor y más voluminosa extensión del conocimiento.

De todos los factores tecnológicos que confluyen en la comunicación, queremos destacar las siguientes ideas por su importancia en la evolución próxima de las bases de datos jurídicas.

1) Internet como medio integrador y globalizador de la información

2) La usabilidad como fin último del producto3) El desarrollo de los interfaces de consulta y sistemas de

recepción de información (dispositivos móviles)4) Fusión de contenidos públicos y privados5) Integración de software y contenidos6) La evolución de los algoritmos de búsqueda

A continuación, desarrollamos cada una de las ideas.

1. Globalidad de la información jurídica

Aunque Internet ha sido el principal promotor del incremento de información disponible, con los riesgos que conlleva la hiperinformación, no podemos olvidar que, gracias la red, se ha ampliado la difusión de nuevos contenidos y el conocimiento a muchos usuarios que, hasta el momento, no tenían acceso a tal volumen de información.

Internet ha logrado que la información jurídica pública (jurisprudencia y legislación) esté a disposición de todos los operadores jurídicos y en la mayor parte de los países europeos de forma gratuita. Las editoriales jurídicas han ampliado la oferta mediante:

El tratamiento documental y el aporte de valor añadido al simple documento jurídico. La catalogación, la elaboración de resúmenes, la puesta al día y la interrelación entre los contenidos son valores añadidos habituales en los productos europeos. Una disposición legislativa puede estar

12

Page 13:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

disponible en internet en su texto original, pero sin el aporte editorial, cada abogado tendría que reconstruir su propio texto consolidado y vigente. Y no sólo nos referimos al texto actualizado en el momento actual, sino a los diferentes textos consolidados aplicables y vigentes en períodos temporales anteriores (versiones de legislación).

La inclusión de documentación adicional a la jurisprudencia y la legislación. La doctrina y los comentarios de los más destacados autores del panorama jurídico, otros documentos públicos de interés (ej. informes con la opinión de organismos en cada materia) e incluso la información más práctica (formularios, casos prácticos, Q&A, etc.) constituyen una fuente de conocimiento jurídico muy útil para los profesionales. Todo ello, cada vez más, en completa interrelación entre sí.

La creación de soportes y herramientas tecnológicas que facilitan la consulta de toda esa información jurídica, y que añaden a la vez, múltiples funcionalidades que son requeridas por los usuarios.

Aunque actualmente la oferta editorial de bases de datos jurídicas abarca productos en diferentes soportes, la tendencia es sustituir el actual soporte DVD por la conexión on line de Internet. También se vislumbra un uso más intensificado de los dispositivos móviles.

Muchas editoriales jurídicas europeas elaboran productos que contienen estos tres elementos descritos: contenidos públicos y de propia creación, valor añadido adicional y avanzados motores tecnológicos de consulta.

En el futuro más próximo se unirán dos nuevos elementos de valor a las bases de datos jurídicas:

la interrelación del contenido propio con contenido disponible en Internet 3. En la búsqueda de información se reducirán las fronteras entre el contenido propio y el existente en la web, siendo factible buscar conjuntamente en un base de datos concreta y en el universo de la web (o en aquellas páginas webs especialmente relevantes en cada materia).

3 Un ejemplo de futuro lo constituye un proyecto de Wolters Kluwer Holanda, que ha creado una gran base de conocimiento jurídico, Navigator, que permite la consulta de información propia e información publicada en Internet. http://www.kluwer.nl/navigatoradvocaat/

13

Page 14:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

la conexión de la base de datos jurídica con el entorno de trabajo del usuario final. Como ejemplos prácticos, podemos pensar, por un lado, en consultas mixtas de información contenida en la base de datos jurídica y a la vez en servidores del usuario4 y por otro, en el vínculo directo entre la documentación o aplicaciones escritorio del usuario y la base de datos jurídica5. Estaremos atentos a la evolución de este punto en su posible articulación con la Administración de Justicia electrónica o las oficinas administrativas virtuales.

2. Usabilidad y autoaprendizaje

Las bases de datos jurídicas, igual que cualquier otro tipo de software, han de ser usables de la forma más sencilla y ágil, lo cual implica que para los usuarios que lo van a utilizar no requiera un elevado tiempo de aprendizaje.

En palabras de la Organización Internacional para la Estandarización (ISO) la usabilidad se define de dos formas:

1) “La capacidad de un software de ser comprendido, aprendido, usado y ser atractivo para el usuario, en condiciones específicas de uso” 6.

2) “La efectividad, eficiencia y satisfacción con la que un producto permite alcanzar objetivos específicos a usuarios específicos en un contexto de uso específico” 7.

En la primera de las acepciones, advertimos cómo la usabilidad del producto no puede medirse sólo con el producto, sino que es fundamental el papel del usuario final y de la capacidad que tenga el software para que su utilizador pueda aprender su manejo de forma autónoma (autoaprendizaje).

La usabilidad, concebida como facilidad de uso, otorga unos beneficios muy importantes para los usuarios, que se concretan en:

4 Solución de especial interés para instituciones o profesionales que disponen de centros de documentación con contenidos propios.5 CCH@Hand es un ejemplo de conexión entre las herramientas Office y una base de datos jurídica. Desde el propio documento word o excel se pueden lanzar consultas para encontrar algún documento citado en tus propios archivos y contenido en la base de datos jurídica y visualizar directamente los resultados. http://athand.cch.com/6 ISO/IEC 9126.7 ISO/IEC 9241.

14

Page 15:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

- Minimización y reducción de los costes de aprendizaje.

- Mejora de la satisfacción de los usuarios.

- Mayor rapidez en la realización de consultas y ahorro de tiempo.

Asimismo, el proveedor y suministrador del producto, también obtendrá ventajas derivadas de la usabilidad. Existen numerosos casos en que después del rediseño de una web basada en un proyecto de usabilidad, se han incrementado el número de visitantes y/o clientes y se ha mejorado la imagen del sitio web 8.

En consecuencia, entendemos la usabilidad de las bases de datos jurídicas como el grado en el que su concepción y diseño facilita o dificulta su uso. En concreto, y siguiendo la descripción que nos aporta Redish9, una base de datos jurídica ha de permitir al usuario, el profesional jurídico, encontrar la información que necesite en cada momento en un tiempo de respuesta razonable, y que para todo ello, dedique el menor esfuerzo.

Como hemos citado, la evolución de las bases de datos sigue la tendencia de sustituir los soportes off line por publicación en Internet, por ello, muchas de las pautas de usabilidad están basadas en patrones o formas de trabajar en la web.

A continuación, vamos a enumerar ejemplos concretos de los criterios de usabilidad aplicables en una base de datos jurídica:

Legibilidad de la información: ej. textos con párrafos no demasiado extensos (aplicable a los resúmenes), tipografías agradables, colores adecuados a la lectura, uso limitado de imágenes animadas que distraen la atención.

Arquitectura de la información: por ejemplo, organización estructurada de las páginas y

8 Un ejemplo real fue la web de IBM que tras un cambio en su web dirigido a mejorar la usabilidad del site, logró incrementar sus ventas en un 400% (InfoWorld, 1999). http://interface.free.fr/Archives/IBM_redesign_results.pdf#search=%22ibm%20infoworld%201999%229 "encontrar lo que necesitan, entender lo que encuentran y actuar apropiadamente dentro del tiempo y esfuerzo que ellos consideran adecuado para esa tarea".

15

Page 16:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

secciones; cómodos y sencillos accesos a la información.

Diseño gráfico de la aplicación: se está convirtiendo en un punto muy relevante en todos los aplicativos y se está aproximando al concepto de navegación que a todos nos resulta habitual en Internet (ej. los links en color azul y una vez consultados en color morado; ampliación o reducción del tamaño de letra a elección del usuario). Lo analizaremos con más detalle en el apartado Interfaces.

Rapidez en la visualización de páginas: imágenes con poco peso, buen marcaje de la documentación que no incremente el archivo a descargar, etc.

Funcionalidades y opciones sugeridas en análisis heurísticos y de ergonomía (ej. utilización de nombres comúnmente conocidos para funciones; espacio para logotipos en frame superior izquierdo; buscador y ayuda en posición superior derecha; identificar información irrelevante para el usuario en el producto; o ayudas en la navegación como los llamados “rastros de miga”)

3. Formas de acceso a la información

En la actual era de la hiperinformación donde la accesibilidad a los grandes volúmenes de datos ha dejado de ser una limitación, el reto es lograr que el usuario de una base de datos jurídica encuentre, en el menor tiempo y con el menor esfuerzo posible, los contenidos más adecuados a cada una de sus consultas.

Para conseguir este objetivo es fundamental disponer de unos sistemas de acceso a la información sencillos, ágiles, cómodos, y fiables. Vamos a analizar algunas de las líneas de desarrollo orientadas a alcanzar estos cuatros valores.

En las formas de acceso activas, es el propio usuario el que interactúa directamente con la aplicación, ejecutando diversas acciones, de las cuales, obtiene un resultado, completamente dependiente de su proceder y del manejo concreto de las funcionalidades del interfaz.

Todo lo que el profesional jurídico, en su rol de usuario, va a percibir de una base de datos, lo será a través de su interfaz, siendo así que no podrá consultar los contenidos más inaccesibles.

16

Page 17:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

Partiendo de estas premisas y siguiendo el ciclo de uso de una base de datos jurídica, analizamos algunos atributos y enfoques a potenciar en los interfaces de consulta:

Accesibilidad entendida en tres aspectos:o Que los soportes o repositorios utilizados otorguen una

mayor accesibilidad. En este sentido, la evolución natural que estamos advirtiendo está transformando los tradicionales soportes off line (CD-DVD) a entornos on line (Internet e Intranet), cuyos requisitos de accesibilidad se reducen (no requiere software especial), se generalizan (universalidad del medio) y se intensifican (actualización constante).

o Que se adecue a las nuevas necesidades tecnológicas del profesional jurídico. Se abre, en este sentido, una nueva vía de desarrollo relacionada con los dispositivos móviles, y un reto para todos los editores de contenidos jurídicos ¿qué información necesitará un profesional jurídico en su Personal Digital Assistant-PDA? ¿con qué aplicaciones podrá consultarla? ¿cómo se pueden presentar los datos para que la lectura sea grata?¿qué tipo de mensajes legales podría recibir en su teléfono móvil vía SMS?

o Que la tecnología utilizada no suponga una barrera de acceso para determinados usuarios. En España la accesibilidad (A, doble A y triple A10) está convirtiéndose en un requisito constante en la contratación pública de aplicaciones informáticas y bases de datos.

Minimizar los procesos de instalación de la aplicación para conseguir la mayor transparencia posible para el usuario final. En Internet basta con disponer de un navegador para acceder a las bases de datos jurídicas.

Estructurar adecuadamente la información de la página principal de la Base de Datos. Es lo primero que un usuario va a ver al acceder a la aplicación, y tiene que ser, por sí misma, clara, precisa y orientadora del contenido.

Diseñar funcionalmente o, lo que es lo mismo, integrar el diseño gráfico como una parte más de la funcionalidad del aplicativo, es algo que cada vez más se ha de cuidar en una base de datos jurídica. En concreto, algunas de las acciones a implementar pasarán por:

o Los iconos y símbolos gráficos deben tener, en la medida de lo posible, significados universales. Si alguna función

10 Las directrices de accesibilidad, recogidas en la Iniciativa de Accesibilidad Web (WAI) pueden consultarse en http://www.w3.org/WAI/.

17

Page 18:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

es difícil de comprenderse con una imagen, es preferible sustituirla con un texto autoexplicativo.

o Mostrar sólo la información relevante para el usuario (la información extra hace que se confundan las opciones principales de las meramente secundarias).

o La aplicación ha de informar gráficamente al usuario del estado concreto en el que se encuentra en cada momento y permitir salir de forma sencilla de las diferentes pantallas.

o El lenguaje utilizado debe evitar tecnicismos y tender a la “familiaridad” y a la brevedad.

o Las opciones de la base de datos (buscar, ver documentos, enlazar con otros contenidos, imprimir, etc.) tienen que estar siempre visibles o ser fácilmente recuperables, para que la navegación se realice de manera irreflexiva.

Los sistemas de consulta combinarán diferentes procesos, para permitir el acceso diferenciado según el tipo de resultado que se desee obtener. Así,

o Si el profesional jurídico desea documentarse sobre un asunto concreto, la base de datos, le proporcionará pantallas de búsqueda con diferentes sistemas de consulta combinables entre sí (búsqueda libre por palabras, selección temática mediante un thesaurus de conceptos jurídicos o consulta por metadatos identificativos del organismo emisor, a modo de ejemplo).

o Si el usuario lo que hace habitualmente es consultar de forma sistemática y continua los documentos más relevantes, la aplicación deberá tener configurado un acceso directo a los contenidos de uso común (ej. Códigos; favoritos).

o Si lo que desea es mantenerse al día, la base de datos ha de proporcionar un acceso directo a las novedades documentales.

La funcionalidad de la base de datos jurídica no se detiene en las acciones que el usuario ejecuta directamente, sino que evoluciona hacia soluciones que requieran una menor proactividad por parte del usuario. Nos estamos refiriendo a las notificaciones o alertas de contenidos que el usuario tiene interés en conocer de forma automática. En este sentido, aludimos a las comunicaciones vía e-mail o por el canal RSS (Really simple sindication), donde el profesional puede estar informado de novedades legales o noticias jurídicas (newsletters y alertas), de la inclusión de nuevos contenidos en su base de datos (search agent) o de los documentos relacionados con una materia jurídica.

18

Page 19:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006En resumen, la dirección hacia la que estamos orientados en las base de datos jurídicas nos conduce a un posicionamiento minimalista, donde la tendencia será reducir el número de acciones directas del usuario, en pro de un mayor automatismo, siempre transparente para el cliente. El profesional jurídico, cuyo tiempo es muy preciado, va a necesitar de toda nuestra ayuda para optimizarle la búsqueda de la información que precisa, dentro del gran universo de datos y contenidos existente.

4. Personalización de la información por los usuarios

Otro de los aspectos que se va a ver desarrollado en los próximos años, es el de la personalización. En la amplia expansión documental actual un profesional jurídico tiene a extender sus conocimientos dentro de un campo de estudio especializado, para ello, requerirá más y mejor información, pero enfocada a su ámbito de análisis.

Con esta perspectiva, una base de datos jurídica de contenidos generales, también tendrá que especializarse en campos y materias mucho más concretas, aportando un detalle y valor en ese ámbito, que sería imposible abarcar si pensamos en un gran repositorio de millones de documentos. De este modo, surgirán “compendios electrónicos” que habrán de aglutinar y aportar:

o Una cuidada selección de información en la materia, que incluya junto a documentos públicos, trabajos de autores y analistas especializados, y un conjunto de datos de carácter práctico, diferentes según cada disciplina (ej. arrendamientos urbanos, medio ambiente, urbanismo, seguridad social, etc.).

o Un análisis (comentarios, thesaurus) más elaborado, concreto y adaptado a la materia.

o Una interrelación global de toda la información con enlaces que favorezcan la interpretación y exploración de cada cuestión.

Por otro lado, y en relación con las tecnologías de la información, los avances más relevantes que posibilitarán la individualización, entendida como selección del tipo de información que resulta de interés, son:

o Personalización de interfaces: así, el propio usuario puede decidir qué módulos o bloques quiere visualizar cuando acceda a la base de datos jurídica.

19

Page 20:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

o Personalización de documentos. Un concepto claro para definirlo es el de Favoritos, y un ejemplo práctico podría ser pensar en que cada profesional jurídico pudiera “construir” su propio Código legislativo, con el conjunto de normas que aplica día a día en el foro.

o Personalización de alertas. Elegir las materias en las que quieres ser informado de forma automática, es ya un elemento cotidiano, y cada vez más estará integrado como funcionalidad de las bases de datos jurídicas.

o Personalización por la introducción de contenidos propios del usuario. Un abogado, durante su vida profesional, origina y almacena numerosos documentos que consulta o reutiliza con cierta habitualidad. Si nos planteamos cuál sería la forma más adecuada de archivarlos en la era de las TIC, seguramente optaríamos por un soporte electrónico, que proporcionara, seguridad, sencillez de consulta y capacidad de reutilización. Siguiendo estas premisas, y desde la perspectiva del uso cotidiano de la base de datos jurídica que hacen los abogados actuales, el avance tecnológico permitirá disponer de nuevas funciones de personalización que ahora son fácilmente imaginables en papel, como subrayar los párrafos más importantes de una fundamentación jurídica, añadir “post-it”, notas o comentarios que surgen durante la lectura de una norma, e incluir directamente archivos e información propia; todo ello, integrado en entornos de búsqueda global y conjunta, que le permita localizar, tanto la jurisprudencia o la legislación, como sus propios documentos 11.

5. Integración de herramientas de consulta y de gestión

Como ya hemos indicado, cada día es más importante conocer con detalle cuál es el proceso de trabajo de los operadores jurídicos, con el fin de orientar adecuadamente los desarrollos a 11 Google (http://base.google.com/) dispone de una versión beta para que los internautas archiven sus propios documentos, los cataloguen, y finalmente puedan buscar en ellos.Otro ejemplo curioso lo constituye la experiencia de la enciclopedia libre, Wikipedia (http://es.wikipedia.org), en la que los usuarios pueden introducir sus propios contenidos, pasando éstos a formar parte del diccionario.

20

Page 21:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006implementar en las bases de datos y cubrir todas las necesidades que tenga el cliente final. Siendo las bases de datos, una de las herramientas de trabajo cotidianas de los profesionales jurídicos, es fundamental conocer con minuciosidad cómo y en qué contexto las usan.

Los últimos estudios de mercado efectuados en España (2005) por Wolters Kluwer nos revelan que los profesionales demandan cada vez más una solución global como herramienta de trabajo, que se integre en su ciclo normal de actividad.

Si nos fijamos en concreto en los abogados, vemos que dentro de su labor de asistencia jurídica, y para cada asunto, crean un expediente, con toda la información necesaria (tipo de asunto, cliente, parte contraria, documentos del proceso), han de consultar sus casos anteriores, buscan jurisprudencia y legislación aplicable, se asesoran con la opinión de colegas, usan formularios y plantillas, requieren de una agenda que planifique su actividad y controle la caducidad de los plazos y finalmente, llevan su propia contabilidad y facturación.

La creación de una herramienta integradora, para cubrir el ciclo de trabajo descrito, requerirá de la interconexión entre lo que entendemos como un software de gestión y una base de datos jurídica.

Este mismo patrón lo podríamos buscar en el resto de colectivos del segmento jurídico regulado, incluida la Administración Pública. En mayor o en menor medida, en unos u otros tipos de actividad, concluiremos que la fusión entre software de gestión y contenidos es un camino que hemos de recorrer, y que está bastante más próximo de lo que hace unos años hubiéramos considerado.

6. Evolución de los algoritmos de búsqueda

Las actuales bases de datos jurídicas son instrumentos sofisticados con enorme cantidad de documentación muy elaborada. El uso de estas bases de datos y la obtención y disfrute de sus prestaciones requiere formación y destreza en el empleo de las diferentes herramientas que ofrece el producto.

De entre todos los tipos de acceso, la búsqueda por texto libre se ha convertido en el elemento decisivo para localizar información, buena muestra de ello, son los conocidos buscadores de internet, Google y Yahoo, que han alcanzado elevadas cotas de uso intensivo.

21

Page 22:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006El entorno on line nos ha permitido conocer realmente cómo buscan los profesionales jurídicos y las dificultades que encuentran 12.

o El 75% de las búsquedas en una base de datos jurídica se realizan a texto libre, sobre el contenido completo de los documentos.

o Cada consulta requiere de un promedio de dos a tres intentos.

o El thesaurus se utiliza en un porcentaje más reducido de las consultas: 10% en legislación y 25% en jurisprudencia.

o Sólo un 20% de los usuarios utilizan operadores booleanos o de proximidad (Y, O, NO, CERCA).

o Los usuarios casi nunca pasan de la primera página de resultados.

o Muchas veces los usuarios no saben con precisión cuál es la descripción o título utilizada, y escriben términos semejantes con los que no obtienen resultados (pueden pensar incluso que en esa base de datos no se encuentra el documento requerido).

o La ordenación por fecha hace que normas importantes aparezcan al final de la lista de resultados (normas modificadoras, autonómicas, desarrolladoras). Ej. Código Civil.

En palabras de John Battelle13, el método de búsqueda del futuro será similar a tener en cada ordenador personal, un agente inteligente con todo el conocimiento humano, que interpretará la gramática para producir el resultado deseado.12 Estadística generada en octubre 2005 según consultas realizadas a las Bases de Datos Jurídicas de la Editorial LA LEY (www.laley.es).13 La búsqueda - Cómo Google y sus rivales rescribieron las reglas del negocio y transformaron nuestra cultura, Ediciones Urano, 2006: “...Imagine the ability to ask any question and get not just an accurate answer, but your perfect answer –an answer that suits the context and intent of your question- an answer that with eerie precision is informed by who you are and why you’re asking.It’s capable of distinguishing between straightforward requests (Who was the third president of the United States?) and more nuanced ones (Under what circumstances did the third president of the United States forswear his views on slavery?).While it’s true that most questions don’t have an objectively perfect answer, perfect search would provide your perfect answer, as you determine it –in a report form, perhaps, or by summarizing key points of view and trends…”In short, the search engine of the future isn’t really a search engine as we know it. It’s more like an intelligent agent –or as Larry Page told me-, a reference librarian with a complete mastery of the entire corpus of human knowledge.

22

Page 23:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

Vamos a analizar las tres vías de desarrollo de los algoritmos de búsqueda para alcanzar esa “respuesta perfecta”.

a) Relevancia

La relevancia es una línea de evolución basada en la lingüística informática, que permite a un usuario de una base de datos, hacer búsquedas por palabras y encontrar, los primeros, aquéllos documentos más importantes para su consulta.

Se define matemáticamente como la similitud o paralelismo entre el texto de la consulta y el texto de cada uno de los documentos dentro de un “modelo de espacio vectorial” (similar a la distancia entre dos puntos clásica del teorema de Pitágoras).

La representación de los textos a indexar tiene mucha importancia (reglas de troceado de un documento, acentos, mayúsculas, variaciones gramaticales, tratamiento de los números y algunos símbolos) así como la posición de las palabras dentro del texto. En el marco de la documentación jurídica, también será esencial la utilización de otros criterios intrínsecos de las sentencias o leyes, así podríamos citar, la estructura de los documentos (ej. fundamentos jurídicos, fallo, preámbulo, rúbrica de un artículo), los metadatos o atributos propios (ej. tribunal u organismo emisor, boletín oficial de publicación para la territorialidad, relevancia jurídica) y los comentarios o resúmenes definitorios de la doctrina jurídica de cada documento.

Hemos considerado que la base de la relevancia debe sustentarse sobre tres condiciones:

- La comodidad para preguntar (un campo de búsqueda sencillo simple, sin ningún operador booleano).

- La calidad de los resultados (los primeros documentos en la lista los de más interés, y listas de resultados con información suficiente para saber si el documento puede ser leído).

- La rapidez en visualizar el resultado.

El equipo de I+D de Wolters Kluwer España (WKE) ha desarrollado un sistema de consulta jurídica basado en la mejora de los algoritmos de búsqueda, la semántica y el lenguaje natural.

En el desarrollo de este nuevo buscador, hemos partido de una situación que consideramos frecuente, usuario que formula una consulta determinada, utiliza el texto libre y no examina más que

23

Page 24:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006los 10 ó 20 primeros documentos que la base de datos le ofrece como resultado,

Además, hemos comprobado también los datos más veces solicitados, los contenidos más visitados, los enlaces más frecuentemente activados, y los itinerarios que recorre un usuario hasta llegar al resultado satisfactorio. Y se ha manejado toda la información, catalogación y estructura de los documentos jurídicos.

Toda la metodología se va a basar en conjeturas para intentar caracterizar objetivamente “qué es un documento relevante”. Estos algoritmos evolucionan basándose en un trabajo conjunto de usuarios expertos (casos de uso, validaciones, identificación de parámetros) e ingenieros informáticos (parámetros y pesos).

Los parámetros potenciales son:- Número de términos encontrados en el documento.- Proximidad entre cada uno de los términos.- Frecuencia de los términos en relación con el conjunto

global de documentos.- Frecuencia de los términos en relación al tamaño de cada

documento.- Importancia de la norma (ej. legislación básica).- Conceptos jurídicos en los que se ha clasificado el

documento.- Enlaces que se realizan a un documento desde otros

documentos.- Términos encontrados en títulos, resúmenes o

encabezamientos que describen la doctrina jurídica.- Órgano jurisdiccional o rango normativo.- Importancia de la sentencia según el Centro de Análisis

Documental de WKE (licenciados en Derecho que analizan la información).

Con toda esta información, en el departamento de innovación tecnológica se han elaborado los criterios y la programación incorporada al nuevo buscador, que es capaz de “leer” los documentos recuperados, para presentar en la primera página resultados de calidad de forma consistente, sin que ello suponga la desaparición de sistemas de ordenación tradicional de los resultados tales como el cronológico, por Tribunales, por rango normativo etc.

En la legislación estamos ante una búsqueda mucho más precisa que en jurisprudencia, por lo que el usuario sabe el documento que debe aparecer. Por ello, las conclusiones del equipo de I+D son muy significativas, y permiten que si un usuario escribiera

24

Page 25:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006“Código Penal” la base de datos le mostraría esa norma, como primer documento de la lista de resultados.

En la jurisprudencia el algoritmo de búsqueda se encuentra muy próximo a la ingeniería del lenguaje natural y la semántica, para lograr interpretar más adecuadamente la pregunta.

Adicionalmente, la relevancia se tiene que completar con una mejora en la presentación de los resultados que permita identificar si el documento tiene interés para su consulta completa. Junto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context, snippets, vistas rápidas).

La implantación de este sistema de relevancia en los productos electrónicos de Wolters Kluwer ha supuesto una mejora considerable del grado de aceptación de las bases de datos jurídicas, tal como hemos comprobado en los últimos estudios de satisfacción de clientes y en la mejora porcentual del ratio de bajas.

b) Semántica y multilenguaje

La semántica, aplicada a la tecnología de las TIC, es uno de los campos de exploración más prometedor para mejorar la búsqueda de las bases de datos jurídicas.

El beneficio más importante que tendrían los profesionales jurídicos sería la obtención integral de todos los documentos relativos a su consulta.

Al totalizar conjuntamente documentos que, de otro modo, no aparecerían como resultado de la consulta, se están aplicando diferentes principios lógicos en los algoritmos de búsqueda:

o Sinonimia: Cuando realizamos una búsqueda por palabras, expresamos el concepto requerido utilizando la acepción más habitual de nuestro propio vocabulario, pero no repetimos la consulta para localizar aquéllos documentos que contienen el mismo concepto expresado con un sinónimo. Si el término jurídico que se desea encontrar es “arrendamiento” la semántica permitirá recuperar, dentro de la misma consulta, toda la información que contuviera la palabra arrendamiento y además las acepciones alquiler, arriendo, locación e inquilinato.

25

Page 26:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

o Ortografía: dentro de un gran volumen de datos digitales, los errores ortográficos pueden ser frecuentes. De no tenerlos contemplados en la consulta semántica se perderían los documentos con erratas.

o Abreviaturas: el autor del documento decide en ocasiones escribir algunos datos utilizando siglas y abreviaturas y en otros casos, el concepto se redacta de forma extensa. Si el usuario al escribir el término lo hace de modo extenso, el resultado de la búsqueda no mostrará los documentos que contengan el concepto escrito con siglas, y viceversa. La conjunción de ambos términos, extendido y abreviado, sólo puede lograrse mediante la ingeniería semántica.

o Sintaxis: La consulta interpretará y descifrará el significado de conceptos que aglutinen varias palabras, sin necesidad de usar ningún tipo de conector. Se estudian las formas en que se combinan y relacionan las palabras para componer secuencias mayores, cláusulas y oraciones. Utilizando un ejemplo jurídico, si un usuario escribe “asistencia jurídica gratuita” la semántica deducirá que se trata de un concepto jurídico único, no dos palabras por separado, y al interpretarlo así, aportará conceptos sinónimos, como “beneficios de pobreza” o “beneficios de justicia gratuita” o “justicia gratuita”.

o Morfología: el análisis de las raíces y desinencias también será utilizado como criterio de la semántica aplicada a las TIC. Si un profesional jurídico pregunta en una base de datos por “arrendamiento” también estará interesado en obtener documentos que contengan las palabras “arrendador”, “arrendatario”, “arrendado” o “arrendar”.

o Multilenguaje: por último, un factor de globalidad en la búsqueda de información lo constituirá el uso idiomático como elemento equivalente. El idioma de los documentos de los documentos puede condicionar también su localización si la palabra o concepto se ha escrito en una lengua diferente. Aplicando un diccionario multilenguaje en la búsqueda se podría escribir un término en castellano y obtener documentos que incluyan el concepto en diferentes idiomas. Esto resultará de especial interés en países con varios idiomas o en la pesquisa internacional.

26

Page 27:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

En España esta alternativa va a resultar de especial interés debido a que el sistema jurídico vigente se organiza junto con el castellano en diferentes lenguas autonómicas, que cada vez son más utilizadas para la reproducción de los textos oficiales de legislación (bilingüismo) y jurisprudencia (el idioma autonómico puede ser el único texto oficial para una sentencia).

La Editorial española CISS del Grupo Wolters Kluwer dispone desde junio de 2006 de la consulta semántica en el más innovador de sus productos, dirigido a los asesores fiscales y laborales, “Todo on line14”. En esta obra un equipo de expertos documentalistas e informáticos ha trabajado conjuntamente durante dos años para construir un diccionario semántica-castellano de acepciones y términos jurídicos en las referidas materias, para ello, han estado estudiando miles de documentos legales, analizando con detalle las construcciones gramaticales y entrevistando a numerosos asesores con los que contrastaban y validaban sus avances.

No obstante, la semántica en las bases de datos jurídicas es todavía una rama en pleno desarrollo, donde se debe continuar investigando y afinando las ambigüedades léxicas del lenguaje (multiplicidad de significados para un mismo concepto) y aproximándose mucho más a la disciplina del lenguaje natural.

c) Lenguaje Natural y Síntesis de voz

El procesamiento del lenguaje natural es una de las ramas de la llamada “inteligencia artificial” cuyo objetivo es diseñar programas informáticos que permitan la comunicación por texto o incluso por voz. Algunos de los resultados prácticos de esta disciplina son la traducción de textos, la categorización automática de documentos, el aprendizaje continuo del usuario, y por supuesto, los interfaces que permites la formulación sencilla de preguntas en forma de frase.

Centrándonos en este último campo en relación con las bases de datos jurídicas15, los nuevos algoritmos lingüísticos permitirían a los usuarios formular las preguntas en el idioma natural (tal como se expresan oralmente, sin usar operadores booleanos ni plantearse cuál ha de ser la estrategia de búsqueda). Este 14 www.cisstodoonline.es. Incluye tres módulos en materia Fiscal, Contable y Social, diseñados como herramientas de consulta inmediata, basadas en la relevancia y la semántica, con comentarios y ejemplos prácticos, desde los cuales se puede consultar directamente el precepto legal, la sentencia o el parecer de organismos públicos en la materia. 15 La International Conference on Artificial Intelligence and Law (ICAIL) celebra en junio de 2007 su undécima edición, y en su foro se tratan multitud de los temas aquí enunciados (http://iaail.org).

27

Page 28:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006“idioma natural” también afectará a la indexación, para que el sistema de búsqueda puede “entender” los documentos. Lo importante será trabajar con “los conceptos” y no con “la palabra”, tal como piensan las personas.

El lenguaje natural se encuentra muy unido a la semántica que hemos comentado en el punto anterior, ambos se complementan e incluso podría decirse que el uno es una evolución lógica del otro.

La aplicación futura del lenguaje natural a las bases de datos jurídicas podrá concretarse en:

o Formular por escrito una pregunta, tal como se expresaría oralmente, para obtener los documentos que tratan del tema jurídico en cuestión16. Ej.: deseo localizar información sobre extinción del contrato de trabajo en situación de baja por enfermedad.

o Reformularla, añadiendo términos que precisen mejor qué estamos pidiendo (“véase también”, “otros términos sugeridos”).

o Formular oralmente una pregunta y que la voz sea procesada para obtener los documentos que tratan del tema jurídico en cuestión.

o Interpretar errores del usuario cuando teclea las palabras. Un ejemplo práctico es el conocido “quiso usted decir?” de Google. Esta funcionalidad avisa al usuario en los casos en que cometa alguna errata ortográfica al escribir su pregunta y sugiere una nueva formulación de la misma sin erratas. El algoritmo actualmente reconoce de forma correcta entre un 80% y un 85% de las erratas.

FUTURO DE LOS ACTUALES SISTEMAS DE CLASIFICACIÓN Y CONSULTA (THESAURUS, METADATOS Y RELACIONES ENTRE DOCUMENTOS DIRECTAS E INDIRECTAS)

16 La empresa española Bitext está desarrollando un buscador en lenguaje natural, Natural finder, para localizar toda la información utilizando una redacción en la lengua propia del consultante y con formulación sencilla. Para ver el efecto práctico ha indexado todo el contenido del Boletín Oficial del Estado y propone preguntas similares a las siguientes “Quiero documentos que hablen de becas de postgrado para el extranjero” - “Quiero datos sobre las convocatorias a oposiciones que hayan sido en Sevilla”. Ver www.bitext.com.

28

Page 29:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006Los sistemas documentales de clasificación (thesaurus, metadatos, comentarios y relaciones) mantendrán su eficacia pero evolucionarán y se desarrollarán con proximidad a las tecnologías de la información.

Los Thesaurus jurídicos son un elemento muy destacado en la búsqueda de información y contribuyen a reducir el “ruido” que puede producirse en las consultas a texto libre (filtrando documentos que no tenían relación de fondo con ese término) y a reducir el “silencio” añadiendo documentos que en una búsqueda libre no hubieran sido encontrados. No obstante, y pese a que son sencillos de usar, comportan ciertas barreras.

Los Thesaurus no siempre incorporan todos los conceptos deseados y a mayor desarrollo puede resultar más complicado localizar el concepto para un usuario (más que navegar se suele buscar por palabras dentro del mismo). Si un concepto está catalogando muchos documentos el resultado de la consulta es tan amplio que se hace preciso combinar con la búsqueda por texto libre, y a efectos del documentalista se requerirá expandir y desglosar el concepto en unidades más específicas.

La tendencia evolutiva de los thesaurus en bases de datos jurídicas irá encaminada hacia:

o El desarrollo de thesaurus jurídicos en temas cada vez más específicos para bases de datos muy especializadas (ej. derecho de familia, derecho inmobiliario o urbanismo), integrando sistemas claros de interrelación entre conceptos (véase también).

o El uso de las catalogaciones como criterio de ponderación de la relevancia. Si alguien escribe “arrendamiento de vivienda” se podrá dar más peso a los documentos que hayan sido clasificados en la voz jurídica “arrendamientos urbanos”.

o La autoclasificación básica utilizando sistemas tecnológicos y con cierta tasa de error.

o El análisis complejo de los contenidos de un documento con el fin de proponer temas relacionados.

o La universalización del tesauro (único para todos los tipos de documentos) como método de búsqueda global y de sistema de creación de relaciones indirectas (si dos documentos han sido clasificados en la misma voz jurídica podemos deducir que ambos están interrelacionados entre sí).

29

Page 30:  · Web viewJunto con el título, resumen y datos identificativos habría que mostrar extractos dinámicos de la parte del texto que contenga las palabras buscadas (keyword in context,

Wolters Kluwer España, S.A. 18 de Octubre de 2006

o El estudio de las palabras clave o tags genéricos sin relaciones jerárquicas como método de catalogación simple (ej. folksonomy), aunque tiene bastantes restricciones.

Igual que los thesaurus, las recensiones, comentarios o extractos sobre los documentos se verán reforzados por la necesidad de identificar, cuando se está ante una lista de documentos, cuáles de los mismos son útiles para el profesional jurídico. Asimismo, la falta de tiempo fomentará la lectura rápida o abreviada, utilizando para ello, los propios resúmenes redactados por un documentalista que deberán ser auto explicativos, o presentando abreviados extractos de los documentos (ej. de una norma bastará con leer el precepto legal relacionado con la consulta).

Por otro lado, el gran volumen de información potenciará la catalogación de los documentos por su interés jurídico, diferenciando por ejemplo, las sentencias en la que el magistrado ponente desestima sin entrar al fondo del asunto, de las que fijan nuevos criterios jurisprudenciales. O si pensamos en legislación, distinguiendo las disposiciones meramente modificadoras de las sustantivas.

Asimismo, y respecto a los enlaces entre documentos jurídicos, veremos crecer su número y tipologías. La diversificación dará significado a cada tipo de relación, permitiendo por ejemplo distinguir un link simple (cita en el texto de un documento) de una relación especial que represente una modificación legislativa, un diferente ámbito territorial de aplicación, un iter procesal o una línea jurisprudencial.

Las bases de datos jurídicas del futuro están ya muy próximas, y poco a poco comprobaremos los cambios e innovaciones que se vayan produciendo. El que utilicen alguna de las técnicas aquí descritas, dependerá fundamentalmente de que logren un efecto beneficioso en el usuario y de cómo cubran las necesidades de consulta de los profesionales jurídicos.

30