Download - Agrovoc cswb training_2
AGROVOC para editores/redactores
Unidad #2: Términos y conceptos
IIAP, Iquitos June 30, 2010
Caterina [email protected]
2
Temario
Perspectiva sobre este curso
AGROVOC
Historia de AGROVOC CS y WB
AGROVOC CS explicado con el WBAñadir conceptos y terminosFlujo de trabajo
Ejercicios
3
Perspectiva sobre este curso
4
Objetivos
Capacitar futuros capacitadores y redactores de AGROVOC Concept Schema con el AGROVOC Work Bench
– para la revisión de la parte ES-EA
Dar una visión amplia sobre AGROVOC y metadatos en la FAO
– para contribuir en la organización de una red de usuarios de AGROVOC Concept Schema y Work Bench en LatinoAmerica
5
Que necesitamos
Comprensión general del problema (unidad #1)– metadatos en bibliotecas y para la
organización de información electrónica
Temas técnicos sobre ACS y AWB (unidad #2)– modelo de ACS, manejo con AWB– flujo de trabajo
Temas avanzados (unidad #3-4)– formato y modelo
6
Recapitulación: la familia AGROVOC
AGROVOC tesauro multilingua
AGROVOC Concept Schema (ACS)– refinamiento semantico de AGROVOC – ahora: sólo accessible con el AGROVOC WB– futuro: tambien con una GUI read-only
AGROVOC Work Bench (AWB)– herramienta online para el manejo de ACS – futuro: tambien otro vocabularios
7
El futuro de familia AGROVOC
AGROVOC CS será el producto primario
AGROVOC tesauro será un formato de conversión
8
AGROVOC tesauro
9
Recapitulación: usos de AGROVOC
En bibliotecas para indexar libros y publicaciones
En TICs para organizar información– Content management systems (AGRIDrupal)– Tagging (AGROTagger)– AGRIS– FAO-EIMS– sitios web– Geonetwork– próximamente: KDE Linux desktop
10
Relaciones USE y UF No jerárquicas
Entre términos que son sinónimos (o casi)
USE (use): el término preferido– descriptor, preferred term
UF (used for): el término alternativo– non descriptor, non preferred
Ejem. – USE Annuals, UF annual plants
11
Relaciones BT y NTJerárquicas
Entre 2 términos que son unos más generales que otros
– generalidad puede depender del contexto o del punto de vista
BT (broader term): el término más general NT (narrower term): el término más específico
Ejem. – BT Plantas anuales
• NT Plantas hornamentales anuales
12
Relación RTNon jerárquica
Es relación simétrica– si A es RT (related term) B, B es RT B.
Entre 2 términos que son “relacionados”– los dos son preferidos– depende de la perspectiva o punto de vista
Ejem. – USE Contaminantes – RT Polución
13
Estructura de AGROVOC
Representamos:– Términos como boliches – Relaciones BT/NT como lineas– Relaciones RT como lineas
Obtendríamos un grafo
14
Grafo de la estructura de AGROVOC
15
Grafo con términos no preferidos
Recuerda: las relaciones BT/NT y RT sólo juntan términos preferidos
– Los UF están lógicamente conectados con sus USE
Ahora representamos:– Términos preferidos como boliches redondos– Términos no preferidos como boliche oval
16
Grafo con términos no preferidos
17
AGROVOC multilingüe
La estructura es una– No cambia de idioma a idioma – Términos tienen traducciones– Hay casos en que no hay traducción
Cada boliche representa el conjunto de términos preferidos (no preferidos) en todos los idiomas
18
Ejemplo AGROVOC multilingüe
Inglés:
USE Annuals – 28997 descriptor UF Annual Plants – 37199 non descriptor
Español:
USE Plantas annuales – 28997, descriptorUF (null) – 37199, non descriptor
19
AGROVOC multilingüe ejemplo
20
Diversos niveles
Contenido– terminología
Estructura– el grafo es– tiene que ver con las relaciones que se usan
Formato– de almacenamiento: como los datos están
guardados – de intercambio: como los datos son
exportados para otro uso o usuario
ottimo,
21
Formatos electrónicos
Almacenamiento: base de datos relacional (SQL)
Intercambio:– TBX, Term Base eXchange. XML estándar
para datos terminológicos – SKOS, Simple Knowledge Organization
System. Vocabulario para expresar tesauros en RDF
– OWL, Ontology Web Language. Experimental.
ottimo,
22
Como creció AGROVOC
Se fueron añadiendo términos en tanto servían, durante el indexing
Usuario sugería términos a FAO, que revisaba, añadiva y publicaba...
Como lineas guías, metodologías general para tesauros, recursos terminológicos FAO, y lineas guías para AGROVOC
23
Lineas guías para tesauros
Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies, ANSI/ISO Z39.19-2005
Guidelines for the establishment and development of multilingual thesauri, ANSI/ISO 5964-1985
ottimo,
24
Lineas guías y recursos FAO
Basic guidelines for managing AGROVOC
ftp://ftp.fao.org/docrep/fao/010/ai144e/ai144e00.pdf
Adding new terms to AGROVOC
momentáneamente cargado como GoogleDoc
25
Otro recursos FAO
The FAO House style
http://www.fao.org/docrep/004/AC339e/AC339E00.htm
FAOTERM
http://www.fao.org/faoterm/
ottimo,
26
Manejo multilingüa de AGROVOC
1. FAO tiene una copia matriz, un RDB 2. La institución responsable para un idioma recibe una copia3. La institución envia la copia modificada a FAO4. FAO incorpora cambios en la copia matriz 5. FAO publica en linea una nueva versión
Manejo centralizadoInclusión de nuevos términos demoraba
Con el AWB todo eso va a cambiar!
ottimo,
27
De AGROVOC tesauro a AGROVOC CS
28
Historia condensada de AGROVOC
1982 nace el tesauro AGROVOC 1990-2000 gran incremento de idiomas
– necesidad de actualización veloz– 1995-2000+ internet, web semantica,
2005 requisitos para un AGROVOC WB 2006 inicia desarrollo de ACS, AWB
– pruebas con OWL
ottimo,
29
Historia condensada de AGROVOC cont'd
2009 – SKOS es una recomendación W3C – Gran difusión de Linked Data– OWL aparece demaciado “demanding”
2010 – Junio: AWB estrenado – Sigue el trabajo para usar volver AWB en una
interface para el manejo de RDF-SKOS data
ottimo,
30
Multilingüalidad y códigos
Términos tienen códigos para identificación
Términos que son traducciones uno del otro tienen el mismo código
Cada término se puede identificar unívocamente con el conjunto de código y ISO-2 de su idioma
31
Objetivos de AGROVOC WB
Dinamizar la actualización de AGROVOC
Tener una herramienta apropiada a los requisitos de AGROVOC CS
32
Objetivos de AGROVOC CS
Tener una estructura y contenido más usable por las aplicaciones de web semántica y para la organización de contenido electrónico
33
La revisión de AGROVOC
Contenido – Hecha por ICRISAT, FAO– Menos raices– BT/NT han sido simplificados– RT han sido transformados en relaciones
Desarrollo del AWB– Hecho por ICRISAT, IIT Kanpur, MIMOS
Bangkok, FAO
Formato y modelo (FAO+)
34
Características de AWB
Basado en la web
Maneja idiomas y traducciones
Maneja flujo de trabajo distribuido
Permite exportar en varios formatos
Produce estadísticas para análisis
ottimo,
35
Situación actual
AWB tiene sus primeros usuarios ;-)
El master RDB ha sido descontinuado
Copia matriz ahora es en RDF– RDF tambien se almacena como DB– versión SKOS como formato para
exportación
En el futuro SKOS será el formato nativo
ottimo,
36
El AGROVOC CS y WB
37
Elementos del ACS
Conceptos
Términos en varios idiomas
Relaciones entre tèrminos– Más tipos que USE/UF
Relaciones entre conceptos– Más especificas que RT
ottimo,
38
Leyendo la GUI
ottimo,
1
2
3
4 5
6
39
Leyenda
1.Visualizador de jerarquía 2.URI de los conceptos3.Detalles acerca de los conceptos4.Operaciones aplicadas en los conceptos5.Opciones de visualización de los conceptos6.Terminos del concepto
ottimo,
40
La estructura de AGROVOC CS
Grafo simile al anterior, pero ahora los boliches representan conceptos
– Cambiamos tamaños y forma porque un concepto está hecho de términos preferidos y no preferidos
Las relaciones BT/NT se quedan
Ahi relaciones más especificas que RT – Pero se pueden ver como sub-relaciones
ottimo,
41
Grafo de la estructura de AGROVOC CS
42
Conceptos
43
Definición operativaConcepto: conjunto de términos usados en cada idioma para nombrarlo. Información guardada: 1. Posición del concepto en la jerarquía 2. Términos que “forman” el concepto en varios idiomas 3. Definiciónes en varios idiomas 4. Notas adicionales: editorial note, scope note5. Pertenencia a subvocabularios6. Historia de los cambios 7. Imagenes 8. Relaciones nonjerarquicas con otros conceptos
ottimo,
44
Añadir un concepto paso 1
1. Eligir la posición en la jerarquía2. Dar click al ícono “+” en la barra sobre la
jerarquía3. Aparece una ventanita, introducir esta
información1. Una etiqueta (label)2. El idioma de la etiqueta 3. Posición en la jerarquía4. Namespace5. URI
ottimo,
45
Añadir un concepto paso 1
ottimo,
46
Etiquetas de conceptos
Cuando se adiciona un nuevo concepto, la etiqueta se convierte en término preferido en el idioma indicado
– Si el idioma no es inglés, el término necesita un definición en EN
– Se recomienda siempre poner definición
ottimo,
47
Namespace
Namespace = espacio de los nombres– El espacio en el cual un nombre está definido
Ejem. – El nombre Peter en el espacio de los nombres
de este curso– El nombre “plantas” en el espacio de
AGROVOC es distinto de “plantas” en otro contexto
Será http://aims.fao.org/aos/agrovoc/
48
URIs
URI = Universal Resource Identifier– Formado por namespace + nombre (código)
URL = Universal Resource Locator
– Más específico que URI porque tambien es una dirección en el internet
Durante años URI != URL– El URI no tenía que ser tambien dirección – Ahora la tendencia es usar HTTP URI =
URL
ottimo,
49
Códigos para términos y conceptos
ACS incluye nuevas entidades: conceptos. ¿Como nos vamos a referir a ellos?
• Si los términos que lo forman ya existian:– el concepto toma un código basado en el del
término preferido – cada término se queda con su código
• Si el concepto es nuevo– toma un código generado por el sistema
ottimo,
50
Códigos y URI
El “nombre” del concepto que creamos, es un código (números)
– Idea: independencia de los idiomas
Mucha discusión sobre como hacer buenos URIs, sobre todo en el área de Linked Data
– Es importante que el URI corresponde en algo en el internet
ottimo,
51
Añadir un concepto - paso 2
Para añadir más información, utilizar las pestañas en la parte derecha de la interface
ottimo,
52
Añadir un concepto - paso 2
ottimo,
53
Más información sobre un concepto
1. Más terminos (no preferidos)2. Editorial note/scope note1. Se encuentran en la pestaña “Note”2.“Editorial note”: para explicar razón de cambios 3.“Scope note”: para descripciones temáticas
3. Historia de los cambios1. Agregada por el sistema2. Se encuentra en la la pestaña “History”
4.Imagene para explicar el concepto1.Se encuentra en la la pestaña “Image”
ottimo,
54
Más información sobre un concepto
1.Relaciones entre conceptos 1. Se encuentran en la pestaña “Relationship”2. En unidad #3
2. Atributos del concepto 1. Si es parte de un subvocabulario 2. Se encuentra en la pestaña “Attribute”3. En unedad #3
ottimo,
55
Términos
56
Términos
Pueden ser “preferred” o “not preferred”
Sólo un preferido está permitido en cada idioma para cada concepto
Se pueden especificar atributos morfológicos Pueden ser de distintos “tipos”
– O sea, pertenecer a un vocabulario Tienen una historia de cambios
– Agregada automaticamenteTienen códigos
ottimo,
57
Añadir un término - paso 1
1. Elegir el concepto deseado 2. En la pestaña “Terms” dar click “Add new term”3. Se abre un ventanita, ahi poner:1. Término2. Idioma3. Si el término es preferido
ottimo,
58
Añadir un término - paso 1
ottimo,
59
Añadir un término - paso 2Para añadir más información, dar click al término
que acabas de añadir
1. En la pestaña “Terms” dar click al término elegido
2. Se abre una ventanita con varias pestañas:1. History2. Relationship: relaciones terminológica
1.En unedad #33. Attribute: “has term type”
• Más en unedad #34. Note: códigos y información morfológica
ottimo,
60
Añadir un término - paso 2
ottimo,
61
Morfología de términos
Se define en la pestaña “Code”
Singular / plural – Ejem. Arbol, arbolesVariación ortográfica – Ejem. colour, color
– Pueden ser variaciones de idioma nacional: EN-UK, EN-US
– Pero hay mucho más paises que hablan inglés!
Stem form – Ejem. Vas, vamos, vayas – stem: va– Stem != raiz
ottimo,
62
“Tipos” de términos
Se definen en la pestaña “Attribute”
El “tipo” de un término puede ser: – Acrónimo (FAO, IIAP)– Nombre común (Animals, bacteria, fungi,
plants, viruses)– Nombre taxonómico
Término hasTermType (taxonomic term for ....)
ottimo,
63
AGROVOC WB
Flujo de trabajo
64
Flujo de trabajo editorialUsuarios y roles
Para permitir control de calidad
Implica una secuencia de acciones– Sugerencia y revisiones de elementos– validación – Publicación
Comparen con wiki-like publicación
65
GlosarioRights: permiso para ejecutar acciones
– ejem. añadir terminos, borrar relaciones
Rol: función en un flujo de trabajo– Editor, publisher– Cada rol tiene un determinado conjunto de
permisos– Un “publisher” puede aprobar y rechazar
cualquier cambio
Status: estado de un elemento en un flujo de trabajo– e.g. Borrador, publicado
ottimo,
66
User roles
http://aims.fao.org/es/workbench/help/users
1. Visitor2. Non registered users3. Term editor4. Ontology editor5. Validator6. Publisher7. Administrator
ottimo,
67
68
Roles y permisos – 1
Visitor Sólo navegar y buscar
Non registered usersSugerir términos en cualquier idiomaSugerir conceptos Sugerir relaciones
ottimo,
69
Roles y permisos – 2
Term editors Crear nuevos términos sólo en algunos idiomas Editar, borrar términos que ellos mismos crearonSugerir cambios en conceptos
Ontology editors Manejan términos y conceptos Borrar conceptos sólo en su idiomaEditar o borrar conceptos que ellos mismos crearon
ottimo,
70
Roles y permisos – 3
ValidatorsControlar y validar los cambios hecho por term editors y ontology editors based (algunos idiomas)
PublishersTienen permisos en terminos y conceptosPuede validate editores y confirmar el trabajo de validadores
En todos idiomas
ottimo,
71
Roles y permisos – 4
AdministratorsTODO en TODOS los idiomas
ottimo,
72
Estado de elementos – 1
1. Proposed – por guest or by editor2. Revised – by guest or by editor3. Validated4. Published5. Proposed deprecated6. Deprecated
ottimo,
73
Estado de elementos en ACS – 2
Proposed – Cuando algo está propuesto por primera vez
Revised – Elemento ha sido modificado
•En los 2 casos se distingue si el cambio se hizo Por visitante Por usuario registrados
ottimo,
74
Estados de elementos en ACS – 3Validated
Elemento has sido aceptados por un validator
PublishedElementos ha sido aprobado por un publisher
Proposed deprecatedElemento que ha sido borrados
DeprecatedElemento borrado por validators/publishers
ottimo,
75
Para practicar
76
1: Familiarizar con el tesauro
1. Ir al AGROVOC tesauro2. Buscar el término “leguminosae”3. Anotar sus codigos y observar su “word tree”4. Buscar traduciones en ES, EN, FR, IT, PT, AR5. Mirar a su UF6.Visualizar la versión XML/RDF 7.Comparar lo que se visualiza en la página con lo que se ve en la versión XML/RDF
ottimo,
77
2: Entrar como visitante
1. Ingresar como visitor2. Buscar “leguminosae” 3. Oservar cual operaciones son permitidas4. Escoger los idiomas AR, EN (all), ES (all)5. Marcar “Show URI” 6. Marcar “Show also non-preferred terms”7. Observar como cambia la información en la interface
ottimo,
78
3: Roles y permisos
1. Ir a http://aims.fao.org/es/workbench/help/users 2. Comparar lo que se puede / no se puede hacer en la GUI con lo que esta descrito en el documento3. ¿Hay diferencias? ¿Cuales?4. Tomar nota de las diferencias y de eventuales preguntas
ottimo,
79
4: Problemas
1. Ir al issue tracker http://code.google.com/p/agrovoc-cs-workbench/1. Buscar temas sobre “concept”2. Leer un par de temas y observar la estructura del reporte3. Pedir una cuenta a Sachit [email protected]
80
5: Non registered user
1. Ingresar como non registered user 2. Escoger los idiomas AR, EN (all), ES (all)3. Observar cuales menus son activados4. Muestrar URI 5. Muestrar terminos no preferidos6. Observar que se ve en la interface
ottimo,
81
6: Ingresar como term editor – 1
1. Ingresar como “term editor” 2. Escoger los idiomas EN (all), ES (all)3. Buscar “leguminosae” 4. Crear un nuevo concepto “guaba” bajo ello5. Asignar una etiqueta in ES-EA6. Seguir las istructiones 7. Añadir términos en chino8. Observar que se ve en la interface9. Cambiar idioma y agregar chino
ottimo,
82
7: Ingresar como term editor – 2
1. Siguendo el ejercicio precedente, observar cuales menus son activados2. Añadir una definicion in ES al concepto3. Ir a la pestaña “History” y leer lo que hay4. Ir a la pestaña “Note” y agregar una nota editoriale
ottimo,
83
8: Ingresar como concept editor
1.Ingresar como concept editor2.Leer la lista de cambios (“Recente changes”)3.Buscar “guaba”4.Borrar el concepto5.Ir a la la pestaña “History” y leer lo que hay
ottimo,
84
9: Ingresar como publisher
1. Ingresar como publisher2. Ir a “Validation”3. Buscar el ultimo cambio hecho por ti4. Rechazarlo
ottimo,
85
10: Leer la documentación
1. Ir a ftp://ftp.fao.org/docrep/fao/010/ai144e/ai144e00.pdf
2. Leer el documento 3. ¿Que diferencias se notan con lo que hiciste
hasta ahora?
ottimo,
86
Todo claro?
ottimo,