metadatos en noticias: un análisis internacional para la representación de contenidos en...

12
METADATOS EN NOTICIAS: UN ANÁLISIS INTERNACIONAL PARA LA REPRESENTACIÓN DE CONTENIDOS EN PERIÓDICOS María José Baños Moreno, Eduardo R. Felipe, Juan Antonio Pastor Sánchez, Rodrigo Martínez Béjar, Gercina Lima XII Congreso ISKO España II Congreso ISKO España-Portugal Universidad de Murcia, 19 y 20 de noviembre de 2015. ISKO España-Portugal International Society for Knowledge Organization

Upload: maria-jose-banos-moreno

Post on 14-Apr-2017

468 views

Category:

Internet


0 download

TRANSCRIPT

METADATOS EN NOTICIAS: UN ANÁLISIS

INTERNACIONAL PARA LA REPRESENTACIÓN DE

CONTENIDOS EN PERIÓDICOS

María José Baños Moreno, Eduardo R. Felipe, Juan

Antonio Pastor Sánchez,

Rodrigo Martínez Béjar, Gercina Lima

XII Congreso ISKO España

II Congreso ISKO España-Portugal

Universidad de Murcia,

19 y 20 de noviembre de 2015.

ISKO España-Portugal International Society for Knowledge Organization

Introducción

• Volumen de información en Internet

• Información poco estructurada

• Dificultad de análisis y obtención de conocimiento

• Necesidad de agrupar información a nivel semántico

• Metadatos: – Conjunto de atributos que representan un recurso, facilitando su identificación y

distinguiendo documentos relevantes de los no relevantes (Yaginuma et al., 2003b; Hillmann, 2005; Abbud Grácio y Fadel, 2010, p. 10-11; Kallipolitis et al., 2012)

– Conjunto de propiedades asociadas a la faceta descriptiva del contenido de una noticia (IPTC, 2009, p. 20)

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 2

Introducción

• Estándares de metadatos: Conjuntos de elementos comunes para la descripción de recursos (Pereira y Baptista, 2004)

• Un recurso puede ser descrito con un esquema, que permite asignar un metadato para cada tipo de dato y un valor para dicho dato

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 3

Objetivos

1. Conocer qué estándares de metadatos se utilizan para representar el contenido de una noticia, tanto en periódicos como en la bibliografía especializada

2. Conocer la correspondencia entre los esquemas que se destacan en la bibliografía y los utilizados en los códigos fuente

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 4

Metodología

• Revisión de literatura: ¿qué esquemas se referencian?

• Construcción de una muestra de periódicos de ámbito internacional

• Análisis de los códigos fuente de dichos medios de comunicación: ¿qué metadatos muestran?

• Extracción de información con MetadadosHTML

• Comparación bibliografía – códigos fuente

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 5

Metodología Muestra de diarios de información

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 6

Resultados Esquemas presentes en bibliografía y códigos fuente

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 7

Esquemas en bibliografía ANPA 89-3 Dublin Core (DC) hNews Information Interchange Model (IIM) IPTC 7901 NewsML (NAR) News Value Markup Language (NVML) News Industry Text Format (NITF) Publishing Requirements for Industry Standard Metadata (PRISM) rNews Really Simple Syndication (RSS) vCard XMLNews

Esquemas en códigos fuente Etiquetas meta (HTML) Dublin Core (DC) hNews schema.org Open Graph Protocol (OG) Twitter

Resultados Comparación entre bibliografía y códigos fuente

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 8

Resultados Resumen de resultados

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 9

• Escasa coincidencia entre bibliografía y código fuente: Dublin Core (DC) y hNEWS

• HTML, Open Graph Protocol (OG) y Twitter Card son los más utilizados en los códigos fuente

• NewsML y NITF son los más referenciados en la literatura

• Título, resumen y palabras clave son los datos más representados

Conclusiones

• La mayor parte de los estándares específicos de medios de comunicación impresa no aparecen en el código fuente

• Diversidad de estándares que, paradójicamente, dificulta la estandarización de los metadatos en diarios

• Pese a la variedad de estándares utilizados en el código fuente, pocos van más allá de título, resumen y palabras clave

• Infrautilización de las posibilidades de la actual web semántica, al menos en la cara visible de los periódicos analizados

• Dos motivos posibles: no los utilizan o no los muestran

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 10

Bibliografía

• Abbud Grácio, J. C., & Fadel, B. (2010). Estratégias de preservação digital. In Gestão, mediação e uso da informação (pp. 58–83). São Paulo: Editora UNESP; Cultura Acadêmica. Recuperado de http://books.scielo.org/id/j4gkh/pdf/valentim-9788579831171-04.pdf

• Hillman, D. (2005, November 7). Using Dublin Core (DCMI Recommended Resource). Recuperado de http://dublincore.org/documents/usageguide/

• IPTC (International Press Telecommunications Council). (2009). NewsML G2. Specification Version 2.4. Power Conformance Level (No. Document Revision 1). Recuperado de https://www.iptc.org/std/NewsML-G2/2.4/specification/NewsML-G2_2.4-spec-PCL.pdf

• Kallipolitis, L., Karpis, V., & Karali, I. (2012). Semantic search in the World News domain using automatically extracted metadata files. Knowledge-Based Systems, 27, 38–50. http://doi.org/10.1016/j.knosys.2011.12.007

• Pereira, T., & Baptista, A. A. (2004). Incorporating a semantically enriched navigation layer onto an RDF metadatabase. In J. Engelen, S. M. S. Costa, & A. C. S. Moreira (Eds.), Building digital bridges: linking cultures, commerce and science. Brasília. Recuperado de http://repositorium.sdum.uminho.pt/handle/1822/604

• Yaginuma, T., Pereira, T., & Baptista, A. A. (2003). Metadata elements for digital news resource description. In Proceedings CLME’2003 - 3o Congresso Luso-Moçambicano de Engenharia (pp. 1317–1326). Maputo. Recuperado de http://repositorium.sdum.uminho.pt/handle/1822/279

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 11

GRACIAS POR VUESTRA ATENCIÓN

19-20/10/2015 XII Congreso ISKO España / II Congreso ISKO España-Portugal 12