nuevas tendencias, el periodismo y la visualización de datos

16

Upload: consejo-de-redaccion

Post on 08-Mar-2016

218 views

Category:

Documents


0 download

DESCRIPTION

Panel a cargo de Mariana Santos, de The Guardian, Juan Diego López, de La Nación, y Miriam Forero Ariza, de Consejo de Redacción. Moderado por Daniel Suárez Pérez y realizado durante el VI Encuentro de Periodismo de Investigación, de Consejo de Redacción.

TRANSCRIPT

1

MARIANA SANTOS

Las posibilidades de la visualización de datos

Les voy a hablar de la experiencia que yo he vivido en The Guardian. Para resumir, lo

primero que debo decirles es que no hay una sola persona que pueda hacer de todo,

no es algo así como llegar a un periódico y decir: “Consígueme a un chico que haga

visualización de datos”. No, no es así, por lo menos en mi unidad es un trabajo de

equipo en el que se necesita, al menos, un periodista, un diseñador y un

desarrollador.

Una parte del equipo está conformada por la gente de datos que cuenta con

los periodistas y los desarrolladores que buscan datos, buscan la historia, buscan el

contenido. Ellos en conjunto con los diseñadores van a pensar cómo contar la

historia, porque, por un lado, se puede contar una historia con el tema que surge de

inmediato, pero, por otro lado, hay más historias que se pueden contar a partir de

allí. Entonces, el trabajo con el diseñador es muy importante en cuanto la elección de

la narrativa y la forma visual de contar. En mi caso particular todos mis trabajos son

para online, no hago print, pero trabajo mucho con los de print porque hay un montón

de proyectos que vienen de print y renacen para ir a online, lo que te da otras

oportunidades.

La sala de prensa de The Guardian es un espacio muy iluminado, lleno de

vidrios, y muy grande en el que todas las personas trabajan en open space1. Como

sabrán, no somos un diario privado, sobrevivimos gracias al fondo Scott Trust2, de

ahí que se esté pensando en nuevos proyectos o nuevas formas de sustentabilidad

como las Guardian Masterclasses, que son cursos y talleres de capacitación para

periodistas, diseñadores y personas que quieran hacer periodismo de investigación,

long form writing, entre otras cosas, pues el dinero en algún momento se va a acabar.

Ahora bien, The Guardian se mantiene gratis, todos los accesos son gratuitos, no

tenemos paywall, y nuestro editor quiere seguir así, pero es necesario reinventarse y

nosotros como periodistas también debemos reinventar nuestras historias, porque no

podemos continuar en el esquema de texto seguido de una foto; con el medio digital

hay que empezar a hacer cosas distintas.

Para que se hagan una idea de cómo se manejan los dineros en The Guardian

tenemos 170 desarrolladores; hace un año y medio éramos 40 y ahora somos 170. De

manera que hay mucha inversión en desarrollo, todos los productos se hacen en casa

y sé que no se puede contar con esta clase de inversiones en cualquier periódico, es

algo que nosotros tenemos las suerte de tener.

1 Open Space Technology (Tecnología del Espacio Abierto): es una técnica o metodología de diálogo o de trabajo abierto para grupos grandes o pequeños, en la que todas las personas colaboran, se autoorganizan, se apropian de los resultados, conviven, hablan y trabajan. 2 El Fideicomiso Fondo Caritativo Scott es un presupuesto anual creado para apoyar proyectos relacionados con el periodismo independiente, la ética periodística, la alfabetización mediática y la capacitación de periodistas en el Reino Unido y en el extranjero.

2

Cómo contar una historia

Quiero hablarles de uno de los trabajos que realizamos en el diario y que pasó de

print a online. La historia de los gastos del Gobierno es en general muy aburrida, es

algo de lo que las personas hablan todo el año y es, en cierta medida, un tema fuerte

porque es muy duro que corten los dineros para las pensiones, para las escuelas, etc.

Así que como pueblo nos duele directamente nuestra patria.

Todo empieza con el acceso a la información. El Gobierno publica la

información en PDF, es decir, podemos encontrar todos los gastos públicos por

secciones, uno va al sitio oficial y descarga la información. Ahora bien, si usted es

una persona especializada en análisis de datos y en análisis de manejo de dineros

pues va a entenderlo todo, pero si es una persona común que no entiende mucho de

matemáticas y gastos esta historia del PDF no le dirá mucho. Entonces, nuestro

trabajo es traducir esto para que pueda tocar a las personas y estas puedan entender

lo que sucede y, por ende, se sientan interesados en explorar y en elegir.

Primero realizamos el trabajo en print. Se llama “Atlas de gastos del

Gobierno3” y es una opción para visualizar y elegir con pelotas las diferentes

secciones y gastos del Gobierno. Claro, se ha hablado mucho de que las pelotas no

son la forma más intuitiva para identificar distintos tamaños de información, pero a

nosotros nos funcionó muy bien, pues fue clara la jerarquización y diferenciación de

la información por intensidad de colores y tamaños de las pelotas. De hecho, el

Gobierno imprimió el Atlas en tamaño gigante y lo expuso en sus oficinas para que

todos pudieran verlo, pues se presentaban allí todas las informaciones y toda la

distribución de los gastos públicos por departamentos.

Para esclarecer un poco el proceso les voy a explicar lo siguiente. The

Guardian tiene tres equipos principales de diseño. Está el equipo de diseño de print,

que son aquellos que hacen cosas de última hora, es decir, si hoy renunció el papa hay

que hacer algo para publicar en un par de horas. Luego, encontramos el design team,

que hace todo el diseño para online, como botones o layouts, cosas muy básicas y

rápidas, de alrededor de tres días de producción interactiva. Finalmente, está el

interactive team que es el equipo en el que yo estoy, allí hacemos cosas más largas, de

tres semanas o más, lo que hace que no podamos asistir a breaking news, aunque en

ocasiones hay cosas que son del breaking news y que merecen algo más desarrollado

que tomará varias semanas. Por ejemplo, con el papa hicimos algo muy rápido para el

mismo día de la renuncia, pero después el interactive team tuvo dos o tres semanas de

desarrollo, antes de la elección del nuevo papa, en el que hicimos un trabajo más

desarrollado sobre los perfiles de cada uno de los papables.

Retomando el trabajo de los gastos del Gobierno, lo que hicimos después de

la publicación en print fue hacer la parte interactiva del Atlas del impreso, en el que

el usuario podía explorar cada pelota de la que se desplegaban subcategorías y

contendidos para mirar cuánto dinero se iba a cortar y cuánto dinero se quedaba en

cada uno de los departamentos. Claro, siempre hay pros y contras en cada una de las

opciones. En el print el lector puede ver toda la pantalla y comparar todos los

3 Public spending by UK’s central government departments, 2010-2011

3

sectores, mientras que en el digital el usuario puede entrar en un departamento y

explorar dentro este, pero pierde un poco the hole picture.

Más adelante mi equipo hizo un juguete4, es decir, se contó la historia a

través de un juego para que el utilizador se entretuviera y no solamente leyera para

informarse, sino que a su vez se sintiera entretenido y relajado. Entonces, realizamos

otra vez el mismo proceso, lo separamos por departamentos y después invitamos al

usuario a ponerse en los zapatos de los encargados de la distribución de los dineros

públicos, así se le preguntaba al usuario cómo realizaría él los cortes de presupuesto.

Luego de realizado el corte, a través de una curaduría editorial, el usuario podía

copiar el link y enviárselo a sus amigos por Tweeter o Facebook y así empezar una

conversación con una base más sólida de entendimiento.

Los disturbios de Inglaterra

Los disturbios de Inglaterra fueron un suceso muy fuerte en el que las personas

salían a la calle y de repente a través de teléfonos BlackBerry empezaron a incentivar

crímenes de toda índole, desde poner fuego en las calles, en las casas y en los coches,

hasta incendiar las casas de grandes compañías como Sony. Uno de nuestros

periodistas fuertes de investigación, que se llama Paul Lewis, estaba mirando la

reacción de las redes sociales con los twitter que se lanzaban y en ese momento se

tomó la decisión de seguir esta red social para ver lo que pasaba. Lewis fue la persona

en el medio que intentaba mirar si la información era correcta o no. Este ha sido, tal

vez, el evento más tuiteado de historia con alrededor de 2.6 millones de tweets5.

Luego del seguimiento inicial de Lewis The Guardian pensó que solamente

con Twitter no se podía hacer el seguimiento, así que se le pidió a las personas que se

conectaran a través de Facebook, Twitter o The Guardian Log in y nos contaran lo

que estaba sucediendo en sus calles, que nos enviaran fotografías y demás elementos.

Ahí creamos una barrera porque ya no se trataba solamente de decir tonterías, sino

que había un esfuerzo que le iba a tomar a las personas un tiempo. Después el mapa

adquirió popularidad y los usuarios podían mirar muy cercano al tiempo real lo que

estaba ocurriendo; cliqueaban y abrían una ventana con las informaciones. Al tercer

día del suceso hicimos una reflexión en print y mapeamos con las cosas más fuertes e

importantes del hecho, pues teníamos un espacio limitado. Al final, con todo este

mundo de tweets y con la participación social, Paul Lewis llegó a mi equipo y nos dijo:

“Mira, tengo 2.6 millones de tweets, ¿qué podemos hacer? Eso sí, tenemos que ver

cómo estudiar los datos, porque no todo es verdad”.

Los riots ya habían pasado, pero teníamos que ver cómo íbamos a investigar

todo aquello que se había generado desde la población. En ese momento una

universidad estaba interesada en desarrollar un algoritmo matemático que estudiara

el tweet, es decir, que revelara si un tweet era positivo o negativo. Entonces, si alguien

tuiteaba “los riots fueron al zoológico, abrieron las jaulas de los leones y hay un león

que se está comiendo a las personas” y yo respondía diciendo “sí, sí, claro” el

4 Gamification: contar una historia a través de un juguete. 5 How riot rumours spread on Twitter

4

algoritmo miraba y afirmaba que yo estaba de acuerdo, pues “sí, sí, claro” son

palabras positivas. Sin embargo, esto no era así, porque la lengua humana tiene

ironía, metáforas e intersecciones al hablar que los tweets y el algoritmo matemático

no entendían porque no hablan, no son humanos, no tienen emociones y

sentimientos. De manera que una semana y media antes de lanzar el proyecto con

este algoritmo miramos que habían muchos tweets de este estilo, es decir, que no eran

positivos, sino negativos. Así que estudiamos las relaciones entre tweets y

descubrimos que todo estaba mal. Lo que hicimos fue poner a los estudiantes y

académicos que estaban desarrollando el algoritmo a revisar uno por uno para que

pudiésemos poner el estudio6.

Grandes oportunidades para desafiar nuestra creatividad

Lo que les voy a comentar ahora es para que se den cuenta de que solamente porque

es The Guardian no quiere decir que todo va súper bien. The Guardian quiere llamar

la atención del mundo para que lo vean, así que invierte mucho dinero en la plata

física y en la expansión en los países de habla inglesa, por ejemplo, ahora hay oficinas

en Australia. Entonces, cuando se dio lo de los Juegos Olímpicos de 2012 en el diario

pensaron que todo el mundo iba a mirar hacia nosotros porque estábamos en

Londres. En ese momento yo era la última de la línea y les propuse que trabajáramos

en conjunto los de comercial, editorial y desarrollo para así tener ideas fuertes,

porque iba a ser una oportunidad magnífica y si lo hacíamos un año antes tendríamos

aún más tiempo y se trabajaría sin presiones. Alrededor de 100 personas se

apuntaron para la realización del proyecto, pero dos días antes de empezar la jefa del

proceso me dice: “Mariana, quita eso, no podemos hacerlo; no tenemos Project

Manager”. Claro, yo en todo caso pensaba que podíamos tener ideas, que podíamos

llevar a cabo un preproceso, pero no, la orden fue acabar con todo y yo no podía

hacer nada porque corría el riesgo de que me despidieran. Todo esto se los cuento

para decirles que no dejen que el proceso interrumpa sus ideas y si las personas

tienen ganas de trabajar háganlo, no interesa que no sea perfecto al inicio, las ideas

son, justamente, un inicio para tener algo fuerte.

Lo que finalmente hicimos fue una interfase exploratoria, varios miembros

del equipo aprendieron a hacer 4D y en conjunto con un fotógrafo que había

realizado fotografías 3sixty hicieron un mapa 3D interactivo para que las personas

pudieran ver lo que sucedía dentro de las instalaciones en las que se realizarían los

Olímpicos7. Ahora bien a 3 o 4 meses de los Olímpicos aún no había Project Manager

y la persona responsable del tema llegó a nuestro equipo y nos dijo: “Hagan lo que

quieran, pero hagan algo”. Claro, lo primero que pensé es que si no nos hubieran

detenido tiempo atrás en ese momento habríamos contado con muchas ideas para

llevar a cabo.

Otro de los proyectos que nos gustó mucho fue el interactivo que realizamos

para que las personas pudieran ver en tiempo real lo que sucedía con los juegos y con

6 Vea una explicación detallada del proceso y el resultado del estudio en el video It was a war, and we had the police scared 7 London 2012: A virtual reality tour of the Olympic & Paralympic Games

5

las tablas de medallas. Ahí tuvimos un reto, puesto que la BBC tenía todos los

derechos de las imágenes de video y nosotros no podríamos utilizar nada de video,

entonces tuvimos que pensar en cómo contar las historias sobre Olímpicos en real

time y sin video. Pues bien, creamos el Second Screen8, un portal en el que el usuario

podía elegir fotos, tweets, guardian comentarios, tablas de medallas, etcétera en real

time. También podían ver cosas que pasaron antes navegando en la línea de tiempo e

incluso hicimos un juego9, era algo a modo de broma ya que teníamos toda la libertad

de proponer, así que hicimos un ATS Game con los datos de todos los records de

corredores o nadadores que han jugado o han sido campeones olímpicos. Entonces, el

usuario jugaba con personas que habían sido campeonas de otros países y en otros

años, y después, para entrar en más locura, el usuario podía desbloquear la opción de

“animal” y elegir a un león o una pantera. Así que comparábamos las habilidades de

los humanos con las de los animales, por ejemplo, la velocidad del hombre con la de

un caballo. Cabe señalar que para ello llamamos al Instituto de Biología para saber

con exactitud las habilidades de los animales que pusimos en el juego.

Quiero finalizar hablándoles de una experiencia personal en mis primeros

años en el diario, del primer trabajo que realicé cuando era interna. Antes de llegar a

The Guardian yo trabajaba en Universal Music haciendo animación para TV y para

musicales, así que cuando me entregaron una base de datos de cosas que se iban a

utilizar en dos años, una base de datos sobre los Juegos Olímpicos, intenté aplicar

mis conocimientos previos utilizando tipografías y elementos más cercanos a The

Guardian y contar la historia de los datos con estilo grafico. En ese momento yo

trabajaba por las mañanas en WikiLeaks y por las noches me dedicaba al proyecto de

los datos, pues era lo que realmente sabía hacer y quería mostrar en el diario que yo

sabía hacer más cosas, estaba muy entusiasmada y trabajé con la ilusión de que les

gustara mucho10. Pues bien, cuando termine estaba súper encantada, debo decir que

el director artístico me ayudó muchísimo, y les entregué el trabajo para que pudieran

publicarlo, aún faltaban dos años para los Olímpicos, y me dijeron: “Mira, nosotros

nunca habíamos hecho eso. No sabemos si vamos a poder publicarlo, a las personas

no les van a gustar”. ¡No podía creerlo! No había dormido en semanas ¿y no lo iban a

publicar? Bueno, me resigné y entre tanto me hice parte del staff y empecé a hacer

más cosas con visualización de datos. En ese punto ya no le preguntaba al editor si

podía o no publicar algo, simplemente lo hacía y como el video es algo tan fácil de

compartir y de mirar, siempre y cuando sea de menos de 2 minutos, se empezaron a

generar un montón de cosas. Al paso de dos años, en el año de los Juegos Olímpicos

de Londres, publicaron mi trabajo, pero se quedó dos años guardadito. Por supuesto,

solamente después de que The New York Times empezó a hacer videos The Guardian

pensó: “Si ellos hacen, nosotros también podemos hacerlo”. Así que, además publicar

mi trabajo, hablaron conmigo para que realizara visualizaciones por mes. Entonces,

es un poco difícil luchar con los pre-supuestos y la mentalidad de un periódico muy

grande que tiene que ser bueno y no puede fallar.

8 Olympics Second Screen: archive edition 9 Could you be a medallist? Find out with our brilliant retro interactive 10 Olympics 2012 in numbers – animation

6

Mi conclusión es trabajen en equipo. Aquí en Latinoamérica me parece que

las personas son muy amables y humildes, pero en Londres es común que los

editores piensen que lo saben todo, así que si ponen el ego tranquilito las cosas se

procesarán mucho mejor. Piensen siempre que toda la gente que trabaja con ustedes

tiene muchas ganas y mucha pasión, y que cuando todos se involucran los proyectos

son mayores y mucho más fuertes.

JUAN DIEGO LÓPEZ

La experiencia de una unidad de visualización de datos –

El caso de La Nación de Argentina

Recuerdo que a finales del 2009 me llamaron a una reunión en la que me dijeron:

“Ché, empecemos a hacer cosas con datos”. Esto me pareció buenísimo pero el

problema era qué íbamos a hacer. Así que, como imaginarán, fue un año de muchas

reuniones entre periodistas, diseñadores y editores para empezar a pensar en algunos

proyectos de datos. Finalmente, en el 2010 empezamos el proyecto de subsidios a

colectivos11 en el que trabajó un periodista del papel de la edición económica, tres

personas de sistemas y una agencia externa que generó el micrositio de subsidio a

colectivos. Luego, el equipo de datos de La Nación empezó con mucho miedo y

despacito a involucrar más gente, y entre tanto con el equipo de realización

multimedia y diseño interactivo nos planteábamos: “Nosotros podemos generar

visualizaciones bonitas y atractivas para el lector, pero nos tienen que dar algo más”.

De manera que para trabajar partimos del modo en el que esas visualizaciones le

ayudarían a los periodistas a entender y a encontrar historias.

Para mí la visualización de datos es una manera sencilla de mostrar datos

complejos, que le sirve tanto al lector, pues le ayuda a asimilar y a entender los datos,

como a los periodistas, pues les ayudan a encontrar datos, a transmitir mayor

información en menor tiempo, facilita además el trabajo de análisis y les permiten

descubrir nuevas historias. A este respecto, les quiero hablar del proyecto de

declaraciones juradas12, en el que decidimos mostrar las declaraciones juradas del

Gabinete Nacional Argentino. Allí, el reto era transformar estos documentos

aburridos, complejos e insípidos en un producto didáctico y amigable para el lector,

porque de nada nos servía mostrar los papeles de archivo.

Lo primero que tuvimos que hacer fue conseguir los datos, es decir, solicitarle

a la Oficina de Anticorrupción Argentina las declaraciones juradas de cada uno de los

miembros del Gabinete. Una vez las obtuvimos, que por cierto nos costó mucho

trabajo, las agrupamos en 3 categorías para poder hacer el análisis de información

personal, de los cargos y de los bienes de cada integrante. Luego de esto la pregunta

fue, ¿cómo visualizamos la información? Entonces, el equipo de diseño interactivo y

de visualizaciones planteó que la manera más fácil de hacerlo era agrupar los datos

por color, unos colores que se apegaran al diseño del diario y al diseño de la pagina, y

que, además, debíamos trabajar fuertemente desde lo icnográfico.

11 Los subsidios a colectivos en Argentina 12 Los bienes de los funcionarios, en una news application de La Nación

7

Más adelante, el interrogante fue, ¿y cómo navegamos en esta marea de

información? Pues bien, el primer desafío que se nos presentó fue qué funcionario

elegir, es decir, darle la posibilidad a la gente de que hiciera la elección a través de

fotografías, para ello generamos un cabezal fotográfico. La otra opción que

concebimos fue creada para aquellas personas que no conocían la cara del

funcionario, entonces elaboramos un listado que aparecía a modo de drop down.

Después de esto generamos 2 niveles de lectura. El primero desde lo iconográfico,

que a través de un primer vistazo la gente pudiera saber cuántas propiedades,

cuántos bienes (autos, motos, casas) tenía el funcionario y, el segundo nivel,

mostraba esa información con mayor complejidad. El trabajo también fue dividido y

en él mostrábamos dos declaraciones juradas de cada funcionario; la que hizo cuando

ingresó a trabajar en el Gabinete Nacional y la del año actual. Por ejemplo, con la

declaración de la presidenta Cristina Fernández de Kirchner tuvimos un desafío muy

grande, pues presentaba mucho crecimiento patrimonial a causa del fallecimiento de

su marido, Néstor Kirchner. Por ende, muchas propiedades eran herencia y eso

también debíamos mostrarlo gráficamente. Lo que además hicimos en el caso de ella

fue generar una nota aparte contando cómo fue el crecimiento del patrimonio, pues

estaba en parte vinculado a la herencia de los bienes de su marido.

Ahora bien, nosotros también programamos y, a diferencia de The Guardian,

solo tenemos un programador. Así que todo el proceso fue en este sentido un desafío

muy grande. Trabajamos con gente de minería de datos, una profesión desconocida

para mí hasta hace un año y medio o dos, programamos con Ruby on Rails para

integrar la base de datos y en la parte de diseño trabajamos con HTML5, CSS3 y

JavaScript. Estas son la clase de cosas que considero un periodista debería conocer,

claro, no demasiado, pero sí tener una base.

Ahora, como les contaba más atrás, en este proyecto trabajamos de la mano

un periodista, que se incorporó sobre el final del proyecto y quien interpretó algunos

datos mientras se construía la visualización y generó algunas notas; tres personas de

diseño, que diseñaron la interfase; una persona de data mining y una persona de

programación. Más adelante se integraron algunos periodistas y colaboradores que

ayudaron a hacer el data entry de las declaraciones juradas y los pedidos de

información.

Tardamos cuatro meses en llevar a cabo el proyecto, porque nuestro equipo

trabajaba para datos y para la actualización de noticias. Un ejemplo, cuando tuvimos

la suerte de tener al primer papá argentino tuvimos que dejar de lado todo lo que

estábamos haciendo y pasar a todo el equipo de diseño y programación a generar

piezas relacionadas con Francisco. Claro está que ese suceso no fue paralelo al de las

declaraciones juradas, pero quiero ejemplificar de algún modo la dinámica que

tuvimos al realizar el proyecto.

Juegos Olímpicos de Londres 2012

Ahora quisiera hablarles de otros ejemplos de visualización de datos. A nosotros nos

pasó algo parecido a lo que le pasó a The Guardian y es que se nos vinieron encima

8

los Juegos Olímpicos y debíamos hacer algo. Entonces, generamos un micrositio13

con distintos elementos y conectado a redes sociales como Twitter y Facebook.

Paralelamente, conseguimos, por las buenas relaciones que tenemos con la gente de

The Guardian, una base de datos con atletas y la cantidad de medallas que habían

ganado. En ese momento nuestro desafío en la visualización fue que teníamos una

base de datos de 29,217 registros que fueron traducidos y que en el momento de

chequear nos generaron errores; aparecía que Argentina tenía alrededor de 100

medallas de oro, lo que es mentira. Pues bien, los datos estaban diciendo que los

deportes colectivos generaban medallas individuales, es decir, Argentina tenía 22

medallas de oro por los 22 futbolistas que ganaron años atrás y lo mismo sucedía con

el equipo de basketball y el de hockey, así que generábamos mucha medallas por

deportes colectivos, cuando en realidad teníamos una medalla. Una vez subsanado

eso pudimos arreglar la base, les avisamos a los amigos de The Guardian y quedamos

todos contentos.

Es pertinente aclarar que esa falla la descubrimos cuando el equipo de

deportes vio la visualización, ellos nos alertaron de que algo andaba mal, pues para

ellos era imposible que el deporte argentino tuviera esa esta cantidad de medallas.

Ahí pudimos entender el problema y pudimos solucionarlo. Más adelante, generamos

las visualizaciones pertinentes14.

Otro inconveniente que tuvimos fue en la visualización de la cantidad de

medallas en hombres y mujeres15. Cuando el equipo deportivo vio el pico que había

en hombres en los Juegos Olímpicos de Amberes descubrió que había un error.

Empezamos a investigar y lo que pasó en esos Juegos Olímpicos fue que se

incorporaron también muchos deportes colectivos; entonces, hubo un pico muy

grande en la cantidad de medallas.

Los viajes de Boudou y el Proyecto Censo 2001-2010

Quiero hablarles de algo que está sucediendo en Argentina, tenemos un

vicepresidente que, en general, es noticia. Lo que nos pasó en este caso fue que

encontramos mediante ordenes de pago de viáticos en el Senado de la Nación que

había solapamiento de viajes del vicepresidente. Allí el desafío era cómo mostrar esos

viajes. Nosotros hicimos un relevamiento de más de 30,000 documentos entre

decretos y resoluciones, y cuando visualizamos la información encontrábamos que

era claro el solapamiento, pero que esa visualización no era del todo adecuada para la

edición impresa, pues teníamos los documentos realizados por la gente de sistemas

en tamaño gigante, pero no sabíamos cómo mostrarlos, así que se nos ocurrió

agrupar los datos mensualmente.16

13 Juegos Olímpicos. Londres 2012 14 Estadísticas olímpicas a lo largo de la historia. 15 Cantidad total de medallas en hombres y en mujeres 16 Los viajes de Boudou: expedientes incompletos y "sin rastro" en el Senado y Boudou, sobre sus viajes: "Si se compara con la gestión de Cobos, surgen cosas interesantes"

9

Finalmente, lo que les quiero mostrar es el Proyecto Censo 2001-201017. El

objetivo era visualizar los datos en crudo y las variaciones porcentuales entre el año

2001 y el año 2010 por departamento en el país. Lo bueno era que teníamos mucho

research hecho por varias versiones de censo que hubo en Estados Unidos y muchas

críticas, sobre todo de Alberto Cairo, a cómo estaban generadas las visualizaciones.

Entonces, tuvimos el tiempo para analizar todos esos datos y pensar en la

visualización. En el sitio uno puede elegir por tres grandes grupos que son:

población, hogares y vivienda. Y dentro de cada ítem el usuario puede ir filtrando

mayor cantidad de información. Además, si se pasa el mouse sobre el mapa del

departamento se puede ver la variación porcentual entre 2001 y 2010 de cada

departamento.

Les muestro esto porque es el primer mapeo de censo en Latinoamérica y

porque en este proyecto no participó ningún periodista y a mí eso me parece muy

curioso. En el equipo trabajaron dos programadores, un líder de proyecto y un

diseñador, pero no hubo ningún periodista. Y cuál es el desafío que yo creo que

tienen los periodistas al trabajar con las visualizaciones: encontrar historias. El

equipo de datos, el equipo de diseño y el equipo de programación pueden hacer un

trabajo excelente y pueden mostrar visualizaciones súper complejas o súper claras,

pero para mí el desafío del periodista con las visualizaciones de datos es encontrar la

historia colateral que los datos dan, creo que ahí está el gran desafío que por lo

menos yo encuentro en el diario cada día.

MIRIAM FORERO

ZoomOnline, construir y manejar una base de datos

ZoomOnline18 es una base de datos que está pensada para ser desarrollada por

periodistas, que es el equipo que trabaja en ella en Consejo de Redacción, y para los

periodistas, que son los asociados de esta misma organización. La primera pregunta a

este respecto sería por qué hacer una base de datos y, de hecho, fue lo que nos

preguntamos al momento de desarrollarla. En ese entonces empezamos a ver por qué

realizarla y por qué sería necesaria. Primero, porque gran parte de la información

pública en Colombia y en otros países está dispersa, por ejemplo, para el proyecto

que realizamos sobre regalías y ola invernal fue necesario acudir a muchas entidades

y solicitar, a través de derechos de petición, información publica para el proyecto,

para poder concatenar las cifras que tenía una entidad con las que tenía otra.

Por otra parte, la información pública es lejana, es decir, hay mucha

información que está centrada en Bogotá, en las oficinas de las entidades a nivel

nacional que se encuentran en la capital. Entonces, si un periodista de otra ciudad

quiere saber cuál es la lista de financiadores de la campaña de su alcalde, tiene que

recurrir al Consejo Nacional Electoral que está en Bogotá y que tiene la información,

principalmente, en formularios diligenciados a mano y en fotocopias en sus archivos.

17 Proyecto Censo 2001-2010 18 ZoomOnline

10

Esto no es verdadero acceso a la información para un periodista que vive en una

ciudad lejana a Bogotá.

De otro lado, gran parte de la información es ilegible. A este respecto,

recuerdo el primer tipo de información con el que arrancamos la base de datos, hablo

de las declaraciones de intereses particulares de los congresistas. Este Registro de

Intereses Particulares es un documento que deben llenar los senadores o

representantes a la Cámara al momento de su posesión, en él declaran cualquier tipo

de interés que puedan tener por sus negocios, por su familia, etc. Ahora bien, la ley es

muy general en esto, pues no especifica que quienes lo diligencien deberían decir qué

intereses puedan tener sus conyugues o aquellos con quienes hayan trabajado, si se

han vinculado anteriormente con el sector privado, entre otras cosas, lo que hace que

los registros sean de menos de dos renglones y digan, en su mayoría: “no tengo

ningún interés”, con letra y números de cédula ilegibles. Así pues el primer trabajo

que hicimos para lanzar la base de datos fue tratar de interpretar eso, identificar al

menos los nombres y las cedulas para saber quién era el que había llenado el

documento y asignárselo al congresista correspondiente.

La otra razón para hacer una base de datos, y que responde al otro servicio

que prestamos con ZoomOnline, es que muchos periodistas desconocen la gran

cantidad de información que pueden obtener en línea, hay mucha información incluso

en páginas web colombianas sobre antecedentes de todo tipo. Por ejemplo,

información sobre profesiones (abogados, arquitectos, médicos, ingenieros), sobre las

afiliaciones al Sistema de Seguridad Social de una persona, sobre las multas que

pueda tener, sobre su licencia de tránsito, si tiene propiedades en el extranjero, etc.

Entonces, hay mucha información que se puede encontrar en línea y que, a veces, por

desconocimiento no es aprovechada. En este punto me parece pertinente comentar

que, además de tener esta información recolectada en la base de datos, en Consejo de

Redacción hacemos capacitaciones para que los periodistas puedan conocer estas

herramientas.

Con las reflexiones anteriores comenzó ZoomOnline en el 2009, fue lanzada

oficialmente en el Encuentro de Periodismo de Investigación de 2010, pero todo el

trabajo empezó el año anterior y, actualmente, tenemos más de 2.000.000 de datos en

la base de datos. Estos datos están clasificados por aéreas y de esa mezcla de

diferentes temas obtenemos cosas muy útiles. Por ejemplo, tenemos la información

de financiadores electorales y candidatos, pero, como mencioné anteriormente, este

es un tema difícil de manejar y es por eso que debemos ir por partes. Actualmente,

tenemos dos de campañas presidenciales, más o menos seis de alcaldías y varias más

de campañas del congreso y candidatos, de modo que tenemos largos listados de

candidatos a las elecciones territoriales y presidenciales. En cuanto al Congreso

tenemos información de las UTL, del equipo de trabajo legislativo de cada

congresista y de sus intereses particulares. Tenemos, además, información sobre

funcionarios de la rama judicial, los de las altas cortes, es decir, allí están registrados

todos aquellos que se han visto involucrados con el que llamamos el Carrusel de las

Pensiones en la rama judicial. A su vez, contamos con información de funcionarios,

diplomáticos, contralores municipales y departamentales, etc. Del mismo modo, hay

información de antecedentes, actualmente, tenemos a todas las personas que han sido

11

extraditadas en el país hasta diciembre del 2012 y también personas que tienen

antecedentes fiscales, es decir, que son o han sido sancionadas por la Contraloría. En

una sección que es reciente agregamos datos sobre municipios y departamentos, por

ejemplo, tenemos giros y proyectos sobre regalías, es decir, todo el dinero que ha

recibido cada municipio y cada departamento, además contamos con las cifras de la

ola invernal, esto es, sus damnificados, la ayuda que recibieron los proyectos de cada

departamento, etc. Finalmente, contamos con algunos listados de profesiones porque

son los que más fácilmente tienen procesos de contratación pública.

Ahora bien, y luego de conocer todo lo que tenemos, la pregunta es, ¿qué

podemos hacer con todo eso? Pues bien, tenemos varias opciones. La primera de ella

es hacer los cruces de información, esto funciona de la siguiente manera: un

periodista asociado a Consejo de Redacción solicita en su investigación un volumen

de datos relacionados con los temas que está manejando y nos da esa información, lo

que hacemos es cruzar la base de datos del asociado con los más de dos millones de

registros que tiene ZoomOnline y ahí es donde empiezan a aparecer las

coincidencias.

Un ejemplo es el de la revista Semana19, en esa investigación trabajaron los

asociados Carlos Eduardo Huertas y Catalina Lobo Guerrero, y la información que

nos enviaron fue un listado de personas en el país a los que el Estado les había

asignado terrenos baldíos. Se supone que estos terrenos deben ser entregados a

campesinos de bajos recursos cuyo único medio de subsistencia es la tierra en la que

viven hace años y de la que trabajan; sin embargo, al hacer el cruce con ZoomOnline

apareció que muchas personas de la lista eran profesionales tales como: abogados,

arquitectos e ingenieros. Ahí se generó la primera duda, pues se suponía que debían

ser campesinos que vivían de explotar la tierra. También, se encontraron muchas

personas que tenían actividad política, esto es, que habían sido candidatos a varias

elecciones presidenciales.

Otra utilidad de la base de datos es que parte de la información que contiene

tiene un dato geográfico; me dice, por ejemplo, dónde se graduó una persona, dónde

fue jurado de votación en las elecciones, dónde fue candidato, etc. Siguiendo con el

caso anterior, al cruzar las informaciones no coincidían con el lugar en el que le

habían entregado los terrenos baldíos a estas personas, de hecho, estaban lejanos.

Ese cruce demostró en gran parte las inconsistencias y las irregularidades que estaba

investigando y denunciando Semana en ese momento. Y el proceso en general es un

ejemplo de aquello que hablaba Brant Houston al afirmar que una base de datos

ayuda a poner contextos y a corroborar una investigación que, además, se fortalece

con reportería y con muchísimos más métodos.

A ese caso de cruce de gran cantidad de información se le suma una

publicación del diario El País de Cali en la que también trabajaron asociados de

Consejo de Redacción. En ese caso lo que investigaron fue lo que estaba pasando con

el dinero que el Ministerio de Educación le entregaba a Buenaventura, el principal

puerto del país, para que los estudiantes que no tenían o no alcanzaban a tener un

cupo en el sector público pudieran ser inscritos en un colegio privado20. Lo que

19 Fraude agrario histórico: ¡Qué tierrero! 20 Así fue el robo que amigos del exsenador Martínez hicieron a alumnos en Buenaventura

12

encontró el periódico fueron una gran cantidad de inconsistencias, pues se estaban

desviando enormes cantidades de ese dinero que enviaba el Ministerio de Educación.

Allí nuestra labor fue realizar el cruce de la información de los representantes legales

de esos colegios particulares que estaban obteniendo el dinero con la base de datos y

apareció que muchos, siendo representantes legales de colegios privados, estaban

inscritos en el Sisben, que es el sistema de salud subsidiada en Colombia. Además de

ello, también se encontró que uno de estos sujetos era representante legal y dueño de

una fundación, que tenía una actividad política importante y que en Antioquia tenía

un historial de irregularidades en contratación pública.

Entre otras de las utilidades de la base de datos está la de descubrir

coincidencias y relaciones entre una persona y otra, pero de manera individual y no

con grandes cantidades de información. A esto se le suma que a través de la base de

datos se puede obtener información para construir un perfil de una persona o de una

empresa. Del mismo modo, la base de datos le permite a los usuarios seguir el dinero

de municipios y departamentos, por ejemplo, en cuanto al tema de regalías y ola

invernal la base de datos en el Valle del Cauca arroja datos de suspensión de los giros

por regalías en 2008, porque el departamento no reportó información. Además da los

proyectos y los giros de regalías que ha recibido dicho departamento. Asimismo, en

cuanto a la ola invernal da información sobre los damnificados, las cédulas que

salieron no válidas de fallecidos en el registro de damnificados, las cifras de la ayuda

humanitaria de los proyectos que se empezaron a desarrollar allá, el dinero que

recibió el departamento, etc. Es, sin duda, bastante información de contexto para

poder investigar, tanto la ola invernal como las regalías.

Finalmente, una herramienta que tiene la base de datos es una especie de

repositorio de bases de datos externas, es decir, enlazamos también a otras bases de

datos que consideramos son útiles para los periodistas. Actualmente, tenemos un

total de 140 bases de datos registradas en esta sección, son enlaces a páginas en

Colombia o en otros países del mundo en las que uno puede averiguar si una persona

tiene propiedades o empresas en el exterior o antecedentes fiscales disciplinarios aquí

en Colombia.

Después de todo esto se preguntarán, cómo superar los obstáculos. Pues bien,

si parte de la información está escrita a mano y en fotocopias, como las de

financiación electoral, lo que se debe hacer es una digitación muy cuidadosa; en

nuestro caso contratamos digitación que se revisaba, es decir, una persona digitaba y

otra revisaba lo digitado para evitar errores. Además, tomamos la decisión de no

digitar el valor de la donación de cada aportarte porque era una información tan

delicada que con un cero de más o un cero de menos le cambiábamos totalmente las

dimensiones a la información. Lo que hicimos para suplir esto fue ingresar listados

de aportantes que, a través de una profundización de los reportes de financiación, le

permitían al periodista saber cuánto podía aportar cada persona.

Otro inconveniente muy común es que las entidades públicas entregan miles

de datos impresos o en PDF, cuando lo que el periodista necesita es un Excel. ¿Qué

solución hay ahí? Existen unos programas y hay bastantes software que convierten

PDF a Word y PDF a Excel. Hay también un sistema que se ha vuelto muy común,

y que incluso muchos escáner tienen, hablo del reconocimiento de caracteres, es

13

decir, reconoce el texto que hay en un impreso y al escanearlo lo convierte en texto.

A este respecto, les recomiendo un programa que tuvimos en Consejo de Redacción y

que nos ayudó a convertir los PDF a Word o a Excel, se llama wondershare pdf

converter.

Otra de las dificultades que pueden encontrar en el camino son los posibles

errores en la información. Ya lo decía Brant Houston al afirmar que todas las bases

de datos tienen errores o información basura. Nuestra solución ha sido realizarle una

revisión exhaustiva a cada tabla de datos que nos entregan, para evitar publicar

errores. Otra solución ha sido citar directamente de la fuente, esto es, que en la base

de datos se puede saber de donde vino cada información, para poder ir a esa entidad o

a esa fuente y corroborar cualquier dato que el periodista necesite.

Finalmente, es posible que se encuentren con los obstáculos de acceso a la

información, que como periodistas debemos conocer a profundidad. Lo que hemos

hecho a este respecto es conocer la normatividad del país, es importante que desde

nuestra profesión sepamos cuál es la legislación sobre acceso a la información; qué se

puede mantener en secreto y qué no, y dar la pelea. Por ejemplo, cuando les

solicitamos información a las entidades que manejan los listados de ingenieros,

abogados, médicos o contadores su respuesta inmediata fue que la información era

privada y que no nos iban a dar las listas de los profesionales registrados; sin

embargo, ellos mismos no tenían conciencia de que son una entidad de carácter

publico y que, por ende, debían entregar la información. Dimos la pelea y el Tribunal

Administrativo de Cundinamarca falló a nuestro favor.

PREGUNTAS DEL PÚBLICO

DANIEL SUÁREZ PÉREZ

¿Cómo puede un medio monetizar este tema de las visualizaciones? ¿Se puede

generar impacto a través de ellas? ¿En qué se ve reflejado?

JUAN DIEGO LÓPEZ

Yo creo que es al revés, la monetización en la experiencia de La Nación va por el

impacto que produce la visualización y no al revés. De todos modos, para darles el

ejemplo de lo que acabo de decir y el antiejemplo retomo el trabajo de Declaraciones

Juradas que lógicamente no se podía monetizar, pero tuvo más de medio millón de

visitas desde que se publicó hasta la fecha, y esto es algo bastante interesante para

los anunciantes. Ahora, algunas de las visualización que armamos para los Juegos

Olímpicos fueron pedidos de los anunciantes, por lo cual nosotros tuvimos que

trabajar en la generación de una pieza en la que quería aparecer el anunciante. Así

que creo que por el contenido o por el anunciante se puede monetizar el trabajo.

MARIANA SANTOS

En mi caso hay muchos ejemplos que pueden considerarse extraños. Uno de los

proyectos con más visitas ha sido un interactivo de regalos de navidad, en este el

usuario podía elegir para quién era el regalo, seleccionar el presupuesto que tenía y el

14

tipo de regalo que deseaba obsequiar. Otro caso es el de un artículo sobre la

comparación de armas en Siria, este artículo había tenido muchas lecturas, pero

cuando publicamos el gráfico de la comparación visual aumentó el número de vistas

en menos de una hora. Nosotros creemos que poner la información de manera visual

es muy atractivo y cuando se tienen medios y se pueden hacer cosas en redes sociales

es mucho más fácil que tenga éxito un video corto que un interactivo que dure un

montón de tiempo.

DANIEL SUÁREZ PÉREZ

Qué nos pueden decir sobre el conflicto que existe en ocasiones con el editor o con

los jefes para poder publicar. ¿La salida es independizarse o seguir adelante con esa

lucha?

MARIANA SANTOS

Mi jefe siempre ha dicho que los diseñadores y los desarrolladores tenemos que hacer

nuestra propia agencia. Pero yo pienso que no, que necesitamos a los periodistas,

porque ellos son los expertos en investigación, en recoger su material y en tener una

historia preparada, mientras que los desarrolladores y diseñadores son expertos en

hacer que esa historia se vea bonita y que les guste a las personas.

JUAN DIEGO LÓPEZ

Mi opinión es similar a la de Mariana, hay que perseverar y hay que mostrar los

trabajos. Quizás al principio sea una publicación chiquita, pero a lo largo del tiempo,

me parece, la gente se va convenciendo de que este tipo de narraciones terminan

sirviendo. Yo empecé trabajando entre el 2001 y el 2002 con videos de 320 x 2.40,

algo muy pequeño, y hoy tenemos videos en HD, no solo en La Nación sino en

muchos otros medios. Me parece que lo que hay que pensar, más allá del crédito

propio, es que nosotros trabajamos para los lectores y los que se llevan la ganancia

son ellos.

MIRIAM FORERO ARIZA

En Consejo de Redacción tenemos un área de trabajo llamada Emprendimiento, que

es precisamente para los periodistas que tienen estas inquietudes. Retomando un

poco lo que decía Mariana, si se van a ir del medio tradicional, háganlo con el

ingeniero y el desarrollador. Así se van a lograr proyectos mucho más interesantes

DANIEL SUÁREZ PÉREZ

Hay un proceso interesante en los medios de ustedes y en esa verificación de datos

que hacen con sus visualizaciones, no solo se trata de que el diseño quede bonito, eso

pasa por varios ojos. ¿Cómo es ese proceso de verificación de los trabajos?

JUAN DIEGO LÓPEZ

15

En La Nación nosotros lo dividimos en varias etapas, como si fuera un doble

comando: verificamos quienes hacemos la visualización, verifican los periodistas y

verifican quienes hacen la minería de datos. Esto también depende de qué tan largo o

no sea el trabajo, pero aún así a veces encontramos errores. En todo caso, me parece

que es la parte más importante, porque de lo contrario estarías informando mal y no

importa qué tan linda sea tu visualización, si tienes un dato incorrecto lo echas a

perder todo.

MARIANA SANTOS

En The Guardian tenemos un equipo de migración de datos que está compuesto por

un periodista principal y dos asistentes que tienen conocimientos súper fuertes de

matemática, y cuando un trabajo está listo para ser visualizado es revisado por otros

periodistas.

MIRIAM FORERO ARIZA

En mi trabajo para ZoomOnline antes de subir cualquier información a la base de

datos hacemos muchos procesos de verificación. Un método que funciona, además de

mostrarles los resultados a otras personas con una visión más limpia, es hacerse

preguntas y aprender a identificar los errores típicos que tienen las bases de datos.

Por ejemplo, una base de datos no debería tener cédulas repetidas, ahí ya puede haber

un error y es cuando entramos a verificar. Creo que es necesario ser un poquito

creativos, pensar qué tipo de error puede haber y verificar si lo hay o no.