El futuro son los datos

El futuro del periodismo se basa en sus orígenes: en la búsqueda de nuevas fuentes, en el relato objetivo de los hechos y en el análisis de los datos.

En un momento en que el periodismo vive una profunda crisis provocada por el auge de las redes sociales, los problemas de financiación y los crecientes ERE en los medios, las I Primeras Jornadas sobre Periodismo de Datos organizadas por el capítulo español de la Open Knowledge Foundation ofrecieron una nueva perspectiva para la profesión, un futuro, paradójicamente, basado en sus orígenes: en la búsqueda de nuevas fuentes, en el relato objetivo de los hechos y en el análisis de los datos.

Las jornadas tuvieron lugar los pasados días 24, 25 y 26 de mayo en Madrid, Sevilla, San Sebastián y Barcelona: en esta última ciudad, el CCCB fue el escenario de la primera fecha, un encuentro que duró doce horas y en el que se presentaron a algunos de los mayores expertos en el periodismo de datos, entre ellos Mar Cabra, coordinadora del evento, junto a la periodista Karma Peiró.

Mar Cabra, periodista de investigación especializada en periodismo de datos y miembro del Consorcio Internacional de Periodistas de Investigación (ICIJ), empezó su charla citando la máxima de The Guardian «Los hechos son sagrados». Y es que en el periodismo de datos no existe la opinión, solamente los hechos y la información objetiva extraída de los datos. Cabra mencionó tres ejemplos de entidades que trabajan con datos, la Sunlight Foundation, MySociety y la Fundación Ciudadana Civio, y mostró varios ejemplos de historias periodísticas elaboradas con datos, entre ellos:

  • Tu tasa de paro: una web que, analizando cifras del INE, muestra cuál es la tasa de paro de cada uno. La idea está inspirada en un proyecto similar realizado en Nueva York.
  • España en llamas: basado en documentos del Ministerio de Agricultura, en este mapa se pueden ver los incendios registrados en España entre 2001 y 2010. Fue un proyecto realizado por Civio con ayuda del crowdfunding.
  • How riot rumours spread on Twitter: un extraordinario ejemplo realizado desde The Guardian que analiza, de forma gráfica, cómo nace y muere un rumor. En este caso, se estudiaron los rumores lanzados desde Twitter durante los altercados de Londres de 2011.
  • Dollars for docs: un proyecto de ProPublica, una organización de periodistas de datos con base en Estados Unidos, que analiza cuánto dinero recibe de cada farmacéutica un médico de cabecera. Una información esencial para saber por qué prescribe determinado medicamento, qué compañía farmacéutica ofrece más dinero, etc.
  • Whoknowswho: una iniciativa del canal británico Channel4 que analiza los vínculos entre personas que ocupan cargos en el poder y permite ver qué relaciones existen entre ellos.
  • Qué hacen los diputados: un proyecto, que sigue buscando financiación a través de crowdfunding, para poder analizar qué hacen los diputados en el Congreso: qué votan, qué propuestas hacen, etc.

Mar Cabra (cuya presentación se puede consultar en este enlace) mencionó la necesidad de colaboración entre periodistas y programadores, una constante que se mantuvo a lo largo de la jornada. Y es que el periodista necesita de alguien que le ayude a contar gráficamente la historia y a analizar los datos, y el programador necesita quien encuentre la historia en medio de los datos. Pero, ¿de dónde se obtienen estos datos? Algunas pistas pueden encontrarse en blogs como The Guardian Datablog, La Nación Data Blog, Information is beautiful, (Re)Structuring Journalism, Between the spreadhseets y Spreadsheet Journalism.

La siguiente intervención corrió a cargo de Eva Belmonte, periodista y autora del blog El BOE nuestro de cada día. Belmonte empezó su charla poniendo sobre la mesa el periodismo actual, basado en las declaraciones, los globos sonda, los tertulianos y las filtraciones interesadas. En su opinión, el periodismo basado en estas supuestas fuentes hace un flaco favor a la información, porque actúa de altavoz de los gobiernos y poderes de turno, mientras que los datos son objetivos y, por lo tanto, no hay opinión en las historias. El primer ejemplo que puso es la web Tu derecho a saber, una plataforma que recoge las peticiones de los ciudadanos a las instituciones públicas. Belmonte explicó que de todas las peticiones recogidas, más de la mitad (el 53%) no han obtenido aún respuesta, lo que viene a evidenciar las carencias y el desinterés en materia de transparencia de las instituciones españolas. Y es que, siguiendo con las instituciones, esta periodista explicó que buena parte de ellas, sobre todo los ayuntamientos, han empezado a ofrecer información pública a través de sus portales (por ejemplo, el del Ayuntamiento de Barcelona), pero que, en muchas ocasiones, esta información no es manipulable. En el caso de Barcelona, de las más de doscientas informaciones, alrededor de ochenta están en pdf, lo que las convierte en una fuente casi inútil.

Aparte de los portales de Open Data de los gobiernos, la principal fuente de información es el BOE, el boletín oficial del Estado, de donde Eva Belmonte extrae mucha información y que también sirvió para crear dos proyectos: El Indultómetro y Dónde van mis impuestos, ambos creados por la Fundación Civio, cuya principal financiación es el crowdfunding, pero que también cuenta con donaciones y que se puso en marcha con la aportación financiera inicial de sus propios fundadores.

Belmonte también aportó algo de autocrítica a su intervención y mencionó la necesidad de que los periodistas citen las fuentes correctamente y, en el caso de que esto sea posible, las pongan a disposición de los lectores: «No se puede pedir transparencia a los gobiernos y luego quedarse la información.»

El ejemplo de la prensa: los datos en The Guardian

John Burdon-Murdoch, miembro del equipo de datos del periódico británico The Guardian, fue el siguiente en intervenir. Geógrafo de formación y con un máster en periodismo, empezó mostrando el famoso gráfico que explica qué hacen con los datos una vez los han obtenido: qué significan, cómo los procesan, cómo los pueden convertir en una historia, cuáles se pueden combinar y de qué manera gráfica los pueden mostrar.

La sección de datos de The Guardian es una de las más potentes de la prensa actual porque fue también de las primeras: Burdon-Murdoch explicó que el periódico tuvo la suerte de que sus propietarios apostaron desde el principio por el periodismo de datos y por ello crearon un equipo multidisciplinar en el que trabajan periodistas, programadores, informáticos y gente con otros perfiles técnicos. Además, en el Reino Unido existe desde hace años un compromiso por parte de la administración de ofrecer los datos de forma casi inmediata y transparente, lo que facilita mucho el trabajo.

John Burdon-Murdoch también ofreció un listado de herramientas (todas gratuitas) que el equipo del diario utiliza para elaborar la información: por ejemplo, ScraperWiki, Tableau y CartoDB (uno de cuyos creadores, el español Sergio Álvarez Leiva, de Vizzuality, mostró su funcionamiento en el taller que se realizó al día siguiente en la URL). En opinión de Burdon-Murdoch, lo más importante, después de la historia, es saber cómo contarla y tener presente a quién se le cuenta: algo tan elemental como elegir los colores de los gráficos puede ser un perjuicio para los daltónicos. Y acabó su charla con un consejo: que los periodistas aprendan las nociones básicas de las hojas de cálculo para saber manipular la información y, sobre todo, para saber qué se le puede pedir y qué no al programador encargado de convertir los datos en un gráfico.

La necesaria colaboración entre disciplinas

Este asunto, el de la colaboración entre periodistas y programadores, salió a colación también en la charla de Manuel Aristarán, periodista del periódico argentino La Nación, quien explicó dos casos realizados en este medio, el de los fallecidos en las inundaciones de La Plata y el proyecto gastopublicobahiense.com. Ambos fueron proyectos que rebatieron la información oficial porque se basaron en datos reales, los mismos que habían usado las autoridades pero que estas habían manipulado para que se ajustaran a su mensaje. Y es que Aristarán afirmó lo que ya antes había dicho John Burdon-Murdoch: que con los datos el periodista es capaz de poner en duda lo que dice el gobierno, o la empresa o la autoridad correspondiente, que es lo que debería hacer un buen periodista.

La siguiente charla estuvo dedicada a uno de los temas de periodismo de datos que han tenido más relevancia en los últimos años: el caso WikiLeaks. John Burdon-Murdoch y Mar Cabra explicaron cómo llegó la información y qué significó para el periodismo que se «abriera la veda» a que otras posibles fuentes ofrecieran datos sensibles. El segundo ejemplo que pusieron fue el llamado Secrecy for sale, un caso que permitió poner en marcha las informaciones que todavía ahora están generando información sobre los paraísos fiscales. Este proyecto empezó como un disco duro de 260 Gb en bruto que el ICIJ recibió de una fuente anónima con conexiones en Singapur y las Islas Vírgenes británicas. De esos gigas se obtuvo información de 130.000 evasores y 122.000 empresas que usaban paraísos fiscales. Teniendo en cuenta que un tercio de la riqueza mundial se esconde en estos paraísos, la información era altamente sensible; sin embargo, en España, el único medio que se interesó por el tema fue El Confidencial, que le dedicó un especial elaborado por la propia Mar Cabra.

El debate se centró entonces en la ética y en la conveniencia o no de publicar determinados datos, pues es evidente que se trata de información confidencial. Tanto Burn-Murdoch como Cabra coincidieron en que todos los datos que se publican han sido revisados por abogados. En España, el problema radica en que la Ley de Transparencia es muy estricta y, por lo tanto, no favorece la publicación de datos, de ahí que muchas de las informaciones sensibles no puedan ser publicadas.

Infografía vs. visualización de datos

La última intervención de la jornada estuvo protagonizada por Sergio Álvarez Leiva, uno de los fundadores de la empresa española Vizzuality, dedicada a la visualización de datos. Leiva empezó su charla explicando la diferencia entre la infografía y la visualización de datos: mientras la primera cuenta historias, la segunda deja estas historias en manos del lector, para que las construya a su medida. La infografía no es interactiva, en cambio, la visualización se elabora con un software para que los números «nos sirvan para contar historias». Y puso varios ejemplos de visualización de datos: Planet Hunters, un proyecto realizado con ayuda de la gente para encontrar nuevos planetas; How far is it to Mars?, que ilustra la distancia que está Marte de la Tierra en píxeles; Kepler’s Tally of Planets, que muestra todos los planetas que se han descubierto parecidos a la Tierra, y Good Morning!, una animación que ilustra de forma espectacular quién y cuándo dice «buenos días» en Twitter. Cuatro casos en los que se han construido historias a partir de cifras y que sirven para ver el potencial de las nuevas herramientas de visualización.

Actividades paralelas

Las I Jornadas de Periodismo de Datos y Open Data también contaron con varias actividades paralelas. En el mismo CCCB, el viernes por la tarde, se presentaron en un Barcamp distintos proyectos que trabajan con datos, algunos de los cuales ya son proyectos cerrados y otros siguen funcionando. Por ejemplo, se presentó el Tuitòmetre de Vilaweb, que recogió los tuits emitidos con relación a las elecciones catalanas del 25N; BCN Citybeats, un curioso experimento que muestra sobre un mapa la actividad en línea de los usuarios que geolocalizan sus tuits, check-ins y fotografías, o atNight, otra aplicación que registra el movimiento de los usuarios en Barcelona durante las horas nocturnas. También se dieron ejemplos de portales de datos abiertos, como Catalunya Dades.

Asimismo, como parte de las jornadas, el fin de semana se realizaron varios talleres dedicados a explicar algunas de las herramientas que se mostraron el día anterior. Fueron talleres, en algunos casos muy técnicos, cuyos asistentes, en la mayoría periodistas de formación, coincidieron en que algo tan sencillo como una hoja de cálculo facilitaría mucho las cosas si se tuvieran conocimientos básicos. Uno de los talleres con más provecho fue el de Michael Bauer, miembro de la Open Knowledge Foundation, quien explicó cómo extraer datos de la web utilizando el scraping y una de las aplicaciones del navegador Chrome, llamada precisamente Scraper Extension. David Martín-Borregón, de Data’n’Press, intentó explicar cómo extraer datos de Twitter para contar una historia, un taller que hubiera resultado más útil de tener conocimientos básicos de programación. En cambio, la demostración de cómo funciona CartoDB, la sorprendente herramienta para mapear creada por Vizzuality, tuvo mucho éxito porque los asistentes pudieron comprobar in situ cómo elaborar su propio mapa personalizable con cualquier tipo de datos.

Simultáneamente a estos talleres, que tuvieron lugar en la Universidad Ramon Llull, se llevó a cabo un Hackaton, es decir, una maratón de proyectos que buscaban financiación o colaboradores. El resultado de estos proyectos se conocerá el próximo 3 de junio.

Las jornadas pudieron seguirse también por Internet con la etiqueta #jpd13. En este storify elaborado por Karma Peiró, una de las coordinadoras de las jornadas, pueden seguirse algunos de los comentarios que se realizaron durante los tres días del evento.

Ver comentarios0

Deja un comentario