E jornalismo de dados?

Siga os Números | Descomplicando os dados | O que são dados? | E jornalismo de dados?

“O que é jornalismo de dados?” é a típica pergunta que não tem uma resposta, digamos, consensual. De maneira geral, a prática é tida como sinônimo de contar histórias com números, ou encontrar histórias nos números. Eis uma definição rasa demais segundo alguns, para quem jornalismo de dados pressupõe a análise de grandes bases de dados, que devem ser buscados, categorizados, organizados, contados, comparados e cruzados rapidamente. Para outros, só conta como jornalismo de dados se a análise em questão for de dados abertos, disponíveis gratuitamente online, e analisados também com ferramentas gratuitas de código aberto. Uns enxergam o jornalismo de dados como processo. Outros como produto. Há ainda os que vêem as duas coisas simultaneamente. A variedade é tanta que dois pesquisadores americanos decidiram se debruçar sobre o conceito. Depois de estudar 63 menções ao termo encontradas em artigos científicos, sites especializados e entrevistas com profissionais, concluíram que:

Jornalismo de dados é um processo pelo qual análises e apresentações de dados são empregados para melhor informar e engajar o público. Suas raízes estão nos campos da reportagem investigativa e com auxílio de computador, mas os produtos do jornalismo de dados devem acrescentar engajamento através da customização e da contribuição dos usuários, o que é possível a partir de técnicas de desenvolvimento e programação.(1)

Não se trata de algo absolutamente novo, embora possa soar assim. Recorrer aos dados e usar tabelas é tão antigo quanto o jornalismo em si. E isso não é força de expressão: uma forma embrionária de jornal da China antiga – chamada de tipao – disseminava tabelas noticiosas ainda nos séculos II e III.(2) Na Inglaterra, a primeira edição do jornal The Guardian, de maio de 1821, estampava um texto e uma tabela, com uma lista de escolas de Manchester e de Salford, o número de crianças matriculadas e quantas delas recebiam educação gratuita (veja o original aqui). Isso causou frisson, porque, por analogia, escancarava quantas crianças pobres havia nas duas cidades – a tabela indicava que 25 mil crianças estudavam de graça, enquanto as estimativas oficiais eram de 8 mil.(3) Nos Estados Unidos, em setembro de 1849, o jornal The New York Tribune publicou na capa um gráfico de linha pioneiro, com o número de mortes causadas por uma epidemia de cólera que acometera a cidade (veja aqui). Recursos visuais se encontravam, na época, em publicações acadêmicas ou de engenharia, mas eram raros na imprensa antes de 1860.(4)

Era assim em função da tecnologia disponível. Só em fins do século XVIII o engenheiro e economista escocês William Playfair desenvolveu métodos para transformar estatísticas em gráficos – e foi no fim do século XIX que elas se popularizaram nos jornais.(5) Já as formas mais semelhantes ao que hoje se chama de jornalismo de dados são do século XX. Em 1952, uma equipe da rede americana CBS usou dados e desenvolveu modelos para prever o resultado da eleição presidencial – com 5% da apuração, foi possível cravar que Dwight D. Eisenhower venceria (ele ganhou com 82,4% dos votos do colégio eleitoral, enquanto a previsão da CBS era de 83,2%).(6) Em 1967, Philip Meyer, no Detroit Free Press, provou com números que não apenas pessoas com baixo nível educacional, como as autoridades afirmavam, mas também estudantes universitários participavam de protestos em Detroit (poucos anos depois, ele cunharia o termo jornalismo de precisão para se referir ao uso de métodos científicos na prática jornalística).

Nos anos 1970, o jornal Philadelphia Inquirer contratou um jornalista para se dedicar em tempo integral ao estudo dos dados do censo – foi o primeiro a fazer algo do tipo. Nos anos 1980, Bill Dedman, no Atlanta Journal-Constitution, cruzou mapas para revelar comportamento racista na concessão de crédito por grandes bancos (veja os textos aqui). Na década de 1990, Steve Doig, do Miami Herald, mostrou, com dados, que falhas nas políticas de planejamento urbano ampliaram os efeitos do furacão Andrew na Flórida.(7)(8)

No Brasil, algumas iniciativas de reportagem com auxílio de computador passaram a ocorrer a partir dos anos 1990, com o uso, por exemplo, de dados do Sistema Integrado de Administração Financeira do Governo Federal (Siafi) por jornalistas para escrever reportagens. O surgimento de equipes dedicadas ao jornalismo de dados, no entanto, é muito mais recente. Entre os grandes jornais, a prática foi inaugurada apenas em 2012 por O Estado de S. Paulo, com o projeto Estadão Dados.(9)

Se a prática tem tanto tempo, por que só agora está ganhando proeminência? Uma vez mais, por uma questão tecnológica. Particularmente na última década, o volume de produção de dados cresceu exponencialmente, assim como se multiplicaram as ferramentas disponíveis para compilar, analisar e interpretar dados. Em 2005, o universo digital – definido pela consultoria IDC como toda a informação digital que é criada, replicada e consumida em um ano – “media” 132 bilhões de gigabytes. Em 2020, estima-se que o número alcance 44 trilhões de gigabytes. Se todos esses bytes estivessem armazenados em iPads modelo Air, com capacidade de 128 gigabytes, empilhados um sobre o outro, essa pilha mediria o equivalente a mais de seis vezes a distância entre a terra e a lua.(10) “O jornalismo de dados avança – junto com a produção de informações digitais, o movimento de transparência e as leis de acesso à informação – e deixa de ser de nicho para ocupar espaço cativo no conjunto de técnicas essenciais da profissão”, argumenta Natália Mazotte, coordenadora da Escola de Dados no Brasil.(11)

Não fossem essas características dos tempos contemporâneos, reportagens incríveis nunca teriam sido produzidas – e verdadeiros escândalos estariam, até agora, debaixo do tapete. Para ficar nos exemplos mais recentes, veja o caso que ficou conhecido como Panama Papers, em 2016. Um jornal alemão, o Süddeutsche Zeitung, obteve um acervo com 11,5 milhões de arquivos do escritório de advocacia panamenho Mossack Fonseca, que prestou serviços a gente importante do mundo inteiro, abrindo e administrando contas secretas em paraísos fiscais. Havia ouro jornalístico no meio de todos aqueles documentos, mas ele provavelmente ficaria enterrado se não existissem tanto a disposição quanto as ferramentas adequadas para decodificá-los e analisá-los. Organizados pelo Consórcio Internacional de Jornalistas Investigativos (ICIJ), 376 jornalistas de 76 países foram convocados para colaborar (havia profissionais brasileiros de O Estado de S. Paulo, Rede TV! e UOL). O material foi estudado durante um ano antes de serem publicadas as primeiras reportagens. Quase 215 mil pessoas jurídicas foram identificadas nos dados, 1,7 mil com endereços no Brasil (confira aqui o que foi publicado sobre o assunto em O Estado de S. Paulo).(12) Você é capaz de imaginar algo parecido com isso ocorrendo 15 ou 30 anos atrás?

E a cobertura que ficou conhecida como Swissleaks, teria alguma chance de acontecer não fosse a “tempestade perfeita” que hoje favorece o jornalismo de dados? É provável que não. Também sob a coordenação do ICIJ, cerca de 140 repórteres de 45 países (sendo quatro do Brasil) se juntaram para analisar 60 mil documentos vazados que, em conjunto, evidenciavam os ganhos obtidos pelo HSBC prestando serviços a sonegadores e criminosos. O banco, conforme mostravam os dados, tinha conhecimento de que alguns dos seus clientes com contas abertas na Suíça praticavam atividades ilegais – e os recursos nas contas mapeadas pelo Swissleaks superavam a marca dos US$ 100 bilhões.(13)

Essas investigações seguiram o caminho aberto pela cobertura conhecida como Diários de Guerra do Wikileaks. Criado para vazar documentos de fontes anônimas sobre assuntos sensíveis, o Wikileaks de Julian Assange chegou a ser indicado para concorrer ao Prêmio Nobel da Paz após divulgar uma série de dados confidenciais sobre a ação militar dos Estados Unidos no Afeganistão e no Iraque. Jornalistas de veículos como The Guardian, The New York Times e Der Spiegel extraíram informações chocantes de tabelas enormes (uma com mais de 90 mil linhas, outra com quase 400 mil) recheadas de dados brutos – a mais triste delas, 60% das 110 mil mortes registradas nos documentos eram de civis. Meses depois, o mesmo Wikileaks vazaria milhares de telegramas diplomáticos dos Estados Unidos, escancarando a comunicação entre as embaixadas e o Departamento de Estado do país.(14)

Todas essas coberturas sensacionais, que revelaram histórias obscuras e de elevadíssimo interesse público, foram feitas a partir de técnicas de jornalismo de dados. Demonstram como os jornalistas têm tomado “emprestadas” certas características bem próprias da cultura hacker – caso da crença no uso da informática como forma de reduzir ou eliminar o erro humano e da aposta em valores como transparência e compartilhamento, argumenta Marcelo Träsel.(15) É coisa nova para uma profissão marcada pelo individualismo. Mas não é preciso ter o Pulitzer em mente para, então, decidir usar dados nas suas reportagens. Investigações relativamente simples podem render histórias ótimas, mesmo que não desvendem o próximo Watergate. “Há um mito de que jornalismo de dados precisa ser complicado, espetacular ou intensivo em recursos. Mas não é sempre assim”, diz Paul Bradshaw.(16) “Para cada reportagem sobre o Wikileaks ou os gastos dos parlamentares britânicos, há dúzias de usos diários de jornalismo de dados que passam despercebidos”. Pode ser encontrar quem é o artilheiro de um campeonato de futebol, verificar se está havendo um surto de determinada doença em certa região, descobrir que escolas são as melhores ou piores em uma avaliação e até identificar as tendências de moda da estação. “É possível aprender jornalismo de dados em uma hora? Absolutamente. Mas é possível aprender o bastante para você começar e encontrar suas primeiras histórias”, sugere o autor. E é possível aprender o suficiente para saber o que é possível.

Simon Rogers, que ficou conhecido por criar o Datablog do jornal britânico The Guardian (hoje ele é editor de dados no Google), resumiu em dez pontos o que pensa sobre jornalismo de dados. E é o seguinte:(17)

Pode estar na moda, mas não é novo

Existe jornalismo de dados desde que existem dados. A diferença é que agora há planilhas e arquivos formatados para serem lidos por computadores

Dados abertos implicam em jornalismo aberto

As estatísticas foram democratizadas. Já não são reservados a poucos, mas a qualquer um com acesso a softwares de planilhas no computador ou celular

Jornalismo de dados é, às vezes, curadoria

Encontrar os dados certos pode ser uma tarefa jornalística tão demorada quanto achar o entrevistado certo para uma reportagem

Há cada vez mais conjuntos de dados grandes sobre coisas pequenas

Tornar os dados mais acessíveis e fáceis de manusear é uma parte do processo do jornalismo de dados

Jornalismo de dados é 80% transpiração, 10% inspiração e 10% produção

Jornalistas gastam horas formatando e limpando dados antes de eles se transformarem em uma reportagem

Jornalismo de dados não é sempre investigações longas e complicadas

É crescente o recurso a uma forma simplificada de jornalismo de dados, que pressupõe encontrar dados rapidamente, analisá-los e guiar os leitores através deles em uma história, ainda centrada na notícia

Todo mundo pode fazer jornalismo de dados

As ferramentas gratuitas estão aí para isso

A imagem pode ser tudo

Algumas histórias funcionam por causa do design dos dados, feito por humanos que entendem dos assuntos envolvidos

Não é preciso ser um programador

O principal é pensar nos dados como um jornalista, e não um analista – o que há de interessante nos números? o que há de novo?

Tudo (ainda) gira em torno das boas histórias

Jornalismo de dados não é gráficos ou visualizações. É contar uma história da melhor forma possível

Siga adiante:
O jornalismo econômico

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s