por Pedro Aguiar*

A polêmica começou recentemente e, pelo menos até meados de 2016, continua restrita a alguns círculos especializados: o que é o tal “jornalismo automatizado” e quais as suas implicações para a profissão, o setor, a indústria e o mercado? Textos de notícias gerados automaticamente são jornalismo? É ético trocar a redação feita por mãos e cérebro humanos por algoritmos que identificam lides a partir de tabelas de dados e produzem textos sintaticamente corretos, ainda que talvez sem originalidade nem contexto? O impacto sobre a profissão será significativo? Jornalistas serão demitidos e substituídos por máquinas de redação robotizada?

"Roborter" by basakward (Erin Huminston) - source: http://basakward.deviantart.com/art/Roborter-598041701 (non-commercial, attributive)
“Roborter” by basakward (Erin Huminston) – source: http://basakward.deviantart.com/art/Roborter-598041701 (non-commercial, attributive)

As preocupações podem ser legítimas, mas talvez exageradas e provavelmente ampliam a aplicação que o “jornalismo automatizado” terá na prática. Não parece estar em preparação nenhuma revolução de grande escala para acabar com o trabalho do jornalista de carne e osso e trocá-lo por computadores programados para escrever  e editar. O que há, contudo, é uma inovação tecnológica a ser adotada em uma área bastante específica, que é particularmente interessante para as agências de notícias. Não é à toa que gigantes do segmento, como a Associated Press, a Reuters e a Bloomberg, já vêm investindo e experimentando com a geração robotizada de textos para seus serviços informativos.

Em junho de 2014, por exemplo, a AP começou a usar a automação para produzir textos em cima de balanços de rendimentos de empresas norte-americanas – enormes documentos, às vezes com centenas de páginas. As assessorias de imprensa das corporações enviam esse material para os jornalistas, que precisam extrair dados das tabelas e garimpar lides – os quais, frequentemente, rendem apenas matérias banais.

“Embora importante, isso exigia um tempo considerável da nossa equipe para produzir e tinha vida útil limitada. O feedback dos clientes também destacou uma demanda por aumento no jornalismo financeiro destacado, incluindo mais profundidade e matérias de análise. Em resposta, depois de muita discussão, começamos a experimentar com o software de automação para redigir as matérias básicas”, relatou a diretora de comunicação internacional da AP, Laura Imregi, em artigo publicado em novembro de 2015.

Em agosto, a própria agência chegou a fazer uma videorreportagem sobre o tema, usando a si mesma como exemplo:

Mais de um ano depois, segundo ela, a AP constatou que a automação legou aos redatores mais tempo livre para se concentrarem mais em reportagem especializada e em cultivar fontes por causa do software.

“Ao mesmo tempo, como empresa, conseguimos aumentar significativamente o número de matérias sobre balanços em nosso serviço. Agora produzimos mais de 3.500 desses despachos por trimestre e esperamos que esse número cresça para 4.500 até o final do ano, contra 300 no ano passado”, disse Imregi.

Mas, como lembrou o editor de automação da AP, Justin Myers, em entrevista ao jornal inglês The Guardian, o jornalismo automatizado para as agências não se trata só de gerar volume, mas também produtos específicos para clientes particulares, já que elas distribuem matérias para diversos assinantes. “Se um de nossos clientes for um jornal em uma cidade de pequeno ou médio porte e quiser relatórios sobre uma empresa que gera muitos empregos em sua região, agora temos algo a oferecer”, explica.

Desde então, a agência de Nova York vem apostando continuamente na automação de redação. No início do ano, acrescentou a cobertura de esportes universitários, que antes não dava conta de noticiar. Na semana passada, a AP expandiu os testes para a cobertura de jogos de beisebol da segunda divisão dos EUA.

A Reuters, por outro lado, começou a fazer experiências internamente com software de análise de dados. Em novembro de 2015, lançou um website específico com resultados de três anos de pesquisas de opinião feitas pela agência, e a interpretação das respostas dos participantes foi feita com a ajuda de algoritmos programados para encontrar “desvios de padrão” que rendessem bons lides.

Segundo Benjamin Mullin, em artigo publicado no blog do Instituto Poynter de pesquisas em jornalismo, os algoritmos foram desenvolvidos pelo diretor de tecnologia da Reuters, Kenneth Ellis. “Eles navegam pelo conjunto de dados e destacam desvios relevantes nas informações. Depois, o sistema utiliza um gerador automático de texto para redigir uma descrição desses valores discrepantes e fornece um link que permite aos visitantes examiná-los”.

ict_overdose_by_benheine
ICT Overdose by BenHeine – http://benheine.deviantart.com/art/ICT-Overdose-104457152 (non-commercial use, attributive)

O que o software faz, depois de alimentado com os dados, e de acordo com programação previamente definida, é hierarquizá-los por relevância e organizá-los sob uma sintaxe verbal coerente, cuja apresentação tem formato de texto jornalístico.

Até aquela época, o sistema não era usado pela agência para transformar essas interpretações em texto de notícias. Mas Reg Chua, o editor executivo de dados e inovação da Reuters, já estava otimista. “Com o tempo, a redação será capaz de incorporar algumas das interpretações sinalizadas pelos algoritmos em sua cobertura de dados de pesquisa. O objetivo final é oferecer aos repórteres um atalho que lhes permita contornar a trabalhosa análise dos números e agregar valor de outras maneiras”, disse na ocasião.

Mas, em abril deste ano, o mesmo Chua foi citado na matéria do Guardian confirmando que a Reuters já estava usando automação para redigir despachos. “Em um teste às cegas, o texto das máquinas foi considerado mais legível que o dos humanos”, comemorava o editor.

 

Liberação de esforços

O fato é que a automatização da produção de textos nas agências é concentrada nas matérias baseadas em dados e números, especialmente aqueles que já vêm formatados como tabelas. São, principalmente, notícias escritas a partir de relatórios corporativos, resultados de contas públicas (balanças comerciais, receita tributária, investimentos), fechamentos de bolsas de valores, mercados de futuros e de commodities, cotações de moedas, previsão do tempo e meteorologia, resultados de competições esportivas (especialmente em campeonatos e torneios de longa duração), entre outros semelhantes.

Vê-se logo que as duas áreas do jornalismo mais impactadas pela tecnologia são a economia e o esporte. Normalmente, esses tipos de textos citados já são padronizados, mesmo quando escritos por mãos humanas. Jornalistas que já trabalharam em grandes agências sabem que é função dos serviços noticiosos enviar despachos recorrentes sobre esses tópicos, considerada uma tarefa cansativa e desprezada entre os colegas, por causa da repetição e da falta de criatividade possível de empregar – algo que redatores costumam ter orgulho de pôr em prática.

A vantagem da automatização da redação de despachos para as agências, então, é liberar esforço humano para reportagens e cobertura factual, nas quais há demanda por contextualização e observação profissional, particular, adequada às expectativas dos clientes. A reportagem aprofundada, o artigo de fundo, e a crônica ou feature permanecerão sendo feitos por jornalistas de carne e osso.  Esse trabalho não será substituído por robôs, nem tem como ser. São gêneros jornalísticos que dependem da imprescindível observação humana, da análise subjetiva e da capacidade de articulação de narrativa coerente e adaptada.

“A automação e tecnologia em geral são ferramentas das quais os repórteres precisam para fazer seu trabalho”, afirma o subeditor de economia da AP, Brad Foss, no artigo mencionado. “Não se trata de substituir os jornalistas. Trata-se de tirar o trabalho de processamento de dados para que eles possam se concentrar em matérias mais detalhadas, com pensamento crítico e narrativas”.

A Bloomberg, especializada em economia, já usa a escrita produzida por software em notícias sobre commodities, balanços financeiros e personalizadas para clientes. Em abril, a agência anunciou a criação de uma equipe especializada para pesquisar novas formas de aplicação da automação em seus serviços.

“Estamos tentando construir as ferramentas que ajudarão os repórteres a encontrar as coisas. Não há nenhuma razão para usar máquinas para escrever matérias que só humanos escrevem. Deve-se usar máquinas para fazer aquilo que as máquinas são boas de fazer”, concorda Chua, da Reuters.

 

Nuvem, Big Data e Data Mining

Mullin lembra que o uso de algoritmos para análise de dados e dos softwares de formatação de tabelas e planilhas em texto jornalístico é ainda mais relevante no contexto do “Big Data”, a enxurrada de informações disponíveis na “nuvem” da internet e em redes paralelas, como as VPNs fechadas usadas por agências e seus clientes.

“A enorme quantidade de informações à mão do jornalista moderno é tanto uma bênção quanto uma maldição. Por um lado, há mais dados do que jamais estiveram disponíveis aos repórteres que procuram investigar qualquer coisa. Mas essa avalanche de dados também significa que muitos repórteres estão fazendo fila pro bifê levando um pratinho de sobremesa. Com tanta informação e tão pouco tempo para triturar tudo, jornalistas de dados têm de fazer escolhas difíceis sobre em que tipos de bancos de dados mergulhar e quanto tempo podem se dar ao luxo de gastar analisando-os”, escreveu.

Por isso, a automação vem complementar uma área que as agências de notícias sempre mantiveram e do qual dependem para executar os serviços que oferecem: a gestão de informações. Toda grande agência guarda colossais bancos de dados com notícias sobre fatos de qualquer natureza ocorridos em literalmente todos os países do mundo (são 197, atualmente), aos quais recorre quando precisa elaborar textos de memória e enviar documentações (listagens, tabelas, rankings) que servem para os jornalistas nas redações montarem sub-retrancas, coordenadas, boxes e infográficos. Até agora, este trabalho – conhecido no mundo corporativo como data mining – vem sendo feito por jornalistas nos departamentos de pesquisa ou arquivo, mesmo depois de digitalizados, com o apoio de arquivistas e bibliotecários. A automação tem o potencial de agilizar esse processo e reduzir a redundância em buscas com resultados irrelevantes.

Se vai gerar desemprego para essas profissões correlatas? É cedo para dizer. Pelo menos entre jornalistas, uma ferramenta da BBC prevê que o risco de demissão por automação nas redações é de 8%, segundo a MINDS International. Mas não é inverossímil imaginar que profissionais de gestão de informação saiam das agências e jornais para criar empresas particulares que prestem os mesmos serviços, desenvolvendo ferramentas próprias para rastrear montanhas de dados digitais e identificar o que rende boas pautas para os jornalistas.

source: http://i4j.info/2015/11/how-human-journalists-can-retain-their-jobs-in-the-age-of-robot-journalists-or-automated-journalism/
source: http://i4j.info/2015/11/how-human-journalists-can-retain-their-jobs-in-the-age-of-robot-journalists-or-automated-journalism/

Uma empresa que já existe e atua como fornecedora dessa tecnologia no mercado é a Automated Insights, que desenvolve softwares de razoável “inteligência artificial” (talvez o termo não se aplique bem neste caso) que conseguem “ler” dados de uma tabela, ou mesmo dispersos, e convertê-los em narrativas verbais inteligíveis. A Ai foi fundada em 2007 por Robbie Allen, ex-programador da Cisco Systems, primeiro com o nome de StatSheet, trocando para a marca atual em 2011. Seu principal produto é o Wordsmith, software de geração de textos jornalísticos a partir de dados com os quais é alimentado. Entre seus clientes, está justamente a Associated Press.

 

Infográficos e atualização automática

Mas não é só texto que pode ser robotizado: a tecnologia de automação também trabalha para produzir gráficos, como explica Laura Imregi, da AP. “Podemos produzir um relatório interativo mensal sobre mercado de trabalho nos EUA que antes exigia atualização manual a cada mês. Mas, agora, atualiza-se sozinho, deixando os seres humanos livres para gerar mais narrativa contextualizada”.

A atualização automática funciona ainda para coberturas de longa duração, como conflitos, crises humanitárias, investigações (tipo CPIs) e as já mencionadas eleições. Jornalistas de guerra sempre tiveram de produzir matérias do estilo “Sobe para XXX o número de mortos…”, o que agora pode ser feito de uma maneira menos lúgubre e menos sujeita a erros – claro, a depender da precisão e imparcialidade das fontes, o que o software não resolve.

“Também desenvolvemos o código para garimpar relatórios do governo para obter informações específicas, tais como crimes ligados a profissionais do setor financeiro. No passado, esta atividade podia levar várias centenas de horas para ser montada, sem contar para mantê-la atualizada. Automatizar o processo dá tempo para oferecer diferentes perspectivas de uma pauta e realizar entrevistas relevantes”, explica Imregi.

O mesmo tipo de recurso pode ser aplicado a matérias geradas após partidas esportivas, como a AP já vem fazendo com o beisebol. Nada impede que a tecnologia de automação seja aplicada futuramente a outras modalidades, como o futebol. Munido de informações como número de faltas, de finalizações (chutes a gol) e escanteios, tempo de posse de bola, impedimentos e cartões lançados pela arbitragem, entre outros dados, o software poderá elaborar crônicas de jogo e ainda comparar com estatísticas de cada time ou jogador armazenadas no banco de dados da agência – claro, sem a prosa saborosa de um Nelson Rodrigues ou Armando Nogueira,  mas tampouco o pernosticismo de um Oldemário Touguinhó.

 

Pesquisas e análises já feitas

Entidades que acompanham as tecnologias de ponta das empresas jornalísticas têm produzido estudos sobre a automação da redação, particularmente nos Estados Unidos. Além do Poynter, o o Centro Tow publicou, em janeiro deste ano, um “Guia para o Jornalismo Automatizado” (em inglês) (http://towcenter.org/research/guide-to-automated-journalism/), escrito por Andreas Graefe, um dos principais especialistas no assunto. O Nieman Lab, outra instituição de referência em pesquisas sobre jornalismo, também tratou do assunto em uma longa análise publicada em setembro do ano passado. A própria Associated Press produziu o seu guia para entender o “jornalismo automatizado” (é bom manter essas aspas, enquanto não sabemos se isso é de fato jornalismo ou não).

Aqui no Brasil, um dos primeiros trabalhos feitos sobre o assunto foi um artigo de Tacyana Arce publicado ainda em 2009 na revista Exacta, da UniBH, em Belo Horizonte: “O Lead Automatizado: Uma Possibilidade de Tratamento da Informação para o Jornalismo Impresso Diário“. Há sete anos, a autora resgatou uma proposição teórica feita por Nilson Lage em 1997 para elaborar parâmetros transdisciplinares (em conjugação com conhecimentos da Linguística, da Lógica matemática, da Ciência da Informação e da Psicologia) para a programação de um software capaz de construir lides automatizados.

No início de julho de 2016, a revista bilíngue Brazilian Journalism Research, da SBPJor, publicou um artigo de Márcio Carneiro dos Santos que põe em prática a proposta de Tacyana e descreve um programete escrito em linguagem de programação Python que consegue redigir resultados de jogos do Campeonato Brasileiro de Futebol.

Santos ressalta que o “jornalismo automatizado” trabalha em conjunto com o Jornalismo Digital em Base de Dados (JDBD), mas que não são a mesma coisa. Embora o JDBD também trabalhe com organização e recuperação da informação arquivada em bancos de dados (que podem ser desde pequenas tabelas simples até gigantescas articulações de planilhas com milhares de registros cada uma), ele não prescinde da formatação desses dados em um texto verbal estruturado, muito menos da análise dos dados para identificar o que for mais relevante – por exemplo, para decidir qual aspecto “puxar” para definir o lide. A diferença é que essa etapa de capturar os dados e redigir pode ser feita agora ou por um jornalista com DNA e 46 cromossomos ou por uma máquina composta por chip de silício e circuitos eletrônicos.

 

 

 

*Pedro Aguiar é jornalista, co-editor do blog Agências de Notícias e doutorando em Comunicação pela UERJ.