De olho nos dados #1: OSINT e busca avançada no Google
Tenho me interessado cada vez mais em cavar redes sociais e sites com informações públicas, com o objetivo de garimpar peças de quebra-cabeças que me ajudem a contar boas histórias. Normalmente, é um trabalho solitário e repetitivo. A recompensa é que vira e mexe me deparo com dados que são verdadeiras minas de ouro para um jornalista.
Para esse tipo de investigação digital, deram o nome pomposo de open source intelligence, ou inteligência de fontes abertas. Para os íntimos, virou OSINT.
Essa metodologia de apuração, é claro, não substitui as boas práticas do jornalismo tradicional. Afinal de contas, gastar a sola do sapato continua sendo a alma da reportagem clássica. De qualquer forma, técnicas de OSINT podem ser um bom caminho para encontrar personagens, checar informações, levantar dados e dar furos.
Há alguns anos, tenho acompanhado o trabalho de gente que está fazendo investigações digitais de um jeito primoroso e inspirador. Em 2018, uma equipe da BBC usou Google e Facebook para identificar soldados camaroneses que promoveram uma chacina. O passo a passo da apuração, você lê aqui em português.
O New York Times também tem um timaço focado em OSINT, o Visual Investigation. Neste vídeo em inglês, os jornalistas explicam a rotina de trabalho. Em maio deste ano, inclusive, eles ganharam um Pulitzer por uma série de reportagens sobre o governo de Vladimir Putin. Uma das matérias comprova como a Rússia bombardeou hospitais sírios. Outra reportagem de impacto, publicada em junho, foi sobre a morte de George Floyd. A precisão que o NYT teve para reconstituir o assassinato em Minneapolis é impressionante.
O documentário "Digital Detectives", exibido pela emissora pública japonesa NHK, mostra como jornalistas têm utilizado técnicas de OSINT pelo mundo. Um dos personagens é Eliot Higgins, fundador do site Bellingcat e referência em investigações digitais. Se assim como eu, você também não fala japonês, relaxa. O vídeo é em inglês.
Quer saber mais sobre OSINT? Segue esta lista no Twitter que montei com gente que manja muito do assunto. É uma comunidade super aberta, com o perdão do trocadilho, que sempre dá dicas preciosas.
São Google
De tempos em tempos, pretendo contar aqui alguns bastidores de reportagens. A ideia é mostrar um passo a passo de determinadas apurações. Para abrir os trabalhos, vou falar sobre uma ferramenta que todo mundo conhece, mas que nem sempre é valorizada pelos seus milagres: o padroeiro do jornalismo digital, São Google. Amém!
O editor do Intercept Rafael Moro me pautou para uma apuração encabeçada pelos repórteres Fábio Bispo e Hyury Potter. Eles já haviam publicado uma série de reportagens que revelara a compra de 200 respiradores fantasmas pelo governo de Santa Catarina.
A pauta: puxar a capivara do médico e empresário Fábio Guasti, um dos articuladores do escândalo dos respiradores, e descobrir se suas empresas estavam envolvidas em outros casos de corrupção. Uma delas se chama Remocenter. Por onde começar? Claro, pelo Google!
Eu não teria tempo suficiente para conferir cada uma das páginas indexadas pelo Google. Afinal de contas, são mais de 10 mil resultados para essa pesquisa. Então, é aí que os operadores de busca avançada da plataforma fazem a magia acontecer. Com a palavra Remocenter acompanhada do operador site:gov.br, o Google vai mostrar todas as páginas governamentais (gov.br) que tenham o termo Remocenter. Repare que o número de resultados diminui para pouco mais de 3 mil.
Ainda assim, é muita coisa. Como refinar a busca para contratos que a Remocenter tem somente em um determinado estado? Para pesquisar em São Paulo, usei site:sp.gov.br. Dessa maneira o Google mostra 410 resultados. E já dá para perceber que a empresa tem (ou tinha) algum vínculo com a prefeitura da capital paulista.
Como São Paulo tem um Tribunal de Contas do Município, responsável por fiscalizar as contas da cidade, pesquisei pela empresa em páginas do órgão (remocenter site:tcm.sp.gov.br).
Agora, são apenas 21 resultados. E o primeiro link que aparece no topo da página do Google já traz detalhes importantes para a apuração. Também é interessante incluir outros operadores numa mesma busca. Por exemplo, as aspas e o AND (em caixa alta mesmo). Com eles, pesquisamos por dois termos exatos que aparecem numa mesma página.
A pesquisa "remocenter" AND "auditoria" site:prefeitura.sp.gov.br trouxe apenas dois resultados. O primeiro deles é um relatório da Controladoria Geral do Município que apresenta uma série de indícios de corrupção envolvendo a Remocenter. O órgão constatou, por exemplo, que a empresa cobrava preços bem acima da média das concorrentes.
Ficou curiosa(o) para ler a matéria publicada no Intercept? Segue o link.
Pra finalizar, a Escola de Dados tem um tutorial muito bom sobre operadores de busca avançada. Tem dicas de como encontrar um formato de arquivo específico, como pdf. Também explica de que maneira é possível pesquisar a partir de uma palavra-chave do título de um texto. Vale a pena conferir. E para resultados mais precisos, não se esqueça: combine diferentes operadores numa mesma pesquisa.
Ainda não sei qual será a periodicidade desta newsletter. (Sorry!) Então, se inscreve para não perder nenhuma edição.
Se você quiser compartilhar dicas de ferramentas ou me contar bastidores do seu trabalho, por favor, me dá um toque. Vai ser um prazer trocar ideia. Assim, a gente espalha a palavra pra mais gente. Quer ajuda numa apuração? Também pode contar comigo.
Hoje, fico por aqui. Mas estou sempre de olho nos dados!
Um abraço e até a próxima.