Como desvendar golpes virtuais com dados abertos?

Compartilhe

Nem só de política se faz desinformação. “Fake news”, eleita expressão do ano de 2017 pelo dicionário Collins, associa a mentira (fake) àquilo que está no noticiário (news), prejudicando e polarizando o debate público.

Mas inverdades e enganações podem servir a diversos interesses e, além da desinformação política, um outro tipo de mentira tem recebido especial atenção das investigações do Aos Fatos: os golpes virtuais.

  • Desde o ano passado, já publicamos oito diferentes reportagens e checagens sobre o assunto.

E não é à toa: segundo dados do Anuário Brasileiro de Segurança Pública, o crime de estelionato virtual cresceu 65% entre 2021 e 2022.

Para investigar esse campo da desinformação uma ferramenta especial tem sido muito útil: o Dnslytcs — junção dos termos DNS (Domain Name System), que em português se traduz por “sistema de nome de domínio”, e analytics.

Assine aqui a nova newsletter do Radar Aos Fatos e receba a cada quinze dias técnicas de investigação com dados abertos.

Como o próprio nome já diz, o site analisa e fornece informações sobre domínios de websites em diversas consultas diferentes. Uma delas é a “Who IS” — ou “quem é” —, que fornece os dados de quem fez o registro de um site, como nome, email, número de IP e IDs usados. Os dados de domínios internacionais muitas vezes são ocultados por serviços de proteção de privacidade.

No caso de sites brasileiros, é possível conseguir essas informações pelo Registro.br, que faz o controle de domínios registrados com o identificador “.br”. Os dados não podem ser ocultados, porque ferem as normas da plataforma de registro. No entanto, os dados disponibilizados podem ser apócrifos, o que denota golpe.

Outra opção de consulta no Dnslytics é de busca reversa IP ou por ID (identificador) de Google Analytics ou Adsenses — serviços do Google para controle de tráfego e distribuição de anúncios em sites. Funciona assim:

  • Primeiro, é necessário fazer uma consulta de tipo “Who.is” sobre o domínio desejado;
  • A consulta fornecerá o IP de registro do site, e os números dos IDs de serviços do Google associados a ele;
  • Com esses números copiados, você pode fazer a busca reversa e encontrar outros domínios com mesmo IP ou ID;
  • Na versão gratuita, a ferramenta fornece até 100 resultados. Já a versão paga permite visualizar até 2.500 domínios.

Se mais de um domínio tiver sido registrado com o mesmo número de IP, pode significar que pertencem a uma mesma pessoa, empresa ou apenas compartilham o mesmo serviço de hospedagem.

Essa pista nos levou a descobrir uma rede com mais de 330 sites para venda de rifas ilegais que compartilhavam os mesmos servidores da AWS (Amazon Web Services) — um serviço de computação em nuvem desenvolvido pela Amazon, conforme noticiamos no início do mês.

A mesma análise foi utilizada em junho para identificar sites que vendiam ingressos falsos para o show da artista pop Taylor Swift e que faziam parte de uma mesma rede de sites que vendiam bilhetes fraudulentos para o festival The Town.

A busca reversa por domínios que usam um mesmo ID de Google Analytics, por sua vez, nos fez descobrir quem estava por trás da rede de sites que vendiam o falso emagrecedor natural lipozepina. A investigação jornalística resultou também em investigação policial e prisões pela Polícia Civil de Nazaré Paulista (SP).

Há ainda outras funcionalidades gratuitas da ferramenta, úteis para investigações online de maneira geral, como:

  • busca por domínios com nomes similares;
  • teste de validade de endereços e-mail;
  • extensões para ter acesso automático a informações do domínio em seu navegador de internet.

Não usamos diretamente essas funcionalidades para desmascarar nenhum golpe virtual (ainda), mas convidamos vocês a testar e descobrir por si mesmos.


💡EUREKA. Temos um novo recordista em gastos com anúncios políticos nas plataformas da Meta em 2023. Neste ano, o governo federal superou os gastos da produtora Brasil Paralelo — famosa por ser a maior das anunciantes da categoria —, gastando até R$ 5,2 milhões desde o início do ano. Isso é mais de três vezes mais do que foi gasto no ano passado (R$ 1,4 milhão).

A produtora negacionista segue firme no segundo lugar, com R$ 4,9 milhões gastos desde janeiro. No entanto, considerando todo o período de dados disponível, ela segue invicta na primeira posição com mais de R$ 20 milhões gastos desde 2018.

As informações constam no Relatório da Biblioteca de Anúncios da Meta, fonte de dados abertos para quem quer saber mais de anúncios online.


🧐 BUSCA AVANÇADA. Essa dica é para você que quer fazer uma busca no Google ou no Twitter a partir da combinação entre dois ou mais termos. Com operadores booleanos é possível delimitar alguns resultados da sua pesquisa utilizando OR ou AND entre os termos desejados.

  • OR é usado para alternar entre um ou outro termo.

Por exemplo: Uma busca com “Lula” OR “presidente do Brasil” OR “governo brasileiro” irá retornar resultados que citem qualquer um desses três termos.

  • AND é usado para incluir dois termos necessariamente na mesma pesquisa;

Por exemplo: Uma busca com “lula” AND “animal marinho” irá trazer respostas que incluam as duas palavras juntas.

Isso vai ajudar a delimitar as buscas entre o chefe de Estado brasileiro ou a espécie de molusco. 🦑

Compartilhe

Leia também

Como investigar as 'big techs' sem usar as soluções vendidas por elas

Como investigar as 'big techs' sem usar as soluções vendidas por elas

Como impedir que a Meta use seus dados para alimentar modelos de IA

Como impedir que a Meta use seus dados para alimentar modelos de IA

Formato PDF dificulta a análise de grandes volumes de dados e ainda pode esconder ameaças

Formato PDF dificulta a análise de grandes volumes de dados e ainda pode esconder ameaças