Um único usuário de Twitter, sem imagem de perfil e com o slogan “200% Bolsonaro” no nome, publicou 1.164 mensagens com a hashtag #Dia07VaiSerGigante em apenas uma semana, média de uma mensagem a cada oito minutos, sem tempo para dormir. Outro perfil, que se intitula como robô patriota, compartilhou uma postagem usando uma hashtag idêntica de 14 em 14 minutos no mesmo período.
Comportamentos assim indicam que a convocação para as manifestações pró-Bolsonaro de terça-feira (7) tem sido artificialmente inflada na rede social, concluiu o Radar Aos Fatos em análise feita a partir de 332.927 tweets e retweets com hashtags dos atos. O material coletado foi classificado segundo metodologia do DFRLab (Digital Forensic Research Lab) que identifica quando um pequeno grupo de usuários tem peso desproporcionalmente grande no debate online, o que indicaria ação coordenada para gerar interações artificiais.
Com base em métricas públicas dos tweets, é calculado o chamado CMT (Coeficiente de Manipulação de Tráfego) de determinada hashtag ou termo. Quanto maior o seu número, maior a suspeita de comportamento artificial. Em seguida, é possível comparar o índice da hashtag em estudo com o de outras com baixa probabilidade de serem manipuladas.
Para a análise, o Radar usou tweets e retweets com as hashtags #Dia07VaiSerGigante, #7deSetembroVaiSerGigante e #Dia7VaiSerGigante e, como parâmetro de comparação, usou as tags #TBT (Throwback Thursday, mencionado quando fotos antigas são publicadas às quintas-feiras), #TheMaskedBrasil (do programa The Masked Singer Brasil) e o termo “sextou”. O gráfico abaixo mostra como a pontuação das hashtags dos atos pró-governo é significativamente maior do que a das outras três, que não são relacionadas a política:
“Há muitas formas de manipular uma conversa no Twitter. Robôs são uma delas, mas isso também pode ser feito com pessoas reais que falam muito sobre um assunto o tempo todo, dando a sensação de que uma discussão é muito relevante”, afirma a pesquisadora do DFRLab Luiza Bandeira. “Nesse caso, a impressão é que muitas pessoas estão aderindo à mobilização para os protestos, que eles serão muito grandes e que [Jair] Bolsonaro tem muito apoio. Mas parece que nem tanta gente assim está usando as hashtags”, completa.
O resultado apresentado pelo Radar não significa que toda a convocação para os atos tem sido reproduzida de maneira artificial — o impulsionamento também foi replicado organicamente na plataforma. Porém, os dados sugerem que parte dela pode ter sido inflada por robôs (perfis automatizados) ou por outros tipos de comportamentos coletivos de usuários, como a publicação em série de posts citando as hashtags.
Depois de ser procurado para comentar o resultado da análise, o Twitter informou que suspendeu mais de 100 perfis “por violações à sua política contra spam e manipulação”. “O Twitter tem trabalhado cada vez mais com melhorias em ferramentas internas e treinamento das equipes para identificar proativamente comportamentos suspeitos, mas esse tipo de denúncia das pessoas sobre potenciais violações às regras continua sendo uma contribuição de extrema importância para nossos esforços. Qualquer pessoa pode denunciar uma potencial violação de nossa política contra spam e manipulação da plataforma”, acrescentou.
Debate manipulado
O cálculo aplicado pelo Radar considera três dados para medir o índice de contaminação de um debate no Twitter por comportamentos que inflam artificialmente a relevância do assunto.
- O número médio de tweets por usuário: quando uma conta é responsável por muitas mensagens, há mais a chance de haver manipulação;
- A relação entre o volume de mensagens originais e o número de retweets: campanhas manipuladas, segundo o DFRLab, costumam ter muitos RTs e um número relativamente baixo de mensagens originais;
- O peso de 1% dos usuários que mais tweetaram no total da conversa online: quando uma porcentagem significativa de uma campanha veio de um número tão baixo de usuários, há mais um indício de comportamento suspeito. Antes, esse critério considerava o peso das 50 contas mais ativas, mas foi revisado.
A tabela abaixo mostra como as hashtags analisadas pontuam em cada um desses critérios:
Poucos usuários e muito barulho
A análise confirma ainda que um pequeno número de perfis foi responsável pelo impulsionamento da convocação para as manifestações. Além de dar uma impressão equivocada de que determinada discussão é maior e mais espontânea do que na realidade, esse comportamento faz com que os algoritmos levem o tópico aos assuntos mais comentados do Twitter, o que também direciona a atenção de mais usuários para o tema.
No caso da #Dia07VaiSerGigante, por exemplo, apenas 1% das contas publicou 20% dos tweets e retweets com a hashtag. Já nos demais marcadores dos atos pró-governo, o mesmo percentual de usuários postou 16% e 17% de todo o conteúdo coletado.
Entre essas contas superativas, estão os perfis citados na abertura da reportagem. Mas há outros exemplos, como usuários que publicaram mensagens contendo as hashtags entre 316 e 746 vezes ao longo do período analisado.
Com uma metodologia diferente, um levantamento do Núcleo Jornalismo chegou a conclusão semelhante ao apontar que apenas 12% dos perfis que tweetaram sobre os atos de 7 de Setembro impulsionaram mais de dois terços dos tweets sobre as manifestações.
O Radar também investigou as 50 contas mais ativas na campanha de cada hashtag convocatória. Sessenta e duas delas (47% do total, uma vez que parte dos usuários se repetiram entre os termos) apresentaram alta probabilidade de automação — ou seja, de serem robôs, segundo o Pegabot, ferramenta do ITS Rio (Instituto de Tecnologia e Sociedade do Rio) que calcula a chance de uma conta ser automatizada segundo critérios como perfil de usuário, distribuição do conteúdo e linguagem empregada nos posts.
Metodologia
O Radar coletou, via API pública do Twitter, tweets e retweets que mencionam três hashtags relacionadas ao atos pró-governo (#Dia7VaiSerGigante, #Dia07VaiSerGigante e #7deSetembroVaiSerGigante) e três hashtags ou termos com baixa probabilidade de manipulação (#TBT, #TheMaskedBrasil e “sextou”).
Depois aplicou aos dados o CMT (Coeficiente de Manipulação de Tráfego), a metodologia descrita acima que foi desenvolvida por um pesquisador ligado ao The Atlantic Council's DFRLab (Digital Forensic Research Lab) e publicada pelo Computational Propaganda Research Project, da Universidade de Oxford. Em seguida, analisou as 50 contas mais ativas de cada hashtag em defesa das manifestações no Pegabot.