🕐 ESTA REPORTAGEM FOI PUBLICADA EM Agosto de 2023. INFORMAÇÕES CONTIDAS NESTE TEXTO PODEM ESTAR DESATUALIZADAS OU TEREM MUDADO.

Como investigar dados de redes sociais sem manual de instruções

Por Ethel Rudnitzki e João Barbosa

28 de agosto de 2023, 10h50

Quando pensamos em investigar algo ou alguém, o primeiro recurso que temos à mão (literalmente) é olhar as redes sociais daquela pessoa ou instituição. E faz sentido.

Além de acessíveis, as plataformas podem fornecer informações importantes de identificação de perfis, como ocupação, endereço, atividade e redes de relações interpessoais. Também por meio delas podemos acompanhar o debate público e ver o posicionamento de pessoas e instituições.


Assine já a nova newsletter do Radar Aos Fatos e receba a cada quinze dias técnicas de investigação com dados abertos.

Porém, se a intenção é analisar uma grande quantidade de publicações ou baixar informações desses espaços, já não é tão simples. E tem se tornado cada vez mais difícil. Isso porque as plataformas estão restringindo o acesso a suas documentações de APIs — sigla em inglês para interface de programação de aplicações —, que nada mais é do que um manual de instruções sobre como interagir com os dados armazenados naquele sistema.

  • O X (ex-Twitter) encerrou o acesso gratuito à API em abril. Era com essa conexão que desenvolvedores conseguiam, por exemplo, criar software para raspar dados de tuítes e perfis. O acesso gratuito passou a ser restrito somente a aplicações para publicar conteúdo, mas não para raspar dados. Para isso, a empresa passou a oferecer uma versão paga a um custo de US$ 100 mensais, na modalidade mais simples;
  • A Meta restringiu acesso programático ao conteúdo publicado em seus produtos desde o escândalo da Cambridge Analytica e tem enfraquecido também sua principal ferramenta de coleta de dados, o CrowdTangle. Como alternativa, a plataforma oferece acesso a bases de dados de temas pré-selecionados como contrapartida pela participação em pesquisas patrocinadas pela empresa;
  • O YouTube encerrou o acesso à parte de sua API que fornecia dados sobre os “conteúdos relacionados” — vídeos ou canais recomendados a um usuário a partir de outro conteúdo assistido;
  • Já o TikTok deu um primeiro aceno na contramão da concorrência, disponibilizando uma documentação de API para pesquisadores na Europa — pioneira em legislações de proteção de dados e transparência — e prometendo que ampliaria o acesso para outras regiões.

De um lado, as plataformas digitais digladiam-se para manter a atenção dos usuários e, consequentemente, o fluxo de dados que nós produzimos dentro de seus jardins murados — para então vender espaço a anunciantes ou criar novos produtos que possam gerar receita.

De outro, pesquisadores e jornalistas têm que recorrer a métodos ineficientes ou caros demais para obter dados e interpretar as movimentações das redes.


Por isso, usamos na apuração da reportagem sobre conteúdo gerado por inteligência artificial no TikTok, publicada na sexta-feira (25) uma nova forma de coleta de dados: a TikAPI.

A ferramenta se apresenta como uma forma conveniente de interagir com a plataforma, raspando dados de usuários, vídeos, curtidas e comentários. É uma solução paga — com preços a partir de US$ 29 (R$ 150) por mês —, mas permite que o pesquisador aproveite um período para testes de cinco dias, com número limitado de buscas.

Foi o suficiente para conseguirmos coletar publicações em destaque das cinco hashtags mais populares sobre IA na plataforma. Entre elas, identificamos trends e vídeos virais que descontextualizam ferramentas de IA, usando-as para prever o futuro, para identificar atividades sobrenaturais e até para reforçar teorias conspiratórias.

Leia mais
Investigamos Virais no TikTok atribuem poderes mágicos à IA e espalham desinformação sobre a tecnologia

A alternativa não é ideal — pois sem uma documentação da própria empresa sobre como seu produto opera, não temos como saber como a busca realmente funciona —, mas foi a que encontramos para vislumbrar o que acontece no TikTok, enquanto a API oficial não é disponibilizada para jornalistas brasileiros.

Nos próximos meses tentaremos também novas estratégias e formas de investigar essa e outras plataformas. Narraremos essa saga por aqui.


🛠️ CAIXA DE FERRAMENTAS
Uma alternativa para explorar dados do YouTube enquanto maiores restrições não são colocadas pela plataforma é o YouTube Data Tools, desenvolvido pelo pesquisador Bernhard Rieder, da Universidade de Amsterdam.

A ferramenta fornece:

  • Informações sobre um canal, como ID, data de criação, número de seguidores;
  • Listas de vídeos de um mesmo canal ou com base em palavras-chave específicas;
  • Lista de comentários de vídeos;
  • Rede de canais relacionados.

Os desenvolvedores disponibilizam um tutorial em vídeo (em inglês) ensinando a operar a ferramenta.

sobre o

Radar Aos Fatos faz o monitoramento do ecossistema de desinformação brasileiro e, aliado à ciência de dados e à metodologia de checagem do Aos Fatos, traz diagnósticos precisos sobre campanhas coordenadas e conteúdos enganosos nas redes.

Topo

Usamos cookies e tecnologias semelhantes de acordo com a nossa Política de Privacidade. Ao continuar navegando, você concordará com estas condições.