Como investigar dados de redes sociais sem manual de instruções

Compartilhe

Quando pensamos em investigar algo ou alguém, o primeiro recurso que temos à mão (literalmente) é olhar as redes sociais daquela pessoa ou instituição. E faz sentido.

Além de acessíveis, as plataformas podem fornecer informações importantes de identificação de perfis, como ocupação, endereço, atividade e redes de relações interpessoais. Também por meio delas podemos acompanhar o debate público e ver o posicionamento de pessoas e instituições.


Assine já a nova newsletter do Radar Aos Fatos e receba a cada quinze dias técnicas de investigação com dados abertos.

Porém, se a intenção é analisar uma grande quantidade de publicações ou baixar informações desses espaços, já não é tão simples. E tem se tornado cada vez mais difícil. Isso porque as plataformas estão restringindo o acesso a suas documentações de APIs — sigla em inglês para interface de programação de aplicações —, que nada mais é do que um manual de instruções sobre como interagir com os dados armazenados naquele sistema.

  • O X (ex-Twitter) encerrou o acesso gratuito à API em abril. Era com essa conexão que desenvolvedores conseguiam, por exemplo, criar software para raspar dados de tuítes e perfis. O acesso gratuito passou a ser restrito somente a aplicações para publicar conteúdo, mas não para raspar dados. Para isso, a empresa passou a oferecer uma versão paga a um custo de US$ 100 mensais, na modalidade mais simples;
  • A Meta restringiu acesso programático ao conteúdo publicado em seus produtos desde o escândalo da Cambridge Analytica e tem enfraquecido também sua principal ferramenta de coleta de dados, o CrowdTangle. Como alternativa, a plataforma oferece acesso a bases de dados de temas pré-selecionados como contrapartida pela participação em pesquisas patrocinadas pela empresa;
  • O YouTube encerrou o acesso à parte de sua API que fornecia dados sobre os “conteúdos relacionados” — vídeos ou canais recomendados a um usuário a partir de outro conteúdo assistido;
  • Já o TikTok deu um primeiro aceno na contramão da concorrência, disponibilizando uma documentação de API para pesquisadores na Europa — pioneira em legislações de proteção de dados e transparência — e prometendo que ampliaria o acesso para outras regiões.

De um lado, as plataformas digitais digladiam-se para manter a atenção dos usuários e, consequentemente, o fluxo de dados que nós produzimos dentro de seus jardins murados — para então vender espaço a anunciantes ou criar novos produtos que possam gerar receita.

De outro, pesquisadores e jornalistas têm que recorrer a métodos ineficientes ou caros demais para obter dados e interpretar as movimentações das redes.


Por isso, usamos na apuração da reportagem sobre conteúdo gerado por inteligência artificial no TikTok, publicada na sexta-feira (25) uma nova forma de coleta de dados: a TikAPI.

A ferramenta se apresenta como uma forma conveniente de interagir com a plataforma, raspando dados de usuários, vídeos, curtidas e comentários. É uma solução paga — com preços a partir de US$ 29 (R$ 150) por mês —, mas permite que o pesquisador aproveite um período para testes de cinco dias, com número limitado de buscas.

Foi o suficiente para conseguirmos coletar publicações em destaque das cinco hashtags mais populares sobre IA na plataforma. Entre elas, identificamos trends e vídeos virais que descontextualizam ferramentas de IA, usando-as para prever o futuro, para identificar atividades sobrenaturais e até para reforçar teorias conspiratórias.

Leia mais
Investigamos Virais no TikTok atribuem poderes mágicos à IA e espalham desinformação sobre a tecnologia

A alternativa não é ideal — pois sem uma documentação da própria empresa sobre como seu produto opera, não temos como saber como a busca realmente funciona —, mas foi a que encontramos para vislumbrar o que acontece no TikTok, enquanto a API oficial não é disponibilizada para jornalistas brasileiros.

Nos próximos meses tentaremos também novas estratégias e formas de investigar essa e outras plataformas. Narraremos essa saga por aqui.


🛠️ CAIXA DE FERRAMENTAS
Uma alternativa para explorar dados do YouTube enquanto maiores restrições não são colocadas pela plataforma é o YouTube Data Tools, desenvolvido pelo pesquisador Bernhard Rieder, da Universidade de Amsterdam.

A ferramenta fornece:

  • Informações sobre um canal, como ID, data de criação, número de seguidores;
  • Listas de vídeos de um mesmo canal ou com base em palavras-chave específicas;
  • Lista de comentários de vídeos;
  • Rede de canais relacionados.

Os desenvolvedores disponibilizam um tutorial em vídeo (em inglês) ensinando a operar a ferramenta.

Compartilhe

Leia também

Como impedir que a Meta use seus dados para alimentar modelos de IA

Como impedir que a Meta use seus dados para alimentar modelos de IA

Formato PDF dificulta a análise de grandes volumes de dados e ainda pode esconder ameaças

Formato PDF dificulta a análise de grandes volumes de dados e ainda pode esconder ameaças

Como criminosos camuflam conteúdos maliciosos para enganar o Google

Como criminosos camuflam conteúdos maliciosos para enganar o Google