Quando pensamos em investigar algo ou alguém, o primeiro recurso que temos à mão (literalmente) é olhar as redes sociais daquela pessoa ou instituição. E faz sentido.
Além de acessíveis, as plataformas podem fornecer informações importantes de identificação de perfis, como ocupação, endereço, atividade e redes de relações interpessoais. Também por meio delas podemos acompanhar o debate público e ver o posicionamento de pessoas e instituições.
Assine já a nova newsletter do Radar Aos Fatos e receba a cada quinze dias técnicas de investigação com dados abertos.
Porém, se a intenção é analisar uma grande quantidade de publicações ou baixar informações desses espaços, já não é tão simples. E tem se tornado cada vez mais difícil. Isso porque as plataformas estão restringindo o acesso a suas documentações de APIs — sigla em inglês para interface de programação de aplicações —, que nada mais é do que um manual de instruções sobre como interagir com os dados armazenados naquele sistema.
- O X (ex-Twitter) encerrou o acesso gratuito à API em abril. Era com essa conexão que desenvolvedores conseguiam, por exemplo, criar software para raspar dados de tuítes e perfis. O acesso gratuito passou a ser restrito somente a aplicações para publicar conteúdo, mas não para raspar dados. Para isso, a empresa passou a oferecer uma versão paga a um custo de US$ 100 mensais, na modalidade mais simples;
- A Meta restringiu acesso programático ao conteúdo publicado em seus produtos desde o escândalo da Cambridge Analytica e tem enfraquecido também sua principal ferramenta de coleta de dados, o CrowdTangle. Como alternativa, a plataforma oferece acesso a bases de dados de temas pré-selecionados como contrapartida pela participação em pesquisas patrocinadas pela empresa;
- O YouTube encerrou o acesso à parte de sua API que fornecia dados sobre os “conteúdos relacionados” — vídeos ou canais recomendados a um usuário a partir de outro conteúdo assistido;
- Já o TikTok deu um primeiro aceno na contramão da concorrência, disponibilizando uma documentação de API para pesquisadores na Europa — pioneira em legislações de proteção de dados e transparência — e prometendo que ampliaria o acesso para outras regiões.
De um lado, as plataformas digitais digladiam-se para manter a atenção dos usuários e, consequentemente, o fluxo de dados que nós produzimos dentro de seus jardins murados — para então vender espaço a anunciantes ou criar novos produtos que possam gerar receita.
De outro, pesquisadores e jornalistas têm que recorrer a métodos ineficientes ou caros demais para obter dados e interpretar as movimentações das redes.
Por isso, usamos na apuração da reportagem sobre conteúdo gerado por inteligência artificial no TikTok, publicada na sexta-feira (25) uma nova forma de coleta de dados: a TikAPI.
A ferramenta se apresenta como uma forma conveniente de interagir com a plataforma, raspando dados de usuários, vídeos, curtidas e comentários. É uma solução paga — com preços a partir de US$ 29 (R$ 150) por mês —, mas permite que o pesquisador aproveite um período para testes de cinco dias, com número limitado de buscas.
Foi o suficiente para conseguirmos coletar publicações em destaque das cinco hashtags mais populares sobre IA na plataforma. Entre elas, identificamos trends e vídeos virais que descontextualizam ferramentas de IA, usando-as para prever o futuro, para identificar atividades sobrenaturais e até para reforçar teorias conspiratórias.
A alternativa não é ideal — pois sem uma documentação da própria empresa sobre como seu produto opera, não temos como saber como a busca realmente funciona —, mas foi a que encontramos para vislumbrar o que acontece no TikTok, enquanto a API oficial não é disponibilizada para jornalistas brasileiros.
Nos próximos meses tentaremos também novas estratégias e formas de investigar essa e outras plataformas. Narraremos essa saga por aqui.
🛠️ CAIXA DE FERRAMENTAS
Uma alternativa para explorar dados do YouTube enquanto maiores restrições não são colocadas pela plataforma é o YouTube Data Tools, desenvolvido pelo pesquisador Bernhard Rieder, da Universidade de Amsterdam.
A ferramenta fornece:
- Informações sobre um canal, como ID, data de criação, número de seguidores;
- Listas de vídeos de um mesmo canal ou com base em palavras-chave específicas;
- Lista de comentários de vídeos;
- Rede de canais relacionados.
Os desenvolvedores disponibilizam um tutorial em vídeo (em inglês) ensinando a operar a ferramenta.