Por que é importante arquivar conteúdos na internet

Por Ethel Rudnitzki

11 de março de 2024, 12h00

Alguns anos atrás, meu pai decidiu digitalizar vídeos e fotos antigas da minha família que estavam armazenados em disquetes — dispositivos obsoletos de armazenamento de dados usados em máquinas antigas. Com um antigo computador que ainda funcionava, ele resolveu fazer o upload desses arquivos no YouTube, em um link disponível apenas para usuários restritos. Assim, nossas memórias estariam salvas para sempre. Será?

A ideia de que a internet nunca esquece parece válida em certos casos — no Aos Fatos sabemos que, por mais que seja desmentida e excluída, vez ou outra uma peça de desinformação volta a circular novamente. O mesmo acontece com antigas publicações polêmicas de famosos, que são ressuscitadas sempre que a pessoa volta aos holofotes.


Assine já a newsletter do Radar Aos Fatos e receba a cada quinze dias técnicas de investigação com dados abertos.


Porém, nem sempre é assim. A verdade é que pode ser tão fácil perder arquivos no mundo digital quanto no mundo analógico. Se eu e meus familiares perdermos o endereço do link que armazena nossas filmagens ou meu pai esquecer a senha de sua conta no YouTube e do email de recuperação, pode ser que nunca mais consigamos ver nossas filmagens.

Outra hipótese — menos provável — é que o YouTube se torne no futuro tão obsoleto quanto o disquete e desapareça da internet, tal qual outras redes mortas, como Orkut, Formspring e Fotolog. Nesse caso, ou algum familiar precisará ter a iniciativa de salvar os arquivos em outra nuvem antes que o site saia do ar, ou também ficaremos sem memória.

Da mesma forma, um conteúdo publicado em uma rede social que é deletado ou tirado do ar pode nunca mais ser visto, a não ser que alguém tome a iniciativa de tirar um print antes que seja tarde demais.

É o caso do perfil oficial do ex-presidente dos Estados Unidos Donald Trump no (ainda) Twitter após a invasão do Capitólio, em 2021. Algumas informações úteis para as investigações — como quem interagiu com cada uma das publicações do político e de que forma — foram, provavelmente, perdidas para sempre.

A iniciativa de salvar publicações na internet na maioria dos casos vem dos usuários, e não das plataformas digitais em que esses conteúdos circulam.
Uma exceção é a Wikipédia, enciclopédia virtual colaborativa e gratuita mais acessada do mundo, mantida pela Fundação Wikimedia. Lá, qualquer mudança em conteúdos de verbetes fica registrada em um histórico público de edições.

Foi através desse registro que o Aos Fatos conseguiu constatar a ocorrência de ataques sexistas em verbetes sobre gênero às vésperas do Dia Internacional da Mulher. Ainda que a maioria desses vandalismos digitais tenham permanecido no ar menos de uma hora graças ao trabalho de editores voluntários, o histórico das páginas mostra que há um problema sistêmico de viés de gênero.

Outras reportagens também constataram ofensivas de negacionismo climático e apagamento histórico na plataforma.

{%leia-mais-4832%}

O histórico das páginas na Wikipédia também registra os responsáveis pelas edições de cada arquivo. Sendo assim, é possível responsabilizar um ou outro usuário pelos vandalismos no site — coisa que é quase impossível de ser feita em outras plataformas.

Foi assim que uma reportagem de 2014, na Folha de S.Paulo, constatou que IPs de computadores do Palácio do Planalto haviam inserido edições elogiosas ao programa Mais Médicos no verbete sobre o então ministro da Saúde, Alexandre Padilha (PT).

Nas redes sociais, por outro lado, são raros os casos em que temos certeza de quem foi responsável pela primeira publicação de uma peça de desinformação, uma vez que os conteúdos podem ser apagados a qualquer momento.

Para compensar as falhas de plataformas que não registram o histórico como a Wikipédia, foram criadas iniciativas de arquivamento independente e colaborativo. É o caso do Internet Archive — biblioteca virtual gratuita e sem fins lucrativos — que mantém registros de mais de 850 bilhões de páginas da internet através da ferramenta WayBack Machine — recomendada na edição #66 desta newsletter para salvar versões de sites e publicações em redes sociais.

Assim como no caso do bom e velho print, esse trabalho de arquivamento conta com a ajuda dos usuários, que podem salvar links de sites e posts em redes sociais que poderão ser posteriormente acessados por outras pessoas.

O Internet Archive e a Fundação Wikimedia são raros exemplos de iniciativas que mantêm uma internet colaborativa e transparente, na contramão de plataformas privadas e opacas. Um alívio para investigadores de dados abertos.

Leia mais
WHATSAPP Inscreva-se no nosso canal e receba as nossas checagens e reportagens

🛠️ CAIXA DE FERRAMENTAS

Para quem também quiser colaborar com o arquivamento de históricos digitais, o ArchiveTeam disponibiliza uma ferramenta chamada Warrior (guerreiro, em português) em que você empresta um pouco do seu computador para ser usado como um robô que ajuda nessa tarefa de preservar conteúdos.


🧐 BUSCA AVANÇADA

Já que estamos falando sobre olhar para o passado, a dica desta edição é sobre como procurar conteúdos antigos no Google.

Em edição anterior desta newsletter, falamos sobre as possibilidades de filtros de busca da plataforma, entre eles o que permite pesquisar conteúdos em períodos específicos de tempo.

Mas para agilizar esse trabalho, existe um código mais simples. Basta escrever “before:” e o ano limite desejado para a busca.

Nas redes sociais, usuários estão compartilhando essa dica para evitar conteúdos gerados por IA (inteligência artificial) — produzidos, majoritariamente, após 2023 — que burlam o ranqueamento do Google com técnicas de SEO.

sobre o

Radar Aos Fatos faz o monitoramento do ecossistema de desinformação brasileiro e, aliado à ciência de dados e à metodologia de checagem do Aos Fatos, traz diagnósticos precisos sobre campanhas coordenadas e conteúdos enganosos nas redes.

Topo

Usamos cookies e tecnologias semelhantes de acordo com a nossa Política de Privacidade. Ao continuar navegando, você concordará com estas condições.