Méuri Elle/Aos Fatos

Nova busca do Google com IA demandará transparência sobre algoritmo e fontes

Por Alexandre Aragão

22 de maio de 2024, 18h32

Principal fonte de audiência para sites jornalísticos, a busca do Google passará por mudanças fundamentais em breve, conforme a empresa anunciou em evento na semana passada.

Até o fim do ano, resultados gerados por inteligência artificial generativa estarão disponíveis para 1 bilhão de usuários em todo o mundo. Em vez de terem que acessar os links do resultado, essas pessoas verão respostas ao que buscaram já na página do Google.

A novidade é parte de uma tendência que independe da empresa — que tem na busca sua maior fonte de receita, 57% dos US$ 80 bilhões de faturamento no primeiro trimestre.

Em fevereiro, a consultoria Gartner estimou que o volume de buscas na internet deve cair 25% até 2026 devido à popularização de chatbots e outras ferramentas que usam IA. Além disso, existe uma percepção de que a busca do Google é menos eficiente do que já foi um dia.

A conclusão lógica é que a audiência de sites jornalísticos tende a cair ainda mais do que caiu nos últimos anos.

A Plataforma de hoje é sobre a busca por informação de qualidade.


A newsletter Plataforma chega ao seu email toda quarta-feira.

Assine de graça e receba análises exclusivas.


A nova busca do Google

Em um texto institucional, o Google explica de forma simplificada como a busca funciona: “É como o índice de fim de um livro — com uma entrada para cada palavra encontrada em cada página da web indexada. Quando adicionamos uma página da web, adicionamos também as entradas para todas as palavras contidas nela”.

A analogia com o livro não é gratuita, uma vez que a organização da informação como a conhecemos tem raízes em monastérios e universidades da Europa do século 13. No livro “Índice, uma história do” (Fósforo), o professor britânico Dennis Duncan explica que “uma história do índice é, na verdade, uma história do tempo e do conhecimento, e da relação entre os dois”.

“É a história de nossa crescente premência de acessar informações com velocidade e de uma premência paralela de ter os conteúdos dos livros como unidades de conhecimento divisíveis, distintas e passíveis de serem fruídas individualmente. Isso é ciência da informação, e o índice é o elemento fundamental da arquitetura dessa disciplina.”

Troque na frase acima “conteúdos dos livros” por “páginas dos sites” — e eis a busca do Google, que surgiu para economizar o tempo dos usuários que precisassem encontrar algo na vastidão da internet. A inovação no uso de IA generativa, aliás, vai no mesmo sentido de economizar tempo.

Mas indexar a maior parte da web é uma tarefa cada vez mais complexa. Quem buscasse sobre as enchentes no Rio Grande do Sul no Google, por exemplo, poderia acabar caindo em sites de cassinos online, como revelou reportagem do Aos Fatos na semana passada.

O cientista de dados João Barbosa e a repórter Ethel Rudnitzki identificaram que criminosos usavam conteúdos jornalísticos — de fontes como CNN Brasil, Exame, ge, UOL e o próprio Aos Fatos — para enganar o sistema de indexação do Google e aumentar o alcance de sites maliciosos.

Além disso, hospedaram essas páginas em sites hackeados de prefeituras e câmaras municipais, a fim de aproveitarem o ranqueamento maior que têm sites registrados em domínios .gov.

Para além do desrespeito ao direito autoral, o exemplo mostra também como profissionais de marketing digital buscam acompanhar o algoritmo para não perder relevância, mesmo com objetivos ilegais.

No vídeo de apresentação da nova busca que usa IA generativa, a empresa diz que “o Google vai dar um Google para você”. O conteúdo artificial poderá mostrar um índice de links em que se baseou, bem como mapas e integrações com outros serviços da empresa.

Esse conteúdo não estará isento da influência de terceiros. Assim como a indústria do SEO acompanha o algoritmo, profissionais testarão novas formas de influenciar o que a IA cospe.

O que nos traz à questão da qualidade da informação.

O jornalismo — que tende a perder audiência com a inovação — é um ofício feito por humanos, em escala limitada, mas que preza acima de tudo pela exatidão. Seria o tipo de conteúdo mais indicado para alimentar grandes modelos de linguagem (LLMs) que tenham como objetivo informar humanos, e publishers já brigam na Justiça para serem pagos pelo uso dessa propriedade intelectual por empresas como a OpenAI e o Google.

Ainda assim, e por mais que haja aperfeiçoamentos, o conteúdo gerado por IA será uma fotocópia da fotocópia, um resumo do índice. Poderá até economizar o tempo do usuário, mas sem que haja transparência sobre seu funcionamento e as fontes utilizadas, será difícil avaliar a qualidade da informação. Essa é a busca necessária daqui em diante.

Senão, restará apenas confiar no algoritmo.

Topo

Usamos cookies e tecnologias semelhantes de acordo com a nossa Política de Privacidade. Ao continuar navegando, você concordará com estas condições.