sábado, outubro 5, 2024
InícioECONOMIAComo evitar spam de IA na busca do Google: 'before:2023' - 07/07/2024...

Como evitar spam de IA na busca do Google: ‘before:2023’ – 07/07/2024 – Tec


Autodenominada uma empresa de inteligência artificialo Google reconhecer que o spam feito a partir de IA generativa —com textos, áudios e vídeos— pode deixar a Internet “em ruínas”.

Esse foi o diagnóstico de um estudo elaborado pelo braço de IA da big tech, a Deepmind, e pelo think tank de cibersegurança do grupo Jigsaw, que veio ao público no último dia 21.

Os primeiros sinais da polícia por IA já aparecem em buscas no próprio Google. Entre os 11 primeiros resultados em uma pesquisa por imagens do escritor Machado de Assis, duas mostram o avatar de IA que a ABL (Academia Brasileira de Letras) criou de Machado de Assis —alvo de críticas por reproduzir uma versão branca do escritor.

Busca por Machado de Assis já retorna imagens geradas por IA -arraste para o lado para ver antes e depois

Busca no Google exibe 12 imagens de Machado de Assis.  Duas delas são do avatar de IA do escritor, criado pela Academia Brasileira de Letras

Pesquisa do Google exibe 13 imagens de Machado de Assis

Imagens do avatar de IA criado pela ABL de Machado já aparecem no topo das buscas-Reprodução/Google

Os vestígios do uso de IA para produção de conteúdo começam a ficar possíveis em outras partes da internet. Nos textos, é aparente principalmente em dúvidas cotidianas, que costumavam ser atendidas por sites especializados.

A busca por “o que levar a um acampamento”, por exemplo, hoje leva a textos bastante semelhantes entre si, hospedados em portais comerciais. O estilo do ChatGPT está ali em maior ou menor grau e é apontado por sites de reconhecimento de uso de IA —ainda pouco robusto.

Ao usar o comando “before:2023”, que limita os resultados ao que foi publicado de 2022 para trás, ganha destaque, por exemplo, o blog especializado “Eu me aventurei”, mantido pelos jornalistas paranaenses Carolina Leal e Lilo Barros.

Além de apontar os equipamentos básicos, como os demais textos adaptados para SEO (otimização para manter um texto no topo dos resultados do Google), o post de Leal e Barros acrescenta dicas úteis ao leitor de quem está aprendendo a viajar. “Antes de gastar comprando equipamentos de camping, procure alugar ou comprar de algum amigo”, recomenda o texto.

É esse tipo de toque pessoal que especialistas consultados pela Folha temem que perca espaço com o avanço da inteligência artificial internet afora.

Em fóruns especializados como Notícias Hacker e em tweets de personalidades do mundo da tecnologia como Elon Musk circula a recomendação de procurar páginas anteriores a 2023, com o comando “before:2023”. Trata-se de um filtro aplicável na busca do Google.

Para o cientista-chefe do Instituto Tecnologia e Sociedade do Rio de Janeiro (ITS-Rio) e também colunista da Folha, Ronaldo Lemosa tática só não se tornou mais popular no Brasil por falta de divulgação.

A inteligência artificial gera um desafio para a organização da informação na internet, e isso é motivo de preocupação para pesquisadores como o Google, diz o pesquisador.

A big tech dispõe de uma ferramenta chamada PageRank, cujo propósito é dar uma nota de relevância para cada página da web de acordo com o que o usuário busca. São considerados mais de 14 mil critérios, como presença de imagens, vídeos e celebridades do site, de acordo com vazamento de uma versão antiga do algoritmo do buscador.

Uma das formas de confundir esse algoritmo é inundar a internet com conteúdo gerado sinteticamente “em escala descomunal”, segundo Lemos.

“Antes da IA ​​generativa essa técnica já havia sido tentada para dominar os buscadores, por meio das chamadas fazendas de conteúdo”, registra o especialista.

Eram empresas empregavam, preferencialmente, trabalho de baixo custo em países do sudeste asiático para produzir, em massa, conteúdos genéricos e ganhar com os cliques que esses conteúdos geravam. Mas essa estratégia escapou no custo e na quantidade de trabalhadores disponíveis. “Ágora [com a IA generativa] esse limite não existe mais na prática”, afirma Lemos.

“Isso começa a influenciar o resultado dos buscadores, que não conseguem mais diferenciar o jogo da tribo, o que é real do que é conteúdo produzido de forma coordenada e inautêntica”, resume.

Nossos conteúdos em inglês, essa enxurrada de spam sintético já é mais estável.

Pesquisa no Google por Sigourney Weaver jovem

Pesquisa no Google exibe 15 imagens de Sigourney Weaver, sendo a segunda uma cópia dela jovem gerada por IA.

Pesquisa no Google exibe 15 imagens de Sigourney Weaver

Segundo resultado da busca atualmente exibe uma imagem gerada por IA – Reprodução/Google

A pesquisa do Google chamada “Abuso com IA generativa: uma taxonomia das táticas e percepções a partir de dados do mundo real” encontrou 200 matérias reportando sobre usos nocivos da tecnologia, a partir de buscas pelas palavras-chave “ChatGPT”, “gerado por IA”, “deepfake”, entre outras.

Mais de 20 delas tinham relação com o emprego de IA para dar escala a injeção de spam na internet e outras 20 usavam uma tática chamada de contas-fantoche (sockpuppeting no original) —a criação de contas falsas, facilitada por recursos de inteligência artificial generativa, para divulgar conteúdo na internet.

O The Guardian mostrou, por exemplo, que um “exército de fakes” defendeu no X (ex-Twitter) a candidatura dos Emirados Árabes Unidos à presidência da COP28 (28ª Conferência da ONU sobre Mudanças Climáticas).

A pesquisa do Google indica que há três objetivos principais no uso abusivo de IA: manipulação de opinião pública, lucro e fraudes.

Outros levantamentos, como o da agência especializada no monitoramento de material malicioso e sintético na internet Guarda de Notíciascorroboram o diagnóstico do Google. A empresa americana registrou 976 fontes de notícias duvidosas geradas por IA e já encontraram portais jornalísticos falsos no Brasil. Só entre na lista de portais sem curadoria humana adequada, segundo avaliação da Newsguard.

De acordo com Lemos, a escolha preferencial pelo inglês tem a ver com o tamanho do mercado: 52% do conteúdo da rede está em inglês. Porém esse pode ser o destino do português, a sétima língua mais usada na internet.

“Os mercados de línguas menores, por serem menos competitivos, podem até ser mais lucrativos”, diz o pesquisador.

Após notícias críticas circularem na imprensa, o Google atualizou seu algoritmo em março para penalizar textos e imagens geradas por inteligência artificial. A companhia avisou que começaria a tirar da sua lista de sites monitorados aqueles que mantinham conteúdo de baixa qualidade. A big tech estima que reduzirá a circulação de conteúdo não original em até 40% com a medida.

Para o escritor e pesquisador de tecnologia canadense Corey Doctorow, ainda, uma análise dos resultados do Google vem de ainda antes do avanço da IA ​​generativa. Teria ver com “um foco maior em obter lucro com anúncios e conteúdos SEO, nesse momento do mercado em que as big techs estão se capitalizando, com cortes de custos, para investir mais em inteligência artificial.”

“O Google transformou o maior símbolo da bostificação: uma companhia revolucionou a busca na internet, com uma pesquisa que parecia mágica, decaiu tanto que sumiu com receitas inteiras da internet para 90% dos usuários que usam a plataforma como o portal para a internet”, afirma o escritor.

COMO USAR BUSCA AVANÇADA PARA MELHORAR RESULTADOS NO GOOGLE

O comando “before” é apenas uma das opções de filtro disponíveis no Google. É possível usar um dado qualquer como parâmetro. Ainda há o comando “after”, que delimita as buscas aos dados após a indicada.

Veja outros comandos da busca avançada:

  • Uso de aspas: colocar palavras ou frases entre aspas delimita a busca a resultados com menções idênticas à indicada
  • Site: Limite os resultados de pesquisas a um determinado domínio na internet. Exemplo: “site:gov.br” retorna resultados apenas dos sites do governo
  • Região: Limita os resultados a uma localidade geográfica
  • Tipo de arquivo: Limita os resultados dos arquivos no formato indicado
  • Pesquisa segura: Evita conteúdo explícito
  • Para excluir palavras da pesquisa: Use o sinal “-” seguido da palavra que deseja excluir. Exemplo: “seleção de futebol -brasileira”



FOLHA DE SÃO PAULO

ARTIGOS RELACIONADOS
- Advertisment -

Mais popular