NOVA IORQUE — A OpenAI disse na segunda-feira que planeja interromper o uso de uma de suas vozes ChatGPT que a atriz Scarlett Johansson diz soar “assustadoramente semelhante” à dela.
Em uma postagem na plataforma de mídia social X, a OpenAI disse que está “trabalhando para pausar” o Sky – o nome de uma das cinco vozes que os usuários do ChatGPT podem escolher para falar. A empresa disse ter “ouvido perguntas” sobre como seleciona as opções de áudio realistas disponíveis para seu principal chatbot de inteligência artificial, especialmente Sky, e queria abordá-las.
Entre os que levantaram questões estava Johansson, que dublou uma assistente de IA fictícia, e na época futurista, no filme “Her”, de 2013.
Johansson divulgou um comunicado dizendo que o CEO da OpenAI, Sam Altman, a abordou em setembro perguntando se ela emprestaria sua voz ao sistema, dizendo que achava que seria “reconfortante para as pessoas” que não se sentem à vontade com a tecnologia. Ela disse que recusou a oferta.
“Quando ouvi a demonstração lançada, fiquei chocado, irritado e sem acreditar que o Sr. Altman iria seguir uma voz que soava tão estranhamente semelhante à minha que meus amigos mais próximos e meios de comunicação não perceberam a diferença”, disse Johansson.
Ela disse que a OpenAI “relutantemente” concordou em retirar a voz da Sky depois que ela contratou advogados que escreveram cartas a Altman perguntando sobre o processo pelo qual a empresa criou a voz.
A OpenAI decidiu desmascarar as teorias da Internet sobre Johansson em uma postagem de blog que acompanha seu anúncio anterior, com o objetivo de detalhar como as vozes do ChatGPT foram escolhidas. A empresa escreveu que acredita que as vozes da IA “não deveriam imitar deliberadamente a voz distinta de uma celebridade” e que a voz de Sky pertence a uma “atriz profissional diferente”. Mas acrescentou que não poderia compartilhar o nome desse profissional por razões de privacidade.
Em um comunicado enviado à Associated Press após a resposta de Johansson na noite de segunda-feira, Altman disse que a OpenAI escalou o dublador para Sky “antes de qualquer contato” com Johansson.
“A voz de Sky não é de Scarlett Johansson e nunca foi planejada para se parecer com a dela”, disse Altman. “Por respeito à Sra. Johansson, deixamos de usar a voz da Sky em nossos produtos. Lamentamos a Sra. Johansson por não termos nos comunicado melhor.”
A OpenAI, com sede em São Francisco, lançou pela primeira vez recursos de voz para ChatGPT, que incluíam cinco vozes diferentes, em setembro, permitindo que os usuários conversassem alternadamente com o assistente de IA. O “Modo Voz” estava originalmente disponível apenas para assinantes pagos, mas em novembro, a OpenAI anunciou que o recurso se tornaria gratuito para todos os usuários do aplicativo móvel.
E as interações do ChatGPT estão se tornando cada vez mais sofisticadas. Na semana passada, a OpenAI disse que a última atualização do seu modelo generativo de IA pode imitar cadências humanas em suas respostas verbais e pode até tentar detectar o humor das pessoas.
A OpenAI afirma que o modelo mais novo, batizado de GPT-4o, funciona mais rápido que as versões anteriores e pode raciocinar texto, áudio e vídeo em tempo real. Numa demonstração durante o anúncio da OpenAI em 13 de maio, o bot de IA conversou em tempo real, adicionando emoção – especificamente “mais drama” – à sua voz, conforme solicitado. Também foi necessário extrapolar o estado emocional de uma pessoa, observando um vídeo de selfie de seu rosto, auxiliado em traduções de idiomas, problemas matemáticos passo a passo e muito mais.
GPT-4o, abreviação de “omni”, ainda não está amplamente disponível. Ele chegará progressivamente a usuários selecionados nas próximas semanas e meses. Os recursos de texto e imagem do modelo já começaram a ser implementados e devem alcançar até mesmo alguns daqueles que usam o nível gratuito do ChatGPT – mas o novo modo de voz estará disponível apenas para assinantes pagos do ChatGPT Plus.
Embora a maioria ainda não tenha colocado as mãos nesses recursos recém-anunciados, os recursos suscitaram ainda mais comparações com o romance distópico de Spike Jonze, “Her”, que segue um homem introvertido (Joaquin Phoenix) que se apaixona por um operador de IA. sistema (Johansson), levando a muitas complicações.
Altman pareceu aproveitar isso também – simplesmente postando a palavra “ela” na plataforma de mídia social X no dia da inauguração do GPT-4o.
Muitos que reagiram às demonstrações da modelo na semana passada também descobriram que algumas das interações atingiram um tom estranhamente sedutor. Em um vídeo postado pela OpenAI, um ChatGPT com voz feminina elogia um funcionário da empresa por “usar um moletom OpenAI”, por exemplo, e em outro o chatbot diz “ah, pare com isso, você está me fazendo corar” depois de ser informado de que é incrível.
Isso gerou algumas conversas sobre as formas de gênero que os críticos dizem que as empresas de tecnologia usam há muito tempo para desenvolver e contratar assistentes de voz – que remontam muito antes da última onda de IA generativa aprimorar os recursos dos chatbots de IA. Em 2019, a organização cultural e científica das Nações Unidas apontou para a “subserviência programada” incorporada em assistentes padrão com voz feminina (como a Siri da Apple e a Alexa da Amazon), mesmo quando confrontadas com insultos e assédio sexistas.
“Isso está claramente programado para alimentar os egos dos caras”, disse o correspondente sênior do Daily Show, Desi Lydic, sobre o GPT-4o em um segmento na semana passada. “Você realmente pode dizer que um homem construiu esta tecnologia.”
___
A Associated Press e a OpenAI têm um acordo de licenciamento e tecnologia que permite o acesso da OpenAI a parte dos arquivos de texto da AP.