domingo, outubro 6, 2024
InícioMUNDOÍcones de Hollywood do passado estão retornando em acordos de clonagem de...

Ícones de Hollywood do passado estão retornando em acordos de clonagem de voz de IA


Estrelas da era de ouro de Hollywood estão renascendo por meio de acordos de clonagem de voz de IA de celebridades, um sinal de como algumas das preocupações do “Velho Oeste” sobre representação não autorizada de IA estão sendo abordadas por novos modelos de negócios.

A ElevenLabs, uma startup de tecnologia de áudio financiada por empresas de capital de risco, incluindo Andreessen Horowitz e Sequoia, assinou vários acordos com os espólios de atores lendários para seus Vozes icônicas ferramenta que permite que os usuários tenham vozes geradas por IA lidas para eles por meio de um aplicativo de audiolivro. As estrelas incluem Burt Reynolds, Judy Garland, James Dean e Sir Laurence Olivier.

A ElevenLabs, que foi lançada em 2023, cria áudio para livros e artigos de notícias, personagens de videogame, pré-produção de filmes e mídia social e publicidade. A empresa já trabalha com editoras, incluindo o New York Times e o Washington Post e, no início deste ano, a empresa foi selecionada pela Disney para se juntar ao seu programa de aceleração.

“Você precisa de cerca de 30 minutos de áudio de alta qualidade para criar um clone de voz profissional”, disse Sam Sklar, um membro da equipe de crescimento da ElevenLabs, e as vozes são geradas a partir do catálogo da celebridade. Uma vez criado, ele pode ser chamado para ler texto (artigos, PDFs, ePubs, boletins informativos ou outro conteúdo de texto). No entanto, a voz e o conteúdo não podem ser exportados, com toda a audição em um aplicativo de leitura.

Um usuário pode, por exemplo, ter artigos narrados por James Dean dentro do aplicativo, mas os usuários não podem acessar as vozes de nenhum conteúdo que ainda não esteja no aplicativo.

Esses tipos de acordos podem ajudar a definir os limites para um futuro em que o conteúdo de voz gerado por IA seja menos contencioso e mais um terreno controlado e com curadoria. O Google Play e o Apple Books já utilizam vozes geradas por IA até certo ponto, embora existam grandes obstáculos para recriar o ritmo, a entonação e a emoção da voz humana.

O setor de IA tem sido atormentado por preocupações sobre o uso de vozes de celebridades, com a OpenAI dando uma reviravolta em maio, depois que a atriz Scarlett Johansson acusou a empresa de roubar sua voz depois que ela rejeitou ofertas de licenciamento.

“Estamos muito atentos aos riscos associados à mídia sintética e levamos o uso seguro de nossas ferramentas incrivelmente a sério”, disse Sklar. As salvaguardas incluem moderação ativa de conteúdo, responsabilização executável com proibições e disposições especiais para salvaguardar o impacto de Voz da IA ​​nas eleições de 2024.

Entre a geração atual de atores, ainda há uma ansiedade significativa em torno do uso de IA na geração de conteúdo de voz. Atores de voz para jogos de vídeo levantaram preocupações, e a greve do cinema e da televisão do ano passado teve raízes significativas em ansiedades sobre o uso da IA. O uso de vozes icônicas vendidas por espólios é um nicho de mercado que potencialmente evita essas armadilhas, representando um novo fluxo de renda da IA ​​em vez de um fluxo de renda perdido por causa da IA.

O uso de vozes de celebridades semelhantes é um problema anterior à IA, como o caso de 1988 de Frito Lay usando um som parecido com Tom Waits em seus anúncios, e outro caso de Waits em 2007depois que o próprio Waits recusou por muito tempo acordos de publicidade. A IA apresenta um caminho mais fácil para criar sons semelhantes, e processos judiciais recentes movidos contra a startup de IA Lovo por uso supostamente inapropriado e não compensado de dubladores na geração de suas vozes de IA é um lembrete de que o mundo da geração de voz de IA provavelmente continuará sendo complicado e litigioso até certo ponto. (A Lovo negou as alegações no processo e também apontou para um modelo de compartilhamento de receita que oferece aos atores por vozes clonadas.)

É difícil avaliar as proteções em alguns lugares sem analisar a linguagem específica dos contratos da IconicVoices, disse Steve Cohen, sócio da Pollock & Cohen que representa dubladores em um setor não relacionado. ação judicial alegando clonagem de vozes sem permissão.

A ElevenLabs destaca a maneira como sua ferramenta IconicVoices obtém permissões e seleciona o uso das vozes.

“Dar permissão para usar a voz é um dos princípios básicos”, disse Cohen. “Acho que os fatores-chave são permissão, compensação e controle.”

Novas leis mais claras também podem ser um desincentivo para pessoas tentadas a se apropriarem indevidamente de uma voz, “não para bandidos hardcore, mas para casos extremos”, disse Cohen. Mas citando Bette Davis em “All About Eve”, ele acrescentou, “‘Apertem os cintos de segurança; vai ser uma viagem turbulenta.'”

O quão realistas as vozes clonadas soam também é uma questão em evolução. Muitos especialistas dizem que, como a IA não “sabe” o que está dizendo, a qualidade do desempenho é limitada. Sklar disse que o nível mais recente de qualidade de fala da ElevenLabs é indistinguível da fala humana real. “As ferramentas de texto para fala da ElevenLabs podem entender o contexto das palavras”, disse ele.

A IA é tão boa quanto os modelos nos quais é treinada, e os conjuntos de dados de voz dos atores se tornam parte do processo.

“Modelos neurais derivam suas capacidades de imitar/memorizar nuances e padrões presentes em seus dados de treinamento”, disse Nauman Dawalatabad, um associado de pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial do MIT com extensa pesquisa em geração de voz de IA. “A qualidade e a diversidade dos dados de treinamento influenciam significativamente o desempenho do modelo.”

A entrega vocal de estrelas de cinema poderia aumentar a imitação e o aprendizado da IA ​​ao fornecer o tipo de “conjuntos de dados de voz de alta qualidade para treinamento e ajuste fino de grandes modelos” que Dawalatabad disse ser essencial para o processo. Mas ele expressou reservas sobre “soar humano” como sendo o teste certo para o campo de voz da IA, pois isso poderia reforçar uma relação antagônica entre vozes humanas e sintéticas.

Os dubladores continuam divididos sobre a tecnologia, com alguns se recusando a considerar quaisquer acordos, mas outros dizendo que as oportunidades de clonar suas vozes para uma produção mais rápida e barata em algumas formas de audiolivros não podem ser ignoradas. “A tecnologia de IA pode ajudar os fluxos de trabalho. A IA não é uma ferramenta nova para talentos de voz, produtores e editores, muitos dos quais a usam para melhorar seu controle de qualidade na pós-produção”, disse Michele Cobb, diretora executiva da Audio Publishers Association, à CNBC no ano passado.

Modelos generativos recentes mostraram avanços substanciais em comparação com iterações anteriores, tornando cada vez mais difícil distinguir entre vozes falsas e autênticas apenas pelo ouvido, de acordo com Dawalatabad. O licenciamento de voz de IA poderia aliviar a carga de trabalho para dubladores, ele acrescentou, sem suplantá-los, pois eles “intercedem no processo ao se concentrar em oferecer correção ou aprimoramento a aspectos inefáveis, como entonação, calor e ênfase, que ainda apresentam desafios”.



CNBC

ARTIGOS RELACIONADOS
- Advertisment -

Mais popular