segunda-feira, outubro 7, 2024
InícioTECNOLOGIAMeta estreia o mais novo modelo de IA Llama com ajuda da...

Meta estreia o mais novo modelo de IA Llama com ajuda da Nvidia e outros


Meta anunciou na terça-feira a versão mais recente do seu modelo de inteligência artificial Llama, apelidado de Llama 3.1. A mais nova tecnologia Llama vem em três versões diferentes, com uma variante sendo o maior e mais capaz modelo de IA da Meta até o momento. Como as versões anteriores do Llama, o modelo mais novo continua sendo de código aberto, o que significa que pode ser acessado gratuitamente.

O novo modelo de grande linguagem, ou LLM, ressalta o enorme investimento da rede social para acompanhar a concorrência de outros líderes em IA, como startups de alto nível como OpenAI e Anthropic, e outros gigantes da tecnologia como Google e Amazon.

O anúncio também destaca a parceria estreita e crescente entre a Meta e Nvidia. A Nvidia é uma parceira importante da Meta e fornece à gigante das redes sociais os chips de computação chamados GPUs para ajudar a treinar seus modelos de IA, incluindo a versão mais recente do Llama.

Enquanto empresas como a OpenAI buscam ganhar dinheiro vendendo acesso aos seus LLMs proprietários ou oferecendo serviços para ajudar os clientes a usar a tecnologia, a Meta não tem planos de estrear seu próprio negócio de tecnologia empresarial concorrente, disse um porta-voz da Meta durante uma coletiva de imprensa.

Em vez disso, semelhante a quando a Meta lançou o Llama 2 no verão passado, a empresa está fazendo parceria com um punhado de empresas de tecnologia que oferecerão aos seus clientes acesso ao Llama 3.1 por meio de suas respectivas plataformas de computação em nuvem, bem como venderão ferramentas de segurança e gerenciamento que funcionam com o novo software. Alguns dos 25 parceiros corporativos relacionados ao Llama da Meta incluem Amazon Web Services, Google Cloud, Microsoft Azure, Databricks e Dell.

Embora o CEO da Meta, Mark Zuckerberg, tenha dito a analistas durante chamadas de lucros corporativos anteriores que a Meta gera alguma receita de suas parcerias corporativas com a Llama, um porta-voz da Meta disse que qualquer benefício financeiro é meramente incremental. Em vez disso, a Meta acredita que, ao investir na Llama e em tecnologias de IA relacionadas e disponibilizá-las gratuitamente via código aberto, ela pode atrair talentos de alta qualidade em um mercado competitivo e reduzir seus custos gerais de infraestrutura de computação, entre outros benefícios.

O lançamento do Llama 3.1 pela Meta foi programado para a semana em que Zuckerberg e o CEO da Nvidia, Jensen Huang, estão programados para falar juntos em uma conferência com foco em computação gráfica avançada. A gigante das redes sociais é um dos principais clientes finais da Nvidia que não administra sua própria nuvem voltada para negócios, e a Meta precisa dos chips mais recentes para treinar seus modelos de IA, que ela usa internamente para segmentação e outros produtos. Por exemplo, a Meta disse que a maior versão do modelo Llama 3.1 anunciada na terça-feira foi treinada em 16.000 processadores gráficos H100 da Nvidia.

Mas o relacionamento também é importante para ambas as empresas pelo que representa.

Para a Nvidia, o fato de a Meta estar treinando modelos de código aberto que outras empresas podem usar e adaptar para seus negócios — sem pagar uma taxa de licenciamento ou pedir permissão — pode expandir o uso dos chips da própria Nvidia e manter a demanda alta.

Mas modelos de código aberto podem custar centenas de milhões ou bilhões de dólares para serem criados. Não há muitas empresas que sejam financeiramente capazes de desenvolver e lançar modelos de código aberto com quantias semelhantes de investimento. Google e OpenAI, embora sejam clientes da Nvidia, mantêm seus modelos mais avançados privados.

A Meta, por outro lado, precisa de um suprimento confiável das GPUs mais recentes para treinar modelos cada vez mais poderosos. Assim como a Nvidia, a Meta está tentando promover um ecossistema de desenvolvedores que estão construindo aplicativos de IA com o software de código aberto da empresa no centro, mesmo que a Meta tenha que essencialmente dar código e os chamados pesos de IA que são caros para construir.

A abordagem de código aberto beneficia a Meta ao expor os desenvolvedores às suas ferramentas internas e ao convidá-los a construir em cima delas, disse Ash Jhaveri, vice-presidente de parcerias de IA da empresa, à CNBC. Também ajuda a Meta porque ela usa seus modelos de IA internamente, permitindo assim que a empresa colha as melhorias feitas pela comunidade de código aberto, disse ele.

Zuckerberg escreveu em uma postagem de blog na terça-feira que estava adotando uma “abordagem diferente” para o lançamento do Llama esta semana, acrescentando: “Estamos ativamente construindo parcerias para que mais empresas no ecossistema possam oferecer funcionalidades exclusivas para seus clientes também”.

Como a Meta não é um fornecedor corporativo, a gigante das redes sociais pode encaminhar empresas que perguntam sobre a Llama para um de seus parceiros corporativos, como a Nvidia, disse Jhaveri.

A maior versão da família de modelos Llama 3.1 é chamada de Llama 3.1 405B. Este modelo gigante de linguagem grande, ou LLM, contém 405 bilhões de parâmetros, que se referem às variáveis ​​que ditam o tamanho geral do modelo e a quantidade de dados que ele pode processar. Em termos gerais, um grande LLM com uma grande quantidade de parâmetros pode executar tarefas mais complicadas do que LLMs menores, como entender o contexto em longos fluxos de texto, resolver equações matemáticas complexas e até mesmo gerar dados sintéticos que podem presumivelmente ser usados ​​para melhorar modelos menores de IA.

A gigante das redes sociais também está lançando versões menores do Llama 3.1, chamadas de modelos Llama 3.1 8B e Llama 3.1 70B. Esses modelos menores são essencialmente versões atualizadas de seus predecessores e podem ser usados ​​para alimentar chatbots e assistentes de codificação de software, disse a Meta.

A Meta também disse que os usuários do WhatsApp da empresa nos EUA e os visitantes do seu site Meta.AI poderão testemunhar os recursos do Llama 3.1 interagindo com o assistente digital da empresa. Presumivelmente, o assistente digital da Meta, que rodará na versão mais recente do Llama, será capaz de responder a problemas matemáticos complicados ou resolver problemas de codificação de software, explicou um porta-voz da Meta.

Usuários do WhatsApp e do Meta.AI que estiverem nos EUA poderão alternar entre o novo e gigantesco Llama 3.1 LLM ou uma versão menos capaz, mas mais rápida e menor, para obter respostas às suas dúvidas, disse o porta-voz do Meta.

Assistir: A Corrida Louca de Cramer: Meta



CNBC

ARTIGOS RELACIONADOS
- Advertisment -

Mais popular