Nvidia anuncia Blackwell Ultra e Vera Rubin AI Chips

março 18, 2025

O CEO da NVIDIA, Jensen Huang, chega para participar da cerimônia de abertura da Siliconware Precision Industries Co. (SPIL), no Tan Ke Plant Site em Taichung, Taiwan, 16 de janeiro de 2025.

Ann Wang | Reuters

Nvidia anunciou novos chips para a construção e implantação de modelos de inteligência artificial em sua conferência anual do GTC na terça -feira.

O CEO Jensen Huang revelou que Blackwell Ultra, uma família de chips que envia no segundo semestre deste ano, bem como Vera Rubin, a unidade de processamento de gráficos de próxima geração da empresa, ou GPU, que deve ser enviada em 2026.

As vendas da Nvidia aumentaram mais de seis vezes, uma vez que seus negócios foram transformados com o lançamento do ChatGPT da Openai no final de 2022. Isso ocorre porque suas “grandes GPUs” têm a maior parte do mercado para o desenvolvimento de IA avançada, um processo chamado treinamento.

Desenvolvedores e investidores de software estão assistindo de perto os novos chips da empresa para ver se eles oferecem desempenho e eficiência adicionais suficientes para convencer os maiores clientes finais da empresa – empresas em nuvem, incluindo MicrosoftAssim, Google e Amazon – Continuar gastando bilhões de dólares para construir data centers com base nos chips da NVIDIA.

“Este último ano é onde quase o mundo inteiro se envolveu. O requisito computacional, a lei de escala da IA, é mais resiliente e, de fato, é hiperaccelerado”, disse Huang.

Os anúncios de terça -feira também são um teste da nova Cadence de lançamento anual da Nvidia. A empresa está se esforçando para anunciar novas famílias de chips a cada ano. Antes do boom da IA, a Nvidia lançava novas arquiteturas de chip a cada dois anos.

A Conferência do GTC em San Jose, Califórnia, também é uma demonstração de força para a Nvidia.

O evento, a segunda conferência pessoal da NVIDIA desde a pandemia, deve ter 25.000 participantes e centenas de empresas que discutem as maneiras pelas quais usam o hardware da empresa para a IA. Isso inclui Waymo, Microsoft e Fordentre outros. General Motors Também anunciou que usará o serviço da Nvidia para seus veículos de próxima geração.

A Nvidia também mostrará seus outros produtos e serviços no evento.

Por exemplo, a NVIDIA anunciou novos laptops e desktops usando seus chips, incluindo dois PCs focados na IA, que poderão executar grandes modelos de IA, como LLAMA ou Deepseek. A empresa também anunciou atualizações de suas peças de rede para amarrar centenas ou milhares de GPUs, para que funcionem como uma, além de um pacote de software chamado Dynamo que ajuda os usuários a tirar o máximo proveito de seus chips.

Jensen Huang, co-fundador e diretor executivo da Nvidia Corp., fala durante a Nvidia GPU Technology Conference (GTC) em San Jose, Califórnia, EUA, na terça-feira, 18 de março de 2025.

David Paul Morris | Bloomberg | Getty Images

Vera Rubin

A NVIDIA espera iniciar os sistemas de remessa em sua família GPU de última geração no segundo semestre de 2026.

O sistema possui dois componentes principais: uma CPU, chamada Vera, e um novo design de GPU, chamado Rubin. É nomeado após astrônomo Vera Rubin.

Vera é o primeiro design personalizado da NVIDIA, informou a empresa, e é baseada em um design principal que eles nomearam Olympus.

Anteriormente, quando precisava de CPUs, a NVIDIA usou um design de prateleira a partir de Braço. Empresas que desenvolveram designs de núcleo de braço personalizados, como a Qualcomm e a Apple, dizem que podem ser mais adaptados e desbloquear melhor desempenho.

O design personalizado de Vera será duas vezes mais rápido que a CPU usada nas chips Grace Blackwell do ano passado, disse a empresa.

Quando combinado com Vera, Rubin pode gerenciar 50 petaflops enquanto faz inferência, mais que o dobro dos 20 petaflops para as atuais chips Blackwell da empresa. O Rubin também pode suportar até 288 gigabytes de memória rápida, que é uma das especificações principais que os desenvolvedores de IA relatam.

A NVIDIA também está mudando para o que chama de GPU. Rubin é na verdade duas GPUs, disse Nvidia.

A GPU Blackwell, que atualmente está no mercado, é na verdade dois chips separados que foram reunidos e feitos para trabalhar como um chip.

Começando com Rubin, a Nvidia dirá que, quando combinar duas ou mais matrizes para fazer um único chip, ele se referirá a eles como GPUs separados. Na segunda metade de 2027, a NVIDIA planeja lançar um chip “Rubin Next” que combina quatro matrizes para fazer um único chip, dobrando a velocidade de Rubin, e se referirá a quatro GPUs.

Nvidia disse que isso virá em um rack chamado Vera Rubin NVL144. As versões anteriores do rack da NVIDIA foram chamadas NVL72.

Jensen Huang, co-fundador e diretor executivo da Nvidia Corp., fala durante a Nvidia GPU Technology Conference (GTC) em San Jose, Califórnia, EUA, na terça-feira, 18 de março de 2025.

David Paul Morris | Bloomberg | Getty Images

Blackwell Ultra

A Nvidia também anunciou novas versões de sua família de chips Blackwell que chama de Blackwell Ultra.

Esse chip será capaz de produzir mais tokens por segundo, o que significa que o chip pode gerar mais conteúdo na mesma quantidade de tempo que seu antecessor, disse a Nvidia em um briefing.

A NVIDIA diz que isso significa que os provedores de nuvem podem usar o Blackwell Ultra para oferecer um serviço de IA premium para aplicativos sensíveis ao tempo, permitindo que eles ganhem até 50 vezes a receita dos novos chips como a geração de tremonha, enviada em 2023.

O Blackwell Ultra virá em uma versão com dois emparelhados com uma CPU NVIDIA ARM, chamada GB300, e uma versão com apenas a GPU, chamada B300. Ele também virá em versões com oito GPUs em uma única lâmina de servidor e uma versão de rack com 72 chips Blackwell.

As quatro principais empresas de nuvem implantaram três vezes o número de chips de Blackwell como chips de tremonha, disse a Nvidia.

Deepseek

O modelo Deepseek R1 da China pode ter assustado os investidores da NVIDIA quando foi lançado em janeiro, mas a Nvidia adotou o software. O fabricante de chips usará o modelo para comparar vários de seus novos produtos.

Muitos observadores da IA disseram que o modelo de Deepseek, que supostamente exigia menos chips do que os modelos fabricados nos EUA, ameaçavam os negócios da Nvidia.

Mas Huang disse no início deste ano que o Deepseek era realmente um bom sinal para a Nvidia. Isso ocorre porque o DeepSeek usa um processo chamado “raciocínio”, que requer mais poder de computação para fornecer aos usuários melhores respostas.

Os novos chips Blackwell Ultra são melhores para modelos de raciocínio, disse Nvidia.

Ele desenvolveu seus chips para fazer inferência com mais eficiência; portanto, quando novos modelos de raciocínio exigem mais energia de computação no momento da implantação, os chips da NVIDIA poderão lidar com isso.

“Nos últimos 2-3 anos, aconteceu um grande avanço, um avanço fundamental na inteligência artificial aconteceu, chamamos isso de AI Agentic”, disse Huang. “Pode raciocinar sobre como responder ou como resolver um problema”.