Deepseek treinado modelo de IA usando destilação, agora uma força disruptiva

fevereiro 21, 2025

O laboratório de inteligência artificial chinês Deepseek Roiled Markets em janeiro, desencadeando uma enorme venda de tecnologia e semicondutores depois de revelar os modelos de IA que, segundo ele, eram mais baratos e mais eficientes que os americanos.

Mas os medos e avanços subjacentes que provocaram a venda vão muito mais profundamente do que uma startup de IA. O Vale do Silício agora está calculado com uma técnica no desenvolvimento da IA chamado Destilação, que pode aumentar a tabela de classificação da IA.

A destilação é um processo de extração de conhecimento de um modelo de IA maior para criar um menor. Pode permitir que uma equipe pequena praticamente não tenha recursos para criar um modelo avançado.

Uma empresa de tecnologia líder investe anos e milhões de dólares desenvolvendo um modelo de primeira linha do zero. Em seguida, uma equipe menor, como Deepseek, entra e treina seu próprio modelo mais especializado, fazendo perguntas maiores ao modelo “professor”. O processo cria um novo modelo que é quase tão capaz quanto o modelo da grande empresa, mas treina com mais rapidez e eficiência.

“Essa técnica de destilação é tão poderosa e extremamente barata, e está disponível apenas para qualquer pessoa”, disse Ali Ghodsi, CEO da Databricks, acrescentando que ele espera ver inovação quando se trata de quão grandes modelos de idiomas, ou LLMs, são construídos. “Vamos ver tanta competição pelo LLMS. É isso que vai acontecer nesta nova era que estamos entrando”.

A destilação está agora permitindo que startups e laboratórios de pesquisa menos capitalizados competam na vanguarda mais rápida do que nunca.

Usando esta técnica, Pesquisadores de Berkeley Disse que eles recriaram o modelo de raciocínio da Openai por US $ 450 em 19 horas no mês passado. Logo depois, pesquisadores da Stanford e da Universidade de Washington criado Seu próprio modelo de raciocínio em apenas 26 minutos, usando menos de US $ 50 em créditos de computação, disseram eles. A startup Abraçando o rosto recriado O recurso mais recente e mais chamativo do Openai, Deep Research, como um desafio de codificação de 24 horas.

Deepseek não inventou a destilação, mas acordou o mundo da IA com seu potencial perturbador. Também inaugurou a ascensão de uma nova ordem de código aberto-uma crença de que a transparência e a acessibilidade impulsionam a inovação mais rapidamente do que a pesquisa de portas fechadas.

“O código aberto sempre vence na indústria de tecnologia”, disse Arvind Jain, CEO da Glean, que faz um mecanismo de pesquisa de IA para empresas. “Você não pode superar o momento de que um projeto de código aberto bem-sucedido é capaz de gerar”.

O próprio Openai voltou sua estratégia de fonte fechada após a conquista de Deepseek.

“Pessoalmente, acho que estivemos do lado errado da história aqui e precisamos descobrir uma estratégia diferente de código aberto”, o CEO da Openai, Sam Altman escreveu Em um post no Reddit em 31 de janeiro.

A combinação da nova tração da destilação e o aumento da popularidade do código aberto está alterando completamente a dinâmica competitiva na IA.

Assista ao vídeo para saber mais.

CNBC

Artigo anterior

A Apple’s Vision Pro tem um problema em existência: poucos aplicativos

Próximo artigo

Elon Musk tem problemas com as notas da comunidade X após as correções da Ucrânia

Deepseek treinado modelo de IA usando destilação, agora uma força disruptiva

Anne Wojcicki Nova Oferta para levar 23andme Private por US $ 74,7 milhões

Hackers roubam US $ 1,5 bilhão do Bybit de câmbio, maior assalto criptográfico

A Tesla lembra mais de 375.000 veículos nos EUA devido a sistemas de direção fracassados

Mais popular

Anne Wojcicki Nova Oferta para levar 23andme Private por US $ 74,7 milhões

Hackers roubam US $ 1,5 bilhão do Bybit de câmbio, maior assalto criptográfico

O Covid-19 Pandemic mudou como você viaja? Deixe -nos saber.

A Tesla lembra mais de 375.000 veículos nos EUA devido a sistemas de direção fracassados

Escolhas do editor

Anne Wojcicki Nova Oferta para levar 23andme Private por US $ 74,7 milhões

Hackers roubam US $ 1,5 bilhão do Bybit de câmbio, maior assalto criptográfico

O Covid-19 Pandemic mudou como você viaja? Deixe -nos saber.

POSTAGENS POPULARES

Anne Wojcicki Nova Oferta para levar 23andme Private por US $ 74,7 milhões

Hackers roubam US $ 1,5 bilhão do Bybit de câmbio, maior assalto criptográfico

O Covid-19 Pandemic mudou como você viaja? Deixe -nos saber.

CATEGORIA POPULAR