DeepSeek lança sistema para turbinar chips e que promete ser o pesadelo da Nvidia

O lançamento do DeepSeek V3.1 marca um ponto estratégico na corrida tecnológica global. A empresa, que já havia surpreendido ao mostrar eficiência com menos recursos, agora aposta em algo ainda mais incisivo: otimização para chips de próxima geração fabricados na China, em um contexto em que os Estados Unidos tentam restringir o acesso de Pequim a semicondutores avançados.

Dupla rota: Think e Non-Think

Segundo a própria DeepSeek, o V3.1 inaugura a chamada inferência híbrida, que oferece dois modos de operação:

Think: voltado a raciocínios complexos e respostas mais elaboradas.

Non-Think: focado em retornos rápidos e objetivos.


Na prática, o sistema funciona como se fossem dois modelos dentro de um só, comutáveis em tempo real no site e no aplicativo da empresa. A versão Think, de acordo com a companhia, responde em menos tempo que seu antecessor, sinalizando ganhos de desempenho não apenas em arquitetura, mas também em estratégias de inferência.

O detalhe técnico: FP8 UE8M0

A frase que resume a inovação está no comentário oficial publicado no WeChat: “UE8M0 FP8 é para a próxima geração de chips nacionais”.

O FP8 é um formato de 8 bits que consome metade da memória de FP16 ou BF16, permitindo maior eficiência energética e velocidade, desde que o escalonamento esteja calibrado. A diferença é que o V3.1 foi treinado integralmente nesse padrão (UE8M0 FP8), segundo o model card no Hugging Face. Isso indica adaptação estrutural, não apenas de pesos.

A leitura do mercado é direta: o modelo está pronto para rodar de forma nativa em chips chineses, como os Ascend da Huawei, criando uma ponte entre software e hardware locais.

Pressão sobre a NVIDIA

O movimento tem implicações econômicas e geopolíticas. A NVIDIA, que obteve cerca de 13% da sua receita anual com vendas na China, pode ver essa fatia reduzida se empresas e governos chineses migrarem parte de suas cargas de trabalho de IA para soluções domésticas compatíveis com FP8.

Isso ocorre no tabuleiro dos controles de exportação impostos pelos EUA, que tentam limitar o acesso da China a semicondutores de ponta. Paradoxalmente, tais restrições também aceleraram a busca chinesa por autossuficiência tecnológica.

Limitações e desafios

Apesar do avanço, migrar completamente para chips nacionais ainda enfrenta barreiras. O Financial Times revelou que a DeepSeek chegou a tentar treinar um modelo futuro em Huawei Ascend, mas enfrentou falhas técnicas e precisou recorrer novamente às GPUs da NVIDIA.

Isso sugere que, por enquanto, a estratégia é híbrida: treinar em plataformas ocidentais, mas otimizar a inferência para chips locais, reduzindo dependência no médio prazo.

Comparação de desempenho

Em competições independentes, como a MathArena, ligada à Escola Politécnica Federal de Zurique, o V3.1 (modo Think) aparece entre os melhores modelos da atualidade, embora atrás do GPT-5, que alcança 90% de acerto em testes matemáticos.

Ainda assim, o DeepSeek demonstra capacidade de competir na elite global e, mais importante, já está disponível por API, com pesos e código no Hugging Face.

Conclusão

O DeepSeek V3.1 não é apenas mais um modelo de linguagem. Ele representa um ensaio de soberania tecnológica da China, articulando IA de ponta com chips nacionais e oferecendo uma alternativa ao domínio da NVIDIA.

Se a compatibilidade com FP8 realmente se traduzir em desempenho robusto, o debate sobre quem alimenta a IA chinesa pode mudar radicalmente nos próximos anos — transformando o V3.1 em um marco não apenas tecnológico, mas também geopolítico.

Redação:
Related Post

Privacidade e cookies: Este site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.