Nvidia lança Nemotron 3 Ultra com 550 bilhões de parâmetros e código aberto para IA agentiva

Chip NVIDIA em placa de circuito eletrônico, semelhante ao utilizado na plataforma Nemotron 3 Ultra. (Foto: Wikimedia Commons)

O CEO da NVIDIA, Jensen Huang, anunciou o Nemotron 3 Ultra em 1º de junho de 2026 durante o Computex em Taipei, com lançamento oficial em 4 de junho. O modelo possui 550 bilhões de parâmetros totais com 55 bilhões ativos por token, representando um avanço significativo na democratização de modelos de linguagem de alto desempenho para aplicações agentivas.

A arquitetura híbrida Mamba-Transformer com Mixture-of-Experts oferece contexto de até 1 milhão de tokens, capacidade essencial para tarefas de longa duração. O modelo alcança 5,9 vezes maior throughput de inferência comparado ao GLM-5.1-754B-A40B, 4,8 vezes superior ao Kimi-K2.6-1T-A32B e 1,6 vezes mais rápido que o Qwen-3.5-397B-17B, segundo benchmarks publicados.

Os modelos Super e Ultra foram treinados com NVFP4 e incorporam LatentMoE, uma abordagem que melhora a qualidade, além de incluir camadas MTP para geração de texto mais rápida. O pré-treinamento foi construído sobre uma base de 10 trilhões de tokens, com adição de 212 bilhões de novos tokens direcionados a três lacunas de domínio de alto valor.

O pós-treinamento envolveu Ajuste Fino Supervisionado (SFT), Aprendizado por Reforço (RL) e Destilação Multi-Professor em Política (MOPD) para melhorar a precisão do modelo. A técnica MOPD utiliza mais de 10 modelos professores especializados para guiar o treinamento nas saídas geradas pelo próprio modelo em codificação, raciocínio, uso de ferramentas e sequências de ação agentiva.

A NVIDIA liberará pesos do modelo, software de pré e pós-treinamento, receitas de treinamento e a maioria dos dados de treinamento. O modelo está totalmente aberto sob a Licença de Modelo Aberto da NVIDIA, com pesos abertos, dados de treinamento e receitas, disponível em plataformas como Hugging Face, OpenRouter e NVIDIA NIM.

A implicação estratégica para países em desenvolvimento é substancial. O Nemotron 3 Ultra foi explicitamente ajustado para agentes de longa duração, com janela de contexto de 1 milhão de tokens, checkpoints abertos, controles de orçamento de raciocínio e eficiência direcionada aos gargalos exatos que desenvolvedores e empresas enfrentam em produção. Instituições brasileiras podem explorar modelos de ponta para aplicações em português, adaptando-os a necessidades locais em saúde, educação, agricultura e gestão pública sem dependência de plataformas estrangeiras.

O modelo alcança uma pontuação de 48 no Índice de Inteligência da Análise Artificial, a mais alta entre os modelos de peso aberto avaliados até junho de 2026. Porém, fica seis pontos abaixo do Kimi K2.6 da China, que marca 54, refletindo a competição global acirrada em inteligência artificial.

O Nemotron 3 Ultra foi lançado como um modelo de raciocínio Mixture-of-Experts aberto de 550 bilhões de parâmetros que fornece não apenas pesos, mas também dados de treinamento e receitas sob a Licença de Modelo Aberto da NVIDIA. Parceiros empresariais nomeados no lançamento incluem Microsoft, SAP, ServiceNow, Red Hat, Palantir, CrowdStrike, Siemens e Synopsys.

A transparência na divulgação de técnicas de treinamento e a abertura dos pesos fortalecem o ecossistema de pesquisa global. A NVIDIA é a primeira a lançar uma coleção de modelos abertos de ponta, conjuntos de dados de treinamento e ambientes e bibliotecas de aprendizado por reforço para construir agentes de IA altamente precisos e eficientes, criando oportunidades para que centros de pesquisa, universidades e empresas de menor porte desenvolvam soluções especializadas sem depender de APIs controladas por grandes corporações tecnológicas.

Com informações de ARXIV.

Redação:
Related Post

Privacidade e cookies: Este site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.