Redação no(a) Inteligência Artificial Em 16/06/2026, 12:34

Nvidia lança Nemotron 3 Ultra com 550 bilhões de parâmetros e código aberto para IA agentiva

Chip NVIDIA em placa de circuito eletrônico, semelhante ao utilizado na plataforma Nemotron 3 Ultra. (Foto: Wikimedia Commons)

0 Comentários🗣️🔥

O CEO da NVIDIA, Jensen Huang, anunciou o Nemotron 3 Ultra em 1º de junho de 2026 durante o Computex em Taipei, com lançamento oficial em 4 de junho. O modelo possui 550 bilhões de parâmetros totais com 55 bilhões ativos por token, representando um avanço significativo na democratização de modelos de linguagem de alto desempenho para aplicações agentivas.

A arquitetura híbrida Mamba-Transformer com Mixture-of-Experts oferece contexto de até 1 milhão de tokens, capacidade essencial para tarefas de longa duração. O modelo alcança 5,9 vezes maior throughput de inferência comparado ao GLM-5.1-754B-A40B, 4,8 vezes superior ao Kimi-K2.6-1T-A32B e 1,6 vezes mais rápido que o Qwen-3.5-397B-17B, segundo benchmarks publicados.

Os modelos Super e Ultra foram treinados com NVFP4 e incorporam LatentMoE, uma abordagem que melhora a qualidade, além de incluir camadas MTP para geração de texto mais rápida. O pré-treinamento foi construído sobre uma base de 10 trilhões de tokens, com adição de 212 bilhões de novos tokens direcionados a três lacunas de domínio de alto valor.

O pós-treinamento envolveu Ajuste Fino Supervisionado (SFT), Aprendizado por Reforço (RL) e Destilação Multi-Professor em Política (MOPD) para melhorar a precisão do modelo. A técnica MOPD utiliza mais de 10 modelos professores especializados para guiar o treinamento nas saídas geradas pelo próprio modelo em codificação, raciocínio, uso de ferramentas e sequências de ação agentiva.

A NVIDIA liberará pesos do modelo, software de pré e pós-treinamento, receitas de treinamento e a maioria dos dados de treinamento. O modelo está totalmente aberto sob a Licença de Modelo Aberto da NVIDIA, com pesos abertos, dados de treinamento e receitas, disponível em plataformas como Hugging Face, OpenRouter e NVIDIA NIM.

A implicação estratégica para países em desenvolvimento é substancial. O Nemotron 3 Ultra foi explicitamente ajustado para agentes de longa duração, com janela de contexto de 1 milhão de tokens, checkpoints abertos, controles de orçamento de raciocínio e eficiência direcionada aos gargalos exatos que desenvolvedores e empresas enfrentam em produção. Instituições brasileiras podem explorar modelos de ponta para aplicações em português, adaptando-os a necessidades locais em saúde, educação, agricultura e gestão pública sem dependência de plataformas estrangeiras.

O modelo alcança uma pontuação de 48 no Índice de Inteligência da Análise Artificial, a mais alta entre os modelos de peso aberto avaliados até junho de 2026. Porém, fica seis pontos abaixo do Kimi K2.6 da China, que marca 54, refletindo a competição global acirrada em inteligência artificial.

O Nemotron 3 Ultra foi lançado como um modelo de raciocínio Mixture-of-Experts aberto de 550 bilhões de parâmetros que fornece não apenas pesos, mas também dados de treinamento e receitas sob a Licença de Modelo Aberto da NVIDIA. Parceiros empresariais nomeados no lançamento incluem Microsoft, SAP, ServiceNow, Red Hat, Palantir, CrowdStrike, Siemens e Synopsys.

A transparência na divulgação de técnicas de treinamento e a abertura dos pesos fortalecem o ecossistema de pesquisa global. A NVIDIA é a primeira a lançar uma coleção de modelos abertos de ponta, conjuntos de dados de treinamento e ambientes e bibliotecas de aprendizado por reforço para construir agentes de IA altamente precisos e eficientes, criando oportunidades para que centros de pesquisa, universidades e empresas de menor porte desenvolvam soluções especializadas sem depender de APIs controladas por grandes corporações tecnológicas.

Com informações de ARXIV.

Próxima Irã denuncia presidente da FIFA por negligência e cobra fim do cerco ocidental aos vistos esportivos »

Inteligência Artificial

Redação:

Governo dos EUA manda Anthropic bloquear estrangeiros e tira do ar seus dois modelos de IA mais potentes
Qualquer brasileiro que tentasse usar os dois modelos de inteligência artificial mais poderosos da Anthropic…
Estudo revela agente ‘mentiroso confiante’ em debates de inteligência artificial
Um novo estudo divulgado no repositório arXiv revelou um comportamento intrigante em sistemas de inteligência…
Pesquisadores usam IA para criar moléculas que atacam células cancerígenas
Pesquisadores do Instituto de Pesquisa Biomédica de Barcelona (IRB Barcelona) alcançaram um feito inédito na…