A MiniMax lançou seu modelo M3, apresentado como o primeiro modelo de inteligência artificial doméstico a combinar capacidades avançadas de codificação, funções agênticas, janelas de contexto de 1 milhão de tokens e processamento multimodal nativo em uma única arquitetura.
A empresa Shanghai Hixi Technology, responsável pela MiniMax, disponibilizou o modelo M3 em 1º de junho de 2026. O sistema é construído sobre a arquitetura proprietária Sparse Attention da MiniMax e suporta até 1 milhão de tokens de contexto por meio de API, com garantia mínima de 512 mil tokens.
O M3 foi treinado desde o início com dados multimodais. A MiniMax reestruturou todo seu pipeline de dados, escalando os dados de pré-treinamento para centenas de terabytes e alcançando alinhamento estreito entre os espaços semânticos de texto e visual. No benchmark de agentes BrowseComp, o M3 obteve pontuação de 83,5, superando o Opus 4.7 da OpenAI, que marcou 79,3.
Em demonstração de capacidades autônomas, a MiniMax encarregou o M3 de reproduzir um artigo destacado da ICLR 2025 sobre dinâmicas de aprendizado no ajuste fino de modelos de linguagem. O modelo operou de forma independente por quase 12 horas, produzindo 18 commits e 23 gráficos experimentais.
Em outro teste como assistente de pesquisa em IA, o M3 recebeu quatro modelos base pré-treinados com instrução para completar síntese de dados, treinamento, avaliação e iteração em 12 horas sem intervenção humana. O modelo alcançou pontuação de 37,1, ficando em terceiro lugar atrás do Opus 4.7 com 42,4 e do GPT-5.5 com 39,3.
O modelo está disponível em duas versões de API, M3 e M3-highspeed, com resultados idênticos mas inferência mais rápida na segunda opção. Cache automático é suportado e habilitado por padrão. A MiniMax planeja disponibilizar o M3 como código aberto no HuggingFace e GitHub, com suporte para implantação em clusters privados e ajuste fino.
O preço da API M3 para contexto até 512 mil tokens é oferecido com 50% de desconto nos primeiros sete dias: entrada a 2,1 yuan por milhão de tokens na versão padrão ou 3,15 yuan na prioritária, e saída a 8,4 yuan na padrão ou 12,6 yuan na prioritária. Leituras de cache custam 0,42 yuan na versão padrão ou 0,63 yuan na prioritária por milhão de tokens.
Material de referencia publicado por Pandaily.