Pesquisadores internacionais apresentaram no repositório científico arXiv um novo sistema de raciocínio simbólico chamado MAVEN. O projeto foi desenvolvido para aprimorar a capacidade de modelos de linguagem em tarefas complexas de raciocínio e uso de ferramentas.
Segundo o artigo submetido em 29 de maio e disponível no arXiv, o MAVEN funciona como uma camada de decomposição modular, orquestração adaptativa de ferramentas e verificação intermediária. O sistema não exige treinamento adicional do modelo de base e foi testado em benchmarks como BFCL v3 e TauBench.
O verdadeiro potencial do MAVEN foi revelado no MAVEN-Bench, ambiente de estresse criado pelos autores para avaliar raciocínio matemático e físico em múltiplas etapas. Nesse cenário, o sistema elevou a precisão do modelo de código aberto GPT-OSS-120b de 48% para 71% de acertos.
O desempenho superou sistemas proprietários de ponta, mantendo custo operacional estimado em cerca de um décimo dos concorrentes fechados. O modelo base utilizado é de pesos abertos, permitindo que desenvolvedores inspecionem, adaptem ou executem em infraestrutura própria.
A arquitetura do MAVEN preserva estados intermediários e coordena múltiplas ferramentas, atacando uma das principais deficiências dos grandes modelos atuais. A abordagem simbólica demonstra que engenharia inteligente de verificação pode entregar saltos de desempenho com modelos abertos.
O artigo destaca que o MAVEN-Bench expôs a lacuna entre raciocínio parcial e sucesso completo da tarefa. Avaliações de agentes devem considerar o processo, não apenas o resultado final, aspecto ignorado por muitos benchmarks comerciais.
O sistema fortalece a pesquisa em IA soberana, permitindo que países e instituições desenvolvam assistentes de raciocínio complexo sem depender de licenças exorbitantes. A tecnologia reduz a dependência tecnológica de potências estrangeiras e democratiza o acesso à inteligência artificial avançada.
Leia também: Novo sistema de IA gera léxicos artificiais com realismo tipológico inédito
📨 Inscreva-se na Newsletter de O Cafezinho
Receba nossas análises e as principais notícias diárias do Brasil e do Sul Global.
Com informações de https://arxiv.org/.