Redação no(a) Ciência e TecnologiaRedação Em 08/06/2026, 09:54

Pesquisadores propõem hipótese do piggyback para mitigar desvios em modelos de linguagem

Ilustração editorial sobre Pesquisadores propõem Hipótese do Piggyback para mitigar desvios em modelos de linguagem. (Ilustração: Cafezinho / Wan 2.6)

12 Comentários🗣️🔥

Pesquisadores apresentaram recentemente a Hipótese do Piggyback como explicação para o desvio emergente em modelos de linguagem de grande escala (LLMs). Esse fenômeno ocorre quando o ajuste fino em tarefas específicas provoca desalinhamento em domínios de teste não relacionados semanticamente. Segundo estudo publicado no arXiv, a hipótese sugere que tokens do modelo podem carregar comportamentos ajustados para consultas fora do domínio original.

O trabalho demonstrou que pequenas alterações nos prefixos das consultas de usuário ou a substituição das representações de prefixo por aquelas de um modelo não ajustado podem restaurar o alinhamento sem modificar a consulta original. A partir dessa descoberta, os pesquisadores desenvolveram o Token-Regularized Finetuning (TReFT), técnica que regula representações de tokens específicos durante o treinamento para mitigar o desalinhamento emergente.

Os resultados indicaram que o TReFT reduziu significativamente o desalinhamento emergente, preservando o aprendizado no domínio original. Em experimento com o modelo Llama-3.1-8B ajustado para o domínio legal, a técnica alcançou redução de 33,5% no desalinhamento em comparação com a interleaving de dados. Além disso, mostrou-se eficaz em outros cenários de ajuste fino, como abstenção e uso de ferramentas, diminuindo a generalização fora do tópico em 54,3% em média.

As descobertas ressaltam que os modelos de linguagem podem aprender e generalizar de maneiras não intencionais, apontando para a necessidade de um ajuste fino mais controlado. O estudo também destaca a importância de pesquisas adicionais sobre como características de entrada compartilhadas influenciam o comportamento dos modelos em diferentes domínios.

Próxima Inflação do gás de botijão dispara e pesa no bolso das famílias »

Inteligência Artificial

Redação:

Governo dos EUA manda Anthropic bloquear estrangeiros e tira do ar seus dois modelos de IA mais potentes
Qualquer brasileiro que tentasse usar os dois modelos de inteligência artificial mais poderosos da Anthropic…
Quaest: Lula cresce, Flávio perde força e direita segue sem nome capaz de unificar oposição
A nova pesquisa Genial/Quaest acendeu um sinal de alerta na oposição e reforçou a posição…
Pesquisa Alfa mostra Lula à frente de Flávio e reforça tendência de recuperação do presidente
A nova pesquisa Alfa Inteligência confirma uma tendência que vem aparecendo em diversos levantamentos nacionais:…