China avança com IA barata que o DeepSeek e desafia o Ocidente

O mais recente modelo de IA da China afirma ser ainda mais barato de usar do que o DeepSeek / Getty

Mais leve, mais barato e de código aberto, o novo modelo da Z.ai promete transformar o mercado de IA global e ampliar a autonomia tecnológica da China


O cenário da inteligência artificial (IA) ganhou um novo e poderoso concorrente vindo da China. A startup Z.ai, anteriormente conhecida como Zhipu AI, anunciou nesta segunda-feira (28) o lançamento de seu mais recente modelo de linguagem, o GLM-4.5, que promete não apenas superar rivais internacionais em desempenho, mas também oferecer uma alternativa significativamente mais barata de utilizar.

A novidade chega em um momento crucial para o setor, quando empresas ao redor do mundo buscam soluções de IA mais acessíveis e eficientes. O GLM-4.5, segundo a própria desenvolvedora, custa menos para operar do que o DeepSeek, um dos modelos mais promissores da atualidade, e ainda traz inovações tecnológicas que podem redesenhar o futuro da computação cognitiva.

Assim como seu principal concorrente, o novo modelo da Z.ai é de código aberto, ou seja, pode ser baixado e utilizado gratuitamente por desenvolvedores e empresas ao redor do mundo. Essa estratégia tem se mostrado cada vez mais eficaz para acelerar a adoção e fomentar a inovação em escala global.

Tecnologia avançada com menor custo

Uma das principais vantagens do GLM-4.5 é sua eficiência operacional. Com cerca da metade do tamanho do modelo DeepSeek, o GLM-4.5 precisa de apenas oito chips Nvidia H20 para funcionar — um número consideravelmente menor do que o exigido pela concorrência. O chip H20 é uma versão adaptada pela Nvidia especificamente para o mercado chinês, criada para contornar as restrições de exportação impostas pelos Estados Unidos.

Zhang Peng, CEO da Z.ai, revelou à CNBC que a empresa já possui capacidade computacional suficiente para atender à demanda atual. “Não precisamos comprar mais chips por enquanto”, afirmou, sem divulgar o valor investido no treinamento do modelo. Segundo ele, detalhes financeiros serão revelados em breve.

A eficiência do novo modelo também se reflete nos custos de uso. A Z.ai anunciou que cobrará 11 centavos por milhão de tokens de entrada — unidade de medida usada para quantificar dados processados por modelos de IA — contra 14 centavos cobrados pelo DeepSeek R1. Na saída de dados, a diferença é ainda mais expressiva: 28 centavos por milhão de tokens contra US$ 2,19 do concorrente.

Inovação tecnológica chinesa

O GLM-4.5 se diferencia pela abordagem tecnológica utilizada. Ao contrário dos modelos tradicionais de IA, ele é baseado no conceito de inteligência “agentical”, que permite ao sistema dividir automaticamente tarefas complexas em subtarefas menores, executando-as com maior precisão e eficiência. Essa abordagem pode representar um avanço significativo na capacidade dos sistemas de IA de lidar com problemas multifacetados de forma autônoma.

A estratégia de tornar o modelo acessível e de código aberto coloca a Z.ai na vanguarda da corrida tecnológica. A empresa, fundada em 2019, já arrecadou mais de US$ 1,5 bilhão em investimentos de gigantes como Alibaba, Tencent e Qiming Venture Partners. Fundos apoiados pela Aramco e governos municipais de Hangzhou e Chengdu também fazem parte do grupo de investidores.

Concorrência acirrada no mercado global

O lançamento do GLM-4.5 acontece poucas semanas após outros importantes anúncios do setor na China. No início do mês, a Moonshot AI, apoiada pelo Alibaba, apresentou o Kimi K2, que se mostrou superior ao ChatGPT da OpenAI e ao Claude da Anthropic em tarefas específicas de programação. O modelo cobra 15 centavos por milhão de tokens de entrada e US$ 2,50 por milhão de tokens de saída.

Durante a Conferência Mundial de Inteligência Artificial em Xangai, que começou no último sábado (26), a Tencent revelou o HunyuanWorld-1.0, um modelo especializado em geração de cenas tridimensionais para desenvolvimento de jogos. Já a Alibaba apresentou o Qwen3-Coder, focado em escrita de código de computador.

Essa onda de inovações não passou despercebida pelos Estados Unidos. Em junho, a OpenAI mencionou a Zhipu (atual Z.ai) em um alerta sobre o rápido progresso da IA chinesa. O governo americano também adicionou a startup à sua lista de entidades restritas, limitando o acesso de empresas norte-americanas a seus serviços e tecnologias.

Desafios geopolíticos e oportunidades

A crescente capacidade da China de desenvolver modelos de IA avançados independentemente das restrições tecnológicas impostas pelos EUA representa um marco importante na geopolítica da tecnologia. A adaptação dos chips Nvidia para o mercado chinês demonstra como as empresas conseguem contornar barreiras comerciais através da inovação e parcerias estratégicas.

Para especialistas, essa tendência indica que a estratégia de restrição de tecnologia pode não ser suficiente para conter o avanço chinês no setor. “Negar os chips não funciona”, afirmou recentemente um analista do CSIS (Center for Strategic and International Studies) em entrevista à CNBC, referindo-se à abordagem dos EUA para controlar o acesso a tecnologias de ponta.

Com planos de realizar uma oferta pública inicial na Grande China, a Z.ai está posicionada para se tornar uma das principais players globais do setor. O lançamento do GLM-4.5 não apenas reforça essa ambição, mas também demonstra que a corrida pela liderança em inteligência artificial está longe de terminar — e que a China está mais preparada do que nunca para disputar o pódio.

DeepSeek: promessas de IA revolucionária dividem especialistas e abalam mercados

A revelação do novo modelo de inteligência artificial da empresa chinesa DeepSeek gerou uma onda de entusiasmo e preocupação global. A empresa afirma que seu modelo R1 supera o recente o1 da OpenAI em tarefas complexas de raciocínio, ao mesmo tempo em que custaria uma fração do preço para ser desenvolvido. No entanto, essas alegações ousadas dividiram especialistas e investidores, desencadeando uma reação acelerada nos mercados financeiros.

Na última segunda-feira (29), as ações da Nvidia, principal fornecedora de chips usados para treinar modelos de IA, despencaram, perdendo cerca de US$ 600 bilhões em valor de mercado — o maior recalque de um único dia na história dos Estados Unidos. O susto dos investidores reflete a percepção de que a tecnologia apresentada pela DeepSeek poderia desestabilizar o domínio tecnológico e comercial dos gigantes de IA ocidentais.

Um modelo promissor, mas cercado de dúvidas

O DeepSeek R1 é um modelo de “raciocínio”, projetado para decompor problemas complexos em etapas menores antes de formular uma resposta, similar à forma como humanos pensam. Segundo benchmarks divulgados pela própria empresa, o R1 teria desempenho comparável ao o1 da OpenAI em testes como AIME 2024, Codeforces e GPQA Diamond.

A empresa chinesa também divulgou os custos associados ao uso do modelo. O R1 custaria 55 centavos por 1 milhão de tokens de entrada (a unidade básica de texto processada) e US$ 2,19 por 1 milhão de tokens de saída. Em comparação, o o1 da OpenAI é cobrado a US$ 15 e US$ 60, respectivamente, para entrada e saída. Mesmo comparado ao modelo mais econômico da OpenAI, o GPT-4o mini, o DeepSeek R1 ainda aparece como significativamente mais barato.

O coração da polêmica está no custo de treinamento do modelo subjacente, o V3. A DeepSeek afirma ter gastado apenas US$ 5,6 milhões — uma fração dos bilhões investidos por empresas como OpenAI e Anthropic. Se confirmado, esse dado representaria uma mudança de paradigma na economia da IA.

Ceticismo sobre os números e origem da tecnologia

Apesar do potencial demonstrado, muitos especialistas pedem cautela. Daniel Newman, CEO da The Futurum Group, destacou a importância dos avanços, mas ressaltou a falta de clareza sobre os custos totais. “Acredito que os avanços do DeepSeek indicam uma mudança significativa nas leis de escalonamento e são uma necessidade real. Dito isso, ainda há muitas perguntas e incertezas em torno do panorama geral dos custos no que se refere ao desenvolvimento do DeepSeek,” afirmou.

Paul Triolio, da DGA Group, pontuou que o valor divulgado de US$ 5,6 milhões refere-se apenas a uma única execução de treinamento, e não ao custo total de pesquisa e desenvolvimento. “O custo total naquela época era provavelmente significativamente maior, mas ainda menor do que o valor gasto pelas principais empresas de IA dos EUA,” disse.

Outra questão levantada é como a DeepSeek conseguiu desenvolver um modelo tão avançado apesar das restrições de exportação de chips de ponta impostas pelos EUA à China. A empresa afirma ter usado chips mais antigos, como os Nvidia H800 e A100. No entanto, o CEO da Scale AI, Alexandr Wang, afirmou acreditar que chips proibidos foram utilizados, acusação negada pela própria DeepSeek. A Nvidia, por sua vez, declarou que as GPUs usadas eram totalmente compatíveis com exportação.

Alguns investidores, como o bilionário Vinod Khosla, chegaram a sugerir que a DeepSeek pode ter usado dados de saída da OpenAI para treinar seu modelo, através de um processo chamado “destilação”. A OpenAI confirmou à CNBC que está investigando esses relatos e reforçou seu compromisso em proteger sua tecnologia junto ao governo americano.

O impacto da abertura e o futuro da IA

Independentemente das controvérsias em torno dos custos e da origem dos chips, especialistas concordam que o DeepSeek representa um avanço notável para a indústria. Seu modelo de código aberto permite que desenvolvedores ao redor do mundo o acessem, modifiquem e integrem em suas próprias aplicações, acelerando a inovação.

Yann LeCun, cientista-chefe de IA do Facebook (Meta), destacou que o sucesso do DeepSeek é mais um triunfo do modelo de código aberto do que necessariamente da China sobre os EUA. “O DeepSeek se beneficiou da pesquisa aberta e do código aberto (por exemplo, PyTorch e Llama, do Meta). Eles criaram novas ideias e as desenvolveram com base no trabalho de outras pessoas. Como o trabalho deles é publicado e de código aberto, todos podem lucrar com ele. Esse é o poder da pesquisa aberta e do código aberto,” declarou.

Fundada em 2023 pelo cofundador do fundo de hedge High-Flyer, Liang Wenfeng, a DeepSeek tem como objetivo alcançar a chamada Inteligência Artificial Geral (AGI), capaz de superar o intelecto humano em uma ampla gama de tarefas. Embora o conceito de AGI ainda seja vago e distante, os passos dados pela empresa indicam que a corrida rumo a esse objetivo está ganhando velocidade — e contando com novos e poderosos competidores.

Com informações de CNBC*

Redação:
Related Post

Privacidade e cookies: Este site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.