NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Jensen Huang, CEO da NVIDIA, subiu ao palco da Computex em Taipei para anunciar o Nemotron 3 Ultra: um modelo de IA com 550 bilhões de parâmetros (dos quais 55 bilhões ficam ativos por vez, graças a uma técnica de esparsidade de 90%). É o maior e mais capaz modelo de pesos abertos já lançado por uma empresa americana. --- Em benchmarks, ele marcou 48 pontos no índice de inteligência da Artificial Analysis, ficando bem à frente de outros modelos abertos americanos como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). Só que, detalhe importante: o chinês Kimi K2.6 ainda lidera com 54 pontos. A corrida EUA vs China nos modelos abertos continua acirrada. --- A velocidade também impressiona: mais de 300 tokens (as unidades de texto que o modelo processa) por segundo, algo entre 3 e 6 vezes mais rápido que concorrentes chineses de porte similar. A NVIDIA promete ainda uma versão quantizada, mais leve, para rodar com desempenho ainda maior.

A NVIDIA apresentou durante a Computex 2025, em Taipei, o Nemotron 3 Ultra, modelo de linguagem de 550 bilhões de parâmetros que se torna o maior sistema de weights abertos já lançado por uma empresa americana. O anúncio posiciona a companhia como protagonista na nova geração de arquiteturas de IA generativa, utilizando técnicas avançadas de esparsidade para equilibrar capacidade de processamento e eficiência computacional.

Arquitetura esparsa e economia de infraestrutura O diferencial técnico do Nemotron 3 Ultra reside na implementação de arquitetura Mixture of Experts (MoE) com 90% de esparsidade. Dos 550 bilhões de parâmetros totais, apenas 55 bilhões permanecem ativos durante cada passagem de token, reduzindo proporcionalmente a demanda por VRAM e ciclos de processamento. Para desenvolvedores brasileiros que enfrentam custos elevados de infraestrutura cloud e limitações de importação de hardware, essa abordagem representa uma redução mensurável no custo por inferência. A eficiência energética também impacta diretamente a viabilidade de deploy em edge computing e centros de dados nacionais, onde o custo do kWh frequentemente inviabiliza projetos de IA de grande porte.

Benchmarks e a corrida geopolítica Nos testes da Artificial Analysis, o modelo alcançou 48 pontos no índice de inteligência, superando concorrentes ocidentais como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). A velocidade de geração textual também se destaca: mais de 300 tokens por segundo, performance entre três e seis vezes superior a arquiteturas chinesas de similar complexidade.

Apesar do avanço americano, o cenário global mantém a China na liderança técnica absoluta em modelos abertos. O Kimi K2.6, desenvolvido pela Moonshot AI, registra 54 pontos no mesmo benchmark, mantendo vantagem mensurável em tarefas de raciocínio complexo. A lacuna de seis pontos revela uma competição acirrada, onde a esparsidade ocidental compete contra densidade computacional oriental, cada abordagem com implicações distintas para o consumo de recursos.

Implicações para builders e devs brasileiros A disponibilidade de pesos abertos sob licença americana altera o cálculo de risco para o ecossistema brasileiro de IA. Diferente de dependências técnicas em modelos chineses — sujeitos a restrições de exportação e questões de soberania de dados —, o Nemotron 3 Ultra oferece uma base segura para fine-tuning em corpora em português e implementação em ambientes on-premise via stack NVIDIA CUDA e NeMo.

A promessa de uma versão quantizada, otimizada para execução em GPUs de consumo como a RTX 4090, amplia o acesso a desenvolvedores independentes. Com suporte nativo a TensorRT e técnicas de compressão de modelo, o sistema viabiliza a criação de agentes autônomos e pipelines RAG (Retrieval-Augmented Generation) sem latência excessiva ou custos recorrentes de API, democratizando o acesso a capacidades enterprise para startups locais.

💚NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Mais da mesma edição

🤖OpenAI anuncia divisão de robótica: o objetivo é um robô pessoal para cada pessoa

🌍Cosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo

🦾NVIDIA cria design aberto de robô humanoide para pesquisa

Receba no seu email