News01 JunhoNVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente
Edição #110·1 de junho de 2026·2 min

💚NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Jensen Huang, CEO da NVIDIA, subiu ao palco da Computex em Taipei para anunciar o Nemotron 3 Ultra: um modelo de IA com 550 bilhões de parâmetros (dos quais 55 bilhões ficam ativos por vez, graças a uma técnica de esparsidade de 90%). É o maior e mais capaz modelo de pesos abertos já lançado por uma empresa americana. --- Em benchmarks, ele marcou 48 pontos no índice de inteligência da Artificial Analysis, ficando bem à frente de outros modelos abertos americanos como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). Só que, detalhe importante: o chinês Kimi K2.6 ainda lidera com 54 pontos. A corrida EUA vs China nos modelos abertos continua acirrada. --- A velocidade também impressiona: mais de 300 tokens (as unidades de texto que o modelo processa) por segundo, algo entre 3 e 6 vezes mais rápido que concorrentes chineses de porte similar. A NVIDIA promete ainda uma versão quantizada, mais leve, para rodar com desempenho ainda maior.

NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

A NVIDIA apresentou durante a Computex 2025, em Taipei, o Nemotron 3 Ultra, modelo de linguagem de 550 bilhões de parâmetros que se torna o maior sistema de weights abertos já lançado por uma empresa americana. O anúncio posiciona a companhia como protagonista na nova geração de arquiteturas de IA generativa, utilizando técnicas avançadas de esparsidade para equilibrar capacidade de processamento e eficiência computacional.

Arquitetura esparsa e economia de infraestrutura O diferencial técnico do Nemotron 3 Ultra reside na implementação de arquitetura Mixture of Experts (MoE) com 90% de esparsidade. Dos 550 bilhões de parâmetros totais, apenas 55 bilhões permanecem ativos durante cada passagem de token, reduzindo proporcionalmente a demanda por VRAM e ciclos de processamento. Para desenvolvedores brasileiros que enfrentam custos elevados de infraestrutura cloud e limitações de importação de hardware, essa abordagem representa uma redução mensurável no custo por inferência. A eficiência energética também impacta diretamente a viabilidade de deploy em edge computing e centros de dados nacionais, onde o custo do kWh frequentemente inviabiliza projetos de IA de grande porte.

Benchmarks e a corrida geopolítica Nos testes da Artificial Analysis, o modelo alcançou 48 pontos no índice de inteligência, superando concorrentes ocidentais como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). A velocidade de geração textual também se destaca: mais de 300 tokens por segundo, performance entre três e seis vezes superior a arquiteturas chinesas de similar complexidade.

Apesar do avanço americano, o cenário global mantém a China na liderança técnica absoluta em modelos abertos. O Kimi K2.6, desenvolvido pela Moonshot AI, registra 54 pontos no mesmo benchmark, mantendo vantagem mensurável em tarefas de raciocínio complexo. A lacuna de seis pontos revela uma competição acirrada, onde a esparsidade ocidental compete contra densidade computacional oriental, cada abordagem com implicações distintas para o consumo de recursos.

Implicações para builders e devs brasileiros A disponibilidade de pesos abertos sob licença americana altera o cálculo de risco para o ecossistema brasileiro de IA. Diferente de dependências técnicas em modelos chineses — sujeitos a restrições de exportação e questões de soberania de dados —, o Nemotron 3 Ultra oferece uma base segura para fine-tuning em corpora em português e implementação em ambientes on-premise via stack NVIDIA CUDA e NeMo.

A promessa de uma versão quantizada, otimizada para execução em GPUs de consumo como a RTX 4090, amplia o acesso a desenvolvedores independentes. Com suporte nativo a TensorRT e técnicas de compressão de modelo, o sistema viabiliza a criação de agentes autônomos e pipelines RAG (Retrieval-Augmented Generation) sem latência excessiva ou custos recorrentes de API, democratizando o acesso a capacidades enterprise para startups locais.

pontosnemotronultramodelobilhõesabertostécnicasesparsidadenvidiadurante

Mais da mesma edição

@sama

🤖OpenAI anuncia divisão de robótica: o objetivo é um robô pessoal para cada pessoa

Sam Altman, CEO da OpenAI, anunciou oficialmente a criação da OpenAI Robotics, uma nova divisão inteiramente dedicada a construir robôs. A equipe nasceu do programa de simulação de mundo liderado por Aditya Ramesh, o mesmo criador do DALL-E, e já está contratando engenheiros de hardware, sistemas e aprendizado de máquina. --- A visão de curto prazo é criar robôs que ajudem trabalhadores qualificados a construir infraestrutura, tipo obras e fábricas. A de longo prazo é mais ambiciosa: todo mundo ter um robô pessoal capaz de fazer qualquer coisa que você precise. Se parece ficção científica, é porque até pouco tempo era mesmo. --- O mais interessante é que a OpenAI está apostando no co-design, ou seja, desenvolver o hardware e a inteligência artificial juntos desde o início, em vez de tentar encaixar um modelo de IA num corpo mecânico depois. Faz sentido, mas a distância entre um chatbot brilhante e um robô que não tropeça na escada ainda é enorme.

@NVIDIAAI

🌍Cosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo

Ainda na Computex, a NVIDIA apresentou o Cosmos 3, que a empresa chama de primeiro "omomodelo" totalmente aberto para IA física. Traduzindo: é um modelo que consegue entender imagens, raciocinar sobre o que vê e gerar vídeos a partir disso. Tudo num pacote só, disponível em duas versões: Super (32 bilhões de parâmetros) e Nano (8 bilhões). --- A ideia é dar aos desenvolvedores uma base pronta para criar sistemas de IA que interagem com o mundo real, como robôs e veículos autônomos, sem precisar começar do zero. Os pesos do modelo e as receitas de treinamento estão disponíveis gratuitamente no Hugging Face. --- Uma demonstração mostrou o modelo transformando uma foto de dashcam num vídeo simulado de corrida de Fórmula 1, completo com som gerado pela própria IA. É bonito, mas o valor real está em aplicações industriais: simular cenários físicos antes de colocar um robô para agir no mundo de verdade.

@NVIDIARobotics

🦾NVIDIA cria design aberto de robô humanoide para pesquisa

A terceira grande aposta da NVIDIA nesta semana é o Isaac GR00T Reference Humanoid Robot, um design de referência aberto para robôs humanoides. É basicamente um kit completo: combina o corpo do robô H2 da Unitree, mãos com cinco dedos da Sharpa Robotics, o chip Jetson Thor para processamento a bordo e o software aberto GR00T da própria NVIDIA. --- Instituições como o Allen Institute for AI, a ETH Zurich, Stanford e a Universidade da Califórnia em San Diego já confirmaram que vão usar o design para pesquisa. A lógica é que, se todo mundo usar a mesma plataforma de referência, os avanços ficam mais fáceis de comparar e compartilhar. --- É curioso ver NVIDIA e OpenAI anunciando apostas em robótica na mesma semana. Uma fornece a infraestrutura de hardware e software, a outra quer colocar inteligência no corpo mecânico. Pode ser parceria, pode ser competição. Provavelmente um pouco dos dois.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter