News01 JunhoCosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo
Edição #110·1 de junho de 2026·2 min

🌍Cosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo

Ainda na Computex, a NVIDIA apresentou o Cosmos 3, que a empresa chama de primeiro "omomodelo" totalmente aberto para IA física. Traduzindo: é um modelo que consegue entender imagens, raciocinar sobre o que vê e gerar vídeos a partir disso. Tudo num pacote só, disponível em duas versões: Super (32 bilhões de parâmetros) e Nano (8 bilhões). --- A ideia é dar aos desenvolvedores uma base pronta para criar sistemas de IA que interagem com o mundo real, como robôs e veículos autônomos, sem precisar começar do zero. Os pesos do modelo e as receitas de treinamento estão disponíveis gratuitamente no Hugging Face. --- Uma demonstração mostrou o modelo transformando uma foto de dashcam num vídeo simulado de corrida de Fórmula 1, completo com som gerado pela própria IA. É bonito, mas o valor real está em aplicações industriais: simular cenários físicos antes de colocar um robô para agir no mundo de verdade.

A NVIDIA apresentou na Computex 2025 o Cosmos 3, modelo de inteligência artificial que unifica compreensão visual, raciocínio e geração de vídeo em uma única arquitetura. Disponibilizado como open source, o sistema representa uma mudança de paradigma para desenvolvedores que trabalham com robótica e veículos autônomos, eliminando a necessidade de integrar múltiplos modelos especializados para criar agentes que interagem com o mundo físico.

Arquitetura unificada para IA física

O Cosmos 3 é classificado pela NVIDIA como o primeiro "omomodelo" aberto para IA física. Diferente de pipelines tradicionais que separam visão computacional, processamento de linguagem e geração multimodal, esta arquitetura consolida essas capacidades em um único sistema. O modelo processa entradas visuais, executa raciocínio espacial e temporal, e gera predições de cenários físicos, funcionando essencialmente como um *world model* para simulação de ambientes reais.

A disponibilização inclui pesos do modelo e receitas de treinamento completas no Hugging Face, permitindo *fine-tuning* para aplicações específicas sem dependência de APIs proprietárias.

Variações para cloud e edge

A NVIDIA disponibiliza duas configurações distintas:

  • **Cosmos 3 Super**: 32 bilhões de parâmetros, voltado para treinamento e simulação em infraestrutura de cloud
  • **Cosmos 3 Nano**: 8 bilhões de parâmetros, otimizado para deploy em dispositivos edge e robôs com recursos computacionais limitados

Essa segmentação permite que desenvolvedores brasileiros experimentem em servidores locais ou na nuvem AWS/Azure, mas também embarquem o modelo diretamente em hardware de robótica industrial.

Do laboratório à indústria

A demonstração da NVIDIA mostrou o modelo convertendo uma imagem estática de dashcam em uma sequência de vídeo de corrida de Fórmula 1 com áudio sintetizado. Embora visualmente impactante, o caso de uso estratégico reside na simulação de física para testes de segurança.

Empresas de logística e manufatura podem utilizar o Cosmos 3 para gerar milhares de cenários adversos — obstáculos inesperados em armazéns, condições climáticas extremas — antes de colocar robôs autônomos em operação real. Isso reduz custos de testes de campo e acelera ciclos de desenvolvimento de sistemas de navegação autônoma.

Para o ecossistema brasileiro de startups de robótica e computação em nuvem, o acesso gratuito a um *world model* de alta fidelidade remove barreiras históricas de licenciamento e infraestrutura, permitindo prototipagem de soluções de IA física sem investimento inicial em GPUs de última geração para treinamento do zero.

cosmosmodelonvidiafísicageraçãoarquiteturarobóticasimulaçãotreinamentoraciocínio

Mais da mesma edição

@sama

🤖OpenAI anuncia divisão de robótica: o objetivo é um robô pessoal para cada pessoa

Sam Altman, CEO da OpenAI, anunciou oficialmente a criação da OpenAI Robotics, uma nova divisão inteiramente dedicada a construir robôs. A equipe nasceu do programa de simulação de mundo liderado por Aditya Ramesh, o mesmo criador do DALL-E, e já está contratando engenheiros de hardware, sistemas e aprendizado de máquina. --- A visão de curto prazo é criar robôs que ajudem trabalhadores qualificados a construir infraestrutura, tipo obras e fábricas. A de longo prazo é mais ambiciosa: todo mundo ter um robô pessoal capaz de fazer qualquer coisa que você precise. Se parece ficção científica, é porque até pouco tempo era mesmo. --- O mais interessante é que a OpenAI está apostando no co-design, ou seja, desenvolver o hardware e a inteligência artificial juntos desde o início, em vez de tentar encaixar um modelo de IA num corpo mecânico depois. Faz sentido, mas a distância entre um chatbot brilhante e um robô que não tropeça na escada ainda é enorme.

@ArtificialAnlys

💚NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Jensen Huang, CEO da NVIDIA, subiu ao palco da Computex em Taipei para anunciar o Nemotron 3 Ultra: um modelo de IA com 550 bilhões de parâmetros (dos quais 55 bilhões ficam ativos por vez, graças a uma técnica de esparsidade de 90%). É o maior e mais capaz modelo de pesos abertos já lançado por uma empresa americana. --- Em benchmarks, ele marcou 48 pontos no índice de inteligência da Artificial Analysis, ficando bem à frente de outros modelos abertos americanos como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). Só que, detalhe importante: o chinês Kimi K2.6 ainda lidera com 54 pontos. A corrida EUA vs China nos modelos abertos continua acirrada. --- A velocidade também impressiona: mais de 300 tokens (as unidades de texto que o modelo processa) por segundo, algo entre 3 e 6 vezes mais rápido que concorrentes chineses de porte similar. A NVIDIA promete ainda uma versão quantizada, mais leve, para rodar com desempenho ainda maior.

@NVIDIARobotics

🦾NVIDIA cria design aberto de robô humanoide para pesquisa

A terceira grande aposta da NVIDIA nesta semana é o Isaac GR00T Reference Humanoid Robot, um design de referência aberto para robôs humanoides. É basicamente um kit completo: combina o corpo do robô H2 da Unitree, mãos com cinco dedos da Sharpa Robotics, o chip Jetson Thor para processamento a bordo e o software aberto GR00T da própria NVIDIA. --- Instituições como o Allen Institute for AI, a ETH Zurich, Stanford e a Universidade da Califórnia em San Diego já confirmaram que vão usar o design para pesquisa. A lógica é que, se todo mundo usar a mesma plataforma de referência, os avanços ficam mais fáceis de comparar e compartilhar. --- É curioso ver NVIDIA e OpenAI anunciando apostas em robótica na mesma semana. Uma fornece a infraestrutura de hardware e software, a outra quer colocar inteligência no corpo mecânico. Pode ser parceria, pode ser competição. Provavelmente um pouco dos dois.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter