News01 JunhoHiDream O1-Image assume liderança entre geradores de imagem abertos
Edição #110·1 de junho de 2026·2 min

🎨HiDream O1-Image assume liderança entre geradores de imagem abertos

A HiDream lançou a família O1-Image, três modelos de geração de imagem com pesos abertos sob licença MIT (ou seja, qualquer pessoa pode usar, modificar e até comercializar). O destaque é o HiDream-O1-Image-Dev-2604, que estreou como o melhor modelo aberto no ranking de geração de imagem por texto da Artificial Analysis. --- Em qualidade, ele entrega resultados comparáveis a modelos proprietários como o Seedream 4.0 da ByteDance e o FLUX.2 da Black Forest Labs. Para quem quer testar via API sem baixar nada, o modelo está disponível na plataforma Fal por 5 a 10 dólares a cada mil imagens. O interessante é que o modelo também faz edição de imagem, não só geração do zero, aceitando até 10 imagens de entrada junto com as instruções de texto.

HiDream O1-Image assume liderança entre geradores de imagem abertos

A HiDream lançou a família O1-Image, três modelos de geração de imagem com pesos abertos que assumiram a liderança do ranking de modelos abertos da Artificial Analysis. O HiDream-O1-Image-Dev-2604 estreou como o melhor modeloopen-source em geração de imagem por texto, competindo diretamente com soluções proprietárias de empresas como ByteDance e Black Forest Labs.

Pesos abertos sob licença MIT

A principal novidade é a licença MIT, que permite uso livre, modificação e comercialização sem restrições. Diferente de modelos como DALL-E ou Midjourney, que exigem acesso via API paga e impõem limitações de uso comercial, o O1-Image pode ser baixado, executado localmente e integrado a produtos próprios. Essa abordagem atraiu interesse de desenvolvedores que precisam de controle total sobre o pipeline de geração.

Qualidade comparável aos proprietários

Em testes de benchmark, o modelo entrega resultados próximos ao Seedream 4.0 da ByteDance e ao FLUX.2 da Black Forest Labs. A avaliação da Artificial Analysis, plataforma independente de análise de modelos de IA, confirmou a liderança entre os modelosabertos. O desempenho coloca o O1-Image como opção viável para projetos que antes dependiam exclusivamente de soluções proprietárias.

Geração e edição de imagem

Além da geração a partir de texto, o modelo suporta edição avançada. O sistema aceita até 10 imagens de entrada combinadas com instruções em linguagem natural, permitindo workflows mais complexos como inpainting, outpainting e manipulação de elementos específicos dentro de uma imagem existente.

Acesso e custos

Para quem prefere não gerenciar infraestrutura própria, o modelo está disponível na plataforma Fal por USD 5 a 10 por mil imagens geradas via API. Essa opção reduz a barreira de entrada para testes rápidos e prototipagem, enquanto a versão com pesos abertos permite implantações em servidores próprios ou edge devices.

O que muda para builders e devs brasileiros

O mercado brasileiro de IA tem crescido, mas a dependência de APIs externas implica custos em dólar e latência de rede. Com modelosabertos de qualidade competitiva disponíveis localmente, emerges a possibilidade de reduzir custos operacionais e personalizar soluções para casos de uso específicos — desde ferramentas de design até automação de conteúdo para e-commerce.

A liderança do HiDream O1-Image também sinaliza uma tendência: modelosopen-source estão reduzindo a distância de qualidade em relação aos proprietários. Para devs que constroem produtos com geração de imagem, a escolha entre abrir mão de controle para usar uma API pronta ou investir em infraestrutura própria tornou-se mais equilibrada.

geraçãoimagemoimagemodelosabertospesosliderançasoluçõesusoapi

Mais da mesma edição

@sama

🤖OpenAI anuncia divisão de robótica: o objetivo é um robô pessoal para cada pessoa

Sam Altman, CEO da OpenAI, anunciou oficialmente a criação da OpenAI Robotics, uma nova divisão inteiramente dedicada a construir robôs. A equipe nasceu do programa de simulação de mundo liderado por Aditya Ramesh, o mesmo criador do DALL-E, e já está contratando engenheiros de hardware, sistemas e aprendizado de máquina. --- A visão de curto prazo é criar robôs que ajudem trabalhadores qualificados a construir infraestrutura, tipo obras e fábricas. A de longo prazo é mais ambiciosa: todo mundo ter um robô pessoal capaz de fazer qualquer coisa que você precise. Se parece ficção científica, é porque até pouco tempo era mesmo. --- O mais interessante é que a OpenAI está apostando no co-design, ou seja, desenvolver o hardware e a inteligência artificial juntos desde o início, em vez de tentar encaixar um modelo de IA num corpo mecânico depois. Faz sentido, mas a distância entre um chatbot brilhante e um robô que não tropeça na escada ainda é enorme.

@ArtificialAnlys

💚NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Jensen Huang, CEO da NVIDIA, subiu ao palco da Computex em Taipei para anunciar o Nemotron 3 Ultra: um modelo de IA com 550 bilhões de parâmetros (dos quais 55 bilhões ficam ativos por vez, graças a uma técnica de esparsidade de 90%). É o maior e mais capaz modelo de pesos abertos já lançado por uma empresa americana. --- Em benchmarks, ele marcou 48 pontos no índice de inteligência da Artificial Analysis, ficando bem à frente de outros modelos abertos americanos como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). Só que, detalhe importante: o chinês Kimi K2.6 ainda lidera com 54 pontos. A corrida EUA vs China nos modelos abertos continua acirrada. --- A velocidade também impressiona: mais de 300 tokens (as unidades de texto que o modelo processa) por segundo, algo entre 3 e 6 vezes mais rápido que concorrentes chineses de porte similar. A NVIDIA promete ainda uma versão quantizada, mais leve, para rodar com desempenho ainda maior.

@NVIDIAAI

🌍Cosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo

Ainda na Computex, a NVIDIA apresentou o Cosmos 3, que a empresa chama de primeiro "omomodelo" totalmente aberto para IA física. Traduzindo: é um modelo que consegue entender imagens, raciocinar sobre o que vê e gerar vídeos a partir disso. Tudo num pacote só, disponível em duas versões: Super (32 bilhões de parâmetros) e Nano (8 bilhões). --- A ideia é dar aos desenvolvedores uma base pronta para criar sistemas de IA que interagem com o mundo real, como robôs e veículos autônomos, sem precisar começar do zero. Os pesos do modelo e as receitas de treinamento estão disponíveis gratuitamente no Hugging Face. --- Uma demonstração mostrou o modelo transformando uma foto de dashcam num vídeo simulado de corrida de Fórmula 1, completo com som gerado pela própria IA. É bonito, mas o valor real está em aplicações industriais: simular cenários físicos antes de colocar um robô para agir no mundo de verdade.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter