🎬Google lança modelo para gerar e editar vídeos por texto
O Google apresentou o Gemini Omni Flash, um modelo focado em geração de vídeo com edição por conversa. A proposta é diferente de simplesmente gerar um vídeo a partir de um texto: você pode ir refinando o resultado com instruções em linguagem natural, como se estivesse dando feedback para um editor humano. Pediu um vídeo e ficou escuro demais? É só dizer "mais claro" que o modelo ajusta. --- O modelo foi desenhado para ser eficiente em custo, seguindo a linha Flash do Google, que sempre priorizou velocidade e preço baixo. Ele já está disponível para desenvolvedores no AI Studio e na API do Gemini, o que significa que pode ser integrado em aplicativos e plataformas de terceiros a partir de hoje. --- O mercado de geração de vídeo por IA está ficando lotado, com concorrentes como Sora da OpenAI, Runway e Kling disputando espaço. A aposta do Google no aspecto conversacional da edição pode ser o diferencial que faltava para tornar a ferramenta útil no dia a dia, e não só para demonstrações impressionantes.
O Google apresentou o Gemini Omni Flash, um modelo focado em geração de vídeo com edição por conversa. A proposta é diferente de simplesmente gerar um vídeo a partir de um texto: você pode ir refinando o resultado com instruções em linguagem natural, como se estivesse dando feedback para um editor humano. Pediu um vídeo e ficou escuro demais? É só dizer "mais claro" que o modelo ajusta.
— @GoogleAIStudio View on X
O que muda com o Gemini Omni Flash
O Google lançou o Gemini Omni Flash, modelo focado em geração de vídeo com edição por conversa. A principal diferença para ferramentas existentes é a possibilidade de refinar resultados usando instruções em linguagem natural, como se você dialogasse com um editor humano.
Como funciona a edição conversacional
Em vez de gerar um vídeo e precisar recomeçar do zero quando algo não sai como esperado, o usuário pode interagir com o modelo para ajustes específicos. Se o vídeo ficou escuro demais, basta digitar "mais claro" para que o modelo ajuste a iluminação. Essa abordagem conversacional elimina a necessidade de промпts complexos e repetidos para достичь o resultado desejado.
O modelo foi desenvolvido com foco em eficiência de custo, seguindo a linha Flash que o Google utiliza para priorizar velocidade e preço baixo. Ele já está disponível para desenvolvedores no AI Studio e na API do Gemini, permitindo integração em aplicativos e plataformas de terceiros.
Por que devs brasileiros devem prestar atenção
Para desenvolvedores que constroem ferramentas de criação de conteúdo, o Gemini Omni Flash oferece uma alternativa viável economicamente. A API acessível permite implementar funcionalidades de geração de vídeo em aplicativos sem os custos prohibitivos de modelos maiores.
O mercado brasileiro de apps e plataformas digitais tem crescido em demanda por ferramentas de IA generativa. Ter acesso a uma API de vídeo conversacional abre possibilidades para:
- Aplicativos de marketing que geram vídeos promocionais customizáveis
- Plataformas de educação que precisam de visualizações dinâmicas
- Ferramentas de automação de conteúdo para redes sociais
O cenário competitivo
O mercado de geração de vídeo por IA está cada vez mais disputado. A OpenAI tem o Sora, a Runway mantém suas ferramentas estabelecidas, e a Kling também disputa espaço. A aposta do Google no aspecto conversacional da edição pode ser o diferencial que faltava para tornar a tecnologia útil no dia a dia de produção de conteúdo, e não apenas para demonstrações impressionantes.
A disponibilidade imediata via API é um ponto relevante: enquanto concorrentes ainda limitam acesso ou mantêm versões de teste, o Gemini Omni Flash já pode ser integrado em produção. Para devs brasileiros que buscam adicionar capacidades de vídeo por IA em seus projetos, a hora de testar e prototipar é agora.