News01 JulhoGoogle lança modelo para gerar e editar vídeos por texto
Edição #140·1 de julho de 2026·2 min

🎬Google lança modelo para gerar e editar vídeos por texto

O Google apresentou o Gemini Omni Flash, um modelo focado em geração de vídeo com edição por conversa. A proposta é diferente de simplesmente gerar um vídeo a partir de um texto: você pode ir refinando o resultado com instruções em linguagem natural, como se estivesse dando feedback para um editor humano. Pediu um vídeo e ficou escuro demais? É só dizer "mais claro" que o modelo ajusta. --- O modelo foi desenhado para ser eficiente em custo, seguindo a linha Flash do Google, que sempre priorizou velocidade e preço baixo. Ele já está disponível para desenvolvedores no AI Studio e na API do Gemini, o que significa que pode ser integrado em aplicativos e plataformas de terceiros a partir de hoje. --- O mercado de geração de vídeo por IA está ficando lotado, com concorrentes como Sora da OpenAI, Runway e Kling disputando espaço. A aposta do Google no aspecto conversacional da edição pode ser o diferencial que faltava para tornar a ferramenta útil no dia a dia, e não só para demonstrações impressionantes.

O que muda com o Gemini Omni Flash

O Google lançou o Gemini Omni Flash, modelo focado em geração de vídeo com edição por conversa. A principal diferença para ferramentas existentes é a possibilidade de refinar resultados usando instruções em linguagem natural, como se você dialogasse com um editor humano.

Como funciona a edição conversacional

Em vez de gerar um vídeo e precisar recomeçar do zero quando algo não sai como esperado, o usuário pode interagir com o modelo para ajustes específicos. Se o vídeo ficou escuro demais, basta digitar "mais claro" para que o modelo ajuste a iluminação. Essa abordagem conversacional elimina a necessidade de промпts complexos e repetidos para достичь o resultado desejado.

O modelo foi desenvolvido com foco em eficiência de custo, seguindo a linha Flash que o Google utiliza para priorizar velocidade e preço baixo. Ele já está disponível para desenvolvedores no AI Studio e na API do Gemini, permitindo integração em aplicativos e plataformas de terceiros.

Por que devs brasileiros devem prestar atenção

Para desenvolvedores que constroem ferramentas de criação de conteúdo, o Gemini Omni Flash oferece uma alternativa viável economicamente. A API acessível permite implementar funcionalidades de geração de vídeo em aplicativos sem os custos prohibitivos de modelos maiores.

O mercado brasileiro de apps e plataformas digitais tem crescido em demanda por ferramentas de IA generativa. Ter acesso a uma API de vídeo conversacional abre possibilidades para:

  • Aplicativos de marketing que geram vídeos promocionais customizáveis
  • Plataformas de educação que precisam de visualizações dinâmicas
  • Ferramentas de automação de conteúdo para redes sociais

O cenário competitivo

O mercado de geração de vídeo por IA está cada vez mais disputado. A OpenAI tem o Sora, a Runway mantém suas ferramentas estabelecidas, e a Kling também disputa espaço. A aposta do Google no aspecto conversacional da edição pode ser o diferencial que faltava para tornar a tecnologia útil no dia a dia de produção de conteúdo, e não apenas para demonstrações impressionantes.

A disponibilidade imediata via API é um ponto relevante: enquanto concorrentes ainda limitam acesso ou mantêm versões de teste, o Gemini Omni Flash já pode ser integrado em produção. Para devs brasileiros que buscam adicionar capacidades de vídeo por IA em seus projetos, a hora de testar e prototipar é agora.

vídeogeminiflashferramentasomnimodeloconversacionalapigooglegeração

Mais da mesma edição

@ClaudeDevs

🧠Claude Sonnet 5 é o novo modelo padrão da Anthropic

A Anthropic lançou o Claude Sonnet 5, que a empresa descreve como o Sonnet mais autônomo até agora. Ele faz planos, usa ferramentas como navegadores e terminais, e trabalha sozinho em tarefas que, poucos meses atrás, só os modelos maiores e mais caros conseguiam resolver. O modelo já vem com uma janela de contexto de 1 milhão de tokens, a unidade que mede quanta informação a IA consegue processar de uma vez. --- Na prática, quem usa o Claude Code, a ferramenta de programação da Anthropic, já recebe o Sonnet 5 como modelo padrão no plano Pro. Ele também está disponível na API e nos agentes gerenciados da plataforma. A aposta da Anthropic é clara: entregar capacidade de modelo topo de linha, mas no preço intermediário do Sonnet, que sempre foi a opção custo-benefício da casa. --- É um movimento esperto. Em vez de obrigar todo mundo a pagar pelo modelo mais caro, a Anthropic está empurrando a inteligência para baixo na escala de preço. Quem estava em cima do muro para experimentar agentes autônomos agora tem menos desculpa.

@AnthropicAI

🔓EUA liberam exportação do Fable 5 e Mythos 5, mas há um porém

O Departamento de Comércio dos Estados Unidos retirou os controles de exportação sobre os modelos Claude Fable 5 e Mythos 5. A Anthropic informou que vai restaurar o acesso a partir de amanhã. Para quem não acompanhou, esses modelos haviam sido barrados para uso fora dos EUA por questões regulatórias, o que gerou frustração em desenvolvedores do mundo inteiro. --- Só que nem tudo são flores. Como observou o desenvolvedor Theo Browne, o Fable 5 será incluído no limite semanal de uso gratuito por até 50% da cota, mas apenas até 7 de julho. Depois disso, o acesso passa a depender de créditos pagos. Ou seja: dá para experimentar agora, mas não conte com isso de graça para sempre. --- O episódio é um lembrete de que modelos de IA de ponta estão cada vez mais sujeitos a geopolítica. Não basta uma empresa querer distribuir sua tecnologia: governos decidem quem pode ou não usar. Isso muda a conversa sobre dependência de fornecedores de IA de forma concreta.

@ChatGPTapp

💰ChatGPT agora acessa suas contas bancárias nos EUA

A OpenAI liberou um recurso de finanças pessoais dentro do ChatGPT para assinantes Plus nos Estados Unidos. A ideia é simples: você conecta suas contas financeiras de forma segura, e a IA consegue responder perguntas sobre para onde seu dinheiro está indo. Pense naquele extrato bancário confuso que ninguém lê, só que agora você pergunta em português o que aconteceu. --- O recurso já estava disponível para usuários Pro como prévia e agora chega a um público maior. A promessa é mostrar o panorama financeiro completo do usuário, com respostas baseadas nos dados que ele escolhe compartilhar. A OpenAI reforça que a conexão é segura e que o usuário controla o que a IA pode ver. --- É o tipo de funcionalidade que pode ser genuinamente útil, mas também levanta uma pergunta inevitável: você confia o bastante numa IA para dar acesso ao seu extrato bancário? A comodidade é real, o desconforto também.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter