News02 MaioNovo Gemini Flash aparece em testes e impressiona
Edição #81·2 de maio de 2026·2 min

🔬Novo Gemini Flash aparece em testes e impressiona

Uma nova versão do Gemini Flash do Google foi detectada no LM Arena, a plataforma aberta de comparação de modelos. E a diferença é grande: a qualidade está dois patamares acima da versão atual, mais perto do Gemini 3.1 Pro do que do Flash que conhecemos hoje. --- Clientes do Google Cloud já receberam um email avisando que o Gemini Flash 2 será aposentado, com transição para o "Gemini 3.1 Flash Lite". Com o Google I/O a 18 dias de distância, tudo indica que novidades fortes vêm aí. --- Para quem usa modelos mais leves no dia a dia, essa notícia é excelente. Um Flash com qualidade próxima do Pro, mantendo o preço baixo, muda o cálculo de custo-benefício de muita coisa.

Novo Gemini Flash aparece em testes e impressiona

O Google está preparando o lançamento do **Gemini 3.1 Flash Lite**, modelo que apresenta ganho de performance equivalente a duas gerações na família Flash. A informação vem de testes públicos no LM Arena (Chatbot Arena) e de comunicação oficial enviada a clientes do Vertex AI, indicando que a transição do Flash 2 ocorrerá nas próximas semanas, com General Availability (GA) iminente.

O que revelaram os benchmarks

A comunidade de machine learning detectou o novo modelo em testes A/B no LM Arena, plataforma que utiliza votação cega para ranquear LLMs. Nos resultados preliminares, o Gemini 3.1 Flash Lite demonstrou capacidade de raciocínio e geração de código significativamente superiores à versão atual, aproximando-se do desempenho do Gemini 3.1 Pro em tarefas complexas.

Essa evolução representa mudança de paradigma na linha Flash. Tradicionalmente posicionada como opção de baixa latência e custo reduzido, a nova versão parece eliminar a distância qualitativa que justificava o salto para o tier Pro em aplicações que exigem compreensão multimodal ou geração estruturada.

Sinalização oficial e timeline

Clientes corporativos do Vertex AI receberam notificação sobre a descontinuação do Gemini Flash 2, com migração obrigatória para o 3.1 Flash Lite. O timing sugere anúncio formal durante o Google I/O, evento que ocorre daqui a menos de três semanas.

A transação indica também consolidação da nomenclatura: o sufixo "Lite" provavelmente posicionará o modelo como alternativa enxuta ao Flash padrão, similar à estratégia da OpenAI com GPT-4o mini e da Anthropic com Claude Haiku.

Impacto para builders e devs brasileiros

Para desenvolvedores que operam com orçamento limitado ou alta escala de requisições, o upgrade muda o cálculo de arquitetura:

  • **Custo por token**: Mantém precificação agressiva do tier Flash com capacidade próxima de modelos premium, viabilizando fine-tuning em datasets maiores sem estouro de budget
  • **Edge deployment**: Latência reduzida combinada com qualidade superior permite inferência local em dispositivos móveis para aplicações em português, onde modelos anteriores apresentavam limitações em nuance linguístico
  • **Agentes autônomos**: Capacidade de reasoning aprimorada sustenta pipelines de RAG mais
flashgeminilitemodeloarenacapacidadegoogletestesoficialclientes

Mais da mesma edição

@xai

🎙️xAI abre clonagem de voz via API

Além do Grok 4.3, a xAI também lançou clonagem de voz via API. Em menos de 2 minutos você cria uma voz personalizada a partir de uma amostra de áudio. Também dá para escolher entre mais de 80 vozes prontas em 28 idiomas. --- As aplicações são variadas: agentes de atendimento com voz humana, audiobooks narrados pela voz do próprio autor, personagens de jogos, assistentes virtuais personalizados. A barreira entre texto e voz está sumindo rápido. --- Se você já experimentou serviços de voz como o ElevenLabs, sabe o potencial. A diferença é que agora vem direto da xAI, integrada ao ecossistema Grok - o que pode significar preços mais competitivos e integração nativa com os outros serviços deles.

@sama

@veggie_eric

Grok 4.3: rápido, barato e com 1 milhão de contexto

A xAI lançou o Grok 4.3, e os números chamam atenção: US$ 1,25 por milhão de tokens de entrada, 100 tokens por segundo de velocidade e uma janela de contexto de 1 milhão de tokens. Tudo isso com foco em chamadas de ferramentas - o que faz agentes de IA funcionarem na prática. --- Eric Nakagawa, da equipe de treinamento da xAI, explicou que conversaram direto com desenvolvedores e empresas para entender o que precisavam no dia a dia. O resultado é um modelo pensado para uso real, não só para brilhar em testes de laboratório. --- Para quem constrói com IA, é mais uma opção forte no mercado. O preço agressivo e a velocidade alta fazem dele um concorrente direto do GPT-5 mini e do Gemini Flash para tarefas do cotidiano.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter