News20 MaioGPT-5.5 bate Gemini 3.5 Flash em custo e desempenho
Edição #98·20 de maio de 2026·2 min

⚖️GPT-5.5 bate Gemini 3.5 Flash em custo e desempenho

Os primeiros comparativos entre os modelos mais recentes trouxeram uma surpresa. O GPT-5.5 na configuração medium, da OpenAI, está se mostrando mais barato e mais inteligente que o Gemini 3.5 Flash, do Google. Nos testes analisados pelo desenvolvedor Theo Browne, o modelo da OpenAI consumiu 22 milhões de tokens (a unidade que mede o uso de IA) por US$1.199 e marcou 57 pontos. O modelo do Google usou 73 milhões de tokens, custou US$1.522 e ficou com 55 pontos. --- Em linguagem simples: a OpenAI entregou mais resultado gastando menos. Isso é relevante porque o Google vinha dominando a faixa de modelos rápidos e baratos. O Flash era considerado a melhor opção para empresas que precisavam de respostas ágeis sem gastar fortunas. Esse trono agora está sendo disputado. --- Claro, benchmarks são só uma parte da história. Desempenho no mundo real depende do tipo de tarefa, da integração com outros sistemas e de vários outros fatores. Mas o sinal é claro: a corrida de preços e performance entre Google e OpenAI está cada vez mais apertada.

GPT-5.5 bate Gemini 3.5 Flash em custo e desempenho

OpenAI supera Google em custo-benefício com GPT-5.5

Os primeiros comparativos entre os modelos de IA mais recentes revelam uma inversão de mercado. O GPT-5.5 medium, da OpenAI, está deliverando mais desempenho por menos custo que o Gemini 3.5 Flash, do Google. Essa disputa tradicionalmente era dominada pelo Flash, considerado a melhor opção para aplicações que exigem respostas rápidas sem comprometer o orçamento.

Nos testes conduzidos pelo desenvolvedor Theo Browne, o modelo da OpenAI processou 22 milhões de tokens por US$ 1.199, alcançando 57 pontos de desempenho. Já o Gemini 3.5 Flash consumiu 73 milhões de tokens, custou US$ 1.522 e marcou 55 pontos. A diferença representa uma economia de cerca de 21% no custo por token, com desempenho superior.

Essa mudança tem implicações diretas para desenvolvedores e empresas que constroem aplicações com IA no Brasil. O Gemini Flash era a escolha padrão para quem precisava de latência baixa e custo reduzido em APIs de chatbot, automação de atendimento e processamento de texto. Com o GPT-5.5 oferecendo melhor relação custo-desempenho, equipes técnicas precisam reavaliar suas escolhas de infraestrutura.

O que mudou na prática

A OpenAI conseguiu otimizar seu modelo intermediário de forma significativa. O GPT-5.5 medium entrega resultados superiores com menos tokens processados, o que se traduz em:

  • Menor custo por requisição em escala
  • Respostas mais concisas sem perda de qualidade
  • Viabilidade para aplicações com alto volume de uso

Para builders brasileiros que integram APIs de IA em produtos digitais, essa mudança afeta o cálculo de custos mensais. Uma aplicação que processa 1 milhão de tokens por dia, por exemplo, pode economizar centenas de dólares mensalmente ao migrar ou incluir o GPT-5.5 como opção principal.

O papel dos benchmarks

É importante notar que testes sintéticos como este representam apenas uma parcela do desempenho real. Fatores como tipo de tarefa, qualidade do prompt, integração com sistemas existentes e requisitos de latência influenciam diretamente qual modelo funciona melhor para cada caso de uso.

Ainda assim, o comparativo indica uma tendência clara: a competição entre OpenAI e Google está apertando a faixa de modelos rápidos e acessíveis. O Google, que dominava esse segmento com o Flash, agora enfrenta pressão direta em custo e performance.

Para devs e builders, a recomendação é monitorar novos benchmarks e testar ambos os modelos em cenários reais antes de definir a infraestrutura de longo prazo. A disputa beneficia quem constrói com IA — a tendência é que os preços continuem caindo e o desempenho subindo em ambas as plataformas.

openaigptdesempenhocustoflashgoogletokensmodelosgeminiessa

Mais da mesma edição

@karpathy

🔬Karpathy, o maior professor de IA da internet, vai para a Anthropic

Andrej Karpathy, o cientista que ficou famoso por tornar inteligência artificial compreensível para milhões de pessoas no YouTube, anunciou que está entrando para a Anthropic, a empresa por trás do Claude. Karpathy é ex-diretor de IA da Tesla e cofundou a OpenAI antes de sair para se dedicar à educação. Agora, volta ao laboratório. --- O movimento é simbólico. Karpathy poderia ir para qualquer empresa do planeta. Escolher a Anthropic sinaliza que ele enxerga ali o lugar mais interessante para pesquisa de fronteira nos próximos anos. Em seu comunicado, ele disse que continua apaixonado por educação e pretende retomar esse trabalho no futuro. --- Para quem acompanha o mercado de IA, é como um craque de futebol assinando com um clube: não muda o jogo sozinho, mas muda a percepção de quem está por perto. A Anthropic ganha peso técnico e simbólico num momento em que a disputa com a OpenAI e o Google está mais acirrada do que nunca.

@t_blom

💰OpenAI aposta US$800 milhões em startups da Y Combinator

Sam Altman subiu ao palco da Y Combinator, a mais famosa aceleradora de startups do mundo, e fez uma oferta que ninguém esperava: US$2 milhões em créditos de uso da OpenAI para cada startup da turma atual, em troca de uma pequena fatia de participação. São cerca de 400 startups, o que coloca o valor total da aposta em torno de US$800 milhões. --- Na prática, essas startups ganham acesso a uma quantidade enorme de poder computacional para construir seus produtos usando os modelos da OpenAI. Em troca, a OpenAI fica com aproximadamente 2% de cada uma delas. É uma jogada dupla: garante que centenas de empresas nascentes se tornem dependentes da sua tecnologia e, de quebra, faz uma aposta financeira de que algumas delas vão valer muito dinheiro no futuro. --- O analista Thomas Blom resumiu bem: você só faz uma troca dessas se acredita que a participação nessas empresas pode se valorizar enormemente. É o tipo de movimento que cria ecossistema. A OpenAI não quer só vender IA, quer ser a infraestrutura sobre a qual a próxima geração de empresas será construída.

@googledevs

📱Google AI Studio agora cria apps Android inteiros a partir de um texto

O Google acaba de liberar uma função que parecia ficção há dois anos: você escreve uma descrição do aplicativo que quer, e o AI Studio gera um app Android nativo completo, pronto para ser enviado à Google Play Store. Tudo dentro do navegador, sem precisar instalar nada no computador. --- O fluxo funciona assim: você digita um prompt descrevendo o que o app deve fazer, a ferramenta gera o código, monta o aplicativo e ainda permite publicá-lo numa faixa de testes da Play Console para você testar no celular. É um salto enorme na acessibilidade. Antes, criar um app exigia meses de estudo ou contratar um desenvolvedor. --- Claro, ninguém espera que apps complexos como Instagram ou Uber saiam de um prompt simples. Mas para ferramentas internas, protótipos e aplicativos mais enxutos, essa funcionalidade pode ser transformadora, especialmente para pequenos empreendedores que tinham a ideia mas não tinham o programador.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter