News28 MaioDeepSeek Flash é absurdamente barato e pode mudar a conta da IA
Edição #106·28 de maio de 2026·1 min

💸DeepSeek Flash é absurdamente barato e pode mudar a conta da IA

Bindu Reddy, CEO da Abacus.AI, chamou atenção para o DeepSeek Flash, modelo de IA da chinesa DeepSeek que está sendo descrito como ridiculamente barato para rodar tarefas automatizadas em larga escala. Segundo ele, o modelo é especialmente bom em 'loops agênticos', que são aqueles processos repetitivos em que a IA executa uma sequência de passos sozinha. --- Isso importa porque o custo é uma das maiores barreiras para empresas que querem usar IA em escala. Se você precisa processar milhares de documentos, analisar dados de clientes ou automatizar fluxos de trabalho, cada centavo por requisição faz diferença no final do mês. Um modelo que entrega resultado bom a preço de banana muda a equação completamente. --- A expressão que ele usou, 'inteligência barata demais para medir', é provocativa. Mas se modelos como o DeepSeek Flash continuarem nessa trajetória de preço, a pergunta deixa de ser 'vale a pena usar IA?' e passa a ser 'por que você ainda não está usando?'.

DeepSeek Flash não é apenas mais um modelo de IA com preço reduzido. Ele representa uma mudança estrutural no custo de inferência para arquiteturas agentic, segundo Bindu Reddy, CEO da Abacus.AI. O modelo da chinesa DeepSeek está sendo testado em produção por desenvolvedores que precisam executar milhares de requisições automatizadas diariamente, com resultados que sugerem uma quebra de preço significativa em relação às alternativas disponíveis no mercado.

O custo como limitante técnico

Para builders e devs brasileiros, o preço por token nunca foi detalhe de accounting. É variável de arquitetura. Quando uma aplicação depende de loops agênticos — processos onde o LLM executa dezenas de iterações autônomas para completar uma tarefa — o custo por requisição multiplica-se exponencialmente. Um pipeline de extração de dados que consome 10 chamadas de API por documento, processando milhares de arquivos mensalmente, pode inviabilizar um produto se o modelo cobra valores premium.

O DeepSeek Flash atua nesse nicho específico: tarefas repetitivas, alto throughput, baixa latência. Não se trata de substituir GPT-4 ou Claude em raciocínio complexo, mas de viabilizar camadas de automação que antes exigiam infraestrutura pesada ou modelos open source auto-hospedados.

Agentic AI e a matemática do loop

O conceito técnico citado por Reddy, "loops agênticos", refere-se a padrões de execução onde a IA opera cadeias de raciocínio em ciclos: perceber, decidir, agir, verificar. Em sistemas de RAG (Retrieval-Augmented Generation) ou orquestração de ferramentas (tool use), esses loops são fundamentais. Cada ciclo consome tokens de entrada e saída. Se o custo por milhão de tokens cai de US$ 10 para US$

custodeepseekmodelopreçoloopsflashnãoagenticreddymilhares

Mais da mesma edição

@WesRoth

🆓GPT-5.5 vira o modelo padrão para todos no Codex, até quem não paga

A partir de 2 de junho, a OpenAI vai aposentar os modelos GPT-5.2 e GPT-5.3 do Codex, a ferramenta de programação integrada ao ChatGPT. No lugar deles, o GPT-5.5, que é o modelo mais avançado da empresa hoje, passa a ser o padrão para todos os usuários, incluindo quem usa o plano gratuito. --- É uma movimentação interessante. Em vez de manter um zoológico de versões, a OpenAI simplifica a frota de computação e, de quebra, dá ao público geral acesso ao que tem de melhor. Os modelos antigos continuam disponíveis via API para desenvolvedores, mas para o usuário comum do ChatGPT, o upgrade é automático. --- Na prática, quem usava o Codex sem pagar nada vai ganhar um salto de qualidade de graça. E quem pagava para ter acesso a modelos melhores pode começar a se perguntar: até quando faz sentido manter a assinatura?

@AndrewCurran_

📈Amazon fecha acordo com Snowflake e ações disparam 33%

A Snowflake, empresa de infraestrutura de dados na nuvem, vinha provocando o mercado com menções a um acordo fechado com um 'provedor de nuvem não identificado'. O mistério acabou: era a Amazon. As ações da Snowflake saltaram 33% no after-market assim que a notícia se confirmou. --- Para quem não conhece, a Snowflake é uma das empresas mais importantes no mundo dos dados corporativos. Ela permite que grandes empresas armazenem e analisem quantidades enormes de informação. Uma parceria desse porte com a Amazon, dona da AWS (a maior plataforma de nuvem do mundo), sinaliza que as gigantes de tecnologia estão dobrando a aposta em infraestrutura de dados, provavelmente de olho na demanda crescente gerada pela IA. --- O mercado claramente gostou. Um salto de 33% fora do horário do pregão é coisa rara e mostra que investidores viram nesse acordo algo maior do que uma simples parceria comercial.

@ClaudeDevs

🔧Anthropic melhora o Claude Code para ficar mais rápido e estável

A Anthropic anunciou que investiu pesado em tornar o Claude Code, sua ferramenta de programação por IA, mais responsivo e confiável. A equipe publicou uma lista de melhorias técnicas focadas em desempenho e estabilidade. --- No cenário atual, em que OpenAI, Google e Anthropic disputam quem oferece o melhor assistente de código, cada melhoria incremental conta. O Claude Code já era elogiado pela qualidade das respostas, mas sofria críticas por lentidão em projetos maiores. Se a Anthropic resolveu isso, a ferramenta pode ganhar terreno justamente entre quem precisa de algo que funcione no dia a dia, sem travar no meio do caminho. --- É o tipo de atualização que não gera manchete, mas faz diferença real para quem usa a ferramenta todos os dias.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter