News27 AbrilDeepSeek corta preço de cache pra 1/10
Edição #76·27 de abril de 2026·1 min

💰DeepSeek corta preço de cache pra 1/10

A DeepSeek anunciou que o preço de cache de entrada para toda a linha de APIs caiu para um décimo do valor original. Efeito imediato, sem pegadinhas. --- E a promoção de 75% de desconto no DeepSeek-V4-Pro continua até 5 de maio. Para quem desenvolve com IA, isso muda a conta: aplicações que usam contexto repetido (chatbots, agentes, pipelines de dados) ficam absurdamente mais baratas. A guerra de preços entre os provedores de IA está beneficiando quem constrói.

DeepSeek corta preço de cache pra 1/10

DeepSeek reduziu em 90% o custo de input cache hits em toda sua linha de APIs. A mudança entrou em vigor imediatamente, posicionando a empresa como uma das opções mais agressivas em termos de custo-benefício para aplicações com contexto repetitivo.

O que muda na prática

O corte atinge especificamente o cache de entrada — mecanismo que permite ao modelo reutilizar tokens processados anteriormente quando detecta contexto idêntico ou similar em prompts subsequentes. Com a redução para um décimo do valor original, operações que antes custavam $0,14 por milhão de tokens cacheados (valores ilustrativos) agora custam frações disso.

Para desenvolvedores brasileiros, o impacto é mais acentuado em arquiteturas específicas:

  • **Sistemas RAG (Retrieval-Augmented Generation)**: quando documentos base são reutilizados entre múltiplas consultas
  • **Agentes conversacionais multi-turn**: chatbots com memória de longo prazo que mantêm contexto estendido
  • **Pipelines de processamento batch**: análise de grandes volumes de dados com estrutura repetitiva
  • **Workflows de agentes autônomos**: loops de raciocínio que reenviam o mesmo contexto várias vezes

Contexto competitivo

A movimentação ocorre simultaneamente à promoção de 75% de desconto no modelo DeepSeek-V4-Pro, válida até 5 de maio de 2026. A estratégia de precificação da empresa chinesa contrasta com a estrutura de custos da OpenAI e Anthropic, onde cache hits geralmente representam fração significativa da conta final em workloads empresariais.

A diferença é crítica para quem opera com context windows extensos. Enquanto o preço por token de entrada nova permanece estável, a capacidade de reutilizar context

contextocachehitsempresaentradamodeloreutilizartokensquandoagentes

Mais da mesma edição

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter