💰DeepSeek corta preço de cache pra 1/10
A DeepSeek anunciou que o preço de cache de entrada para toda a linha de APIs caiu para um décimo do valor original. Efeito imediato, sem pegadinhas. --- E a promoção de 75% de desconto no DeepSeek-V4-Pro continua até 5 de maio. Para quem desenvolve com IA, isso muda a conta: aplicações que usam contexto repetido (chatbots, agentes, pipelines de dados) ficam absurdamente mais baratas. A guerra de preços entre os provedores de IA está beneficiando quem constrói.

🔥DeepSeek Input Cache Price Drop! Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price! Build more efficiently for less. 📌Reminder: The DeepSeek-V4-Pro 75% OFF promotion is still active until May 5th, 2026, 15:59 (UTC Time).
— @deepseek_ai View on X
DeepSeek reduziu em 90% o custo de input cache hits em toda sua linha de APIs. A mudança entrou em vigor imediatamente, posicionando a empresa como uma das opções mais agressivas em termos de custo-benefício para aplicações com contexto repetitivo.
O que muda na prática
O corte atinge especificamente o cache de entrada — mecanismo que permite ao modelo reutilizar tokens processados anteriormente quando detecta contexto idêntico ou similar em prompts subsequentes. Com a redução para um décimo do valor original, operações que antes custavam $0,14 por milhão de tokens cacheados (valores ilustrativos) agora custam frações disso.
Para desenvolvedores brasileiros, o impacto é mais acentuado em arquiteturas específicas:
- **Sistemas RAG (Retrieval-Augmented Generation)**: quando documentos base são reutilizados entre múltiplas consultas
- **Agentes conversacionais multi-turn**: chatbots com memória de longo prazo que mantêm contexto estendido
- **Pipelines de processamento batch**: análise de grandes volumes de dados com estrutura repetitiva
- **Workflows de agentes autônomos**: loops de raciocínio que reenviam o mesmo contexto várias vezes
Contexto competitivo
A movimentação ocorre simultaneamente à promoção de 75% de desconto no modelo DeepSeek-V4-Pro, válida até 5 de maio de 2026. A estratégia de precificação da empresa chinesa contrasta com a estrutura de custos da OpenAI e Anthropic, onde cache hits geralmente representam fração significativa da conta final em workloads empresariais.
A diferença é crítica para quem opera com context windows extensos. Enquanto o preço por token de entrada nova permanece estável, a capacidade de reutilizar context
