DeepSeek corta preço de cache pra 1/10

A DeepSeek anunciou que o preço de cache de entrada para toda a linha de APIs caiu para um décimo do valor original. Efeito imediato, sem pegadinhas. --- E a promoção de 75% de desconto no DeepSeek-V4-Pro continua até 5 de maio. Para quem desenvolve com IA, isso muda a conta: aplicações que usam contexto repetido (chatbots, agentes, pipelines de dados) ficam absurdamente mais baratas. A guerra de preços entre os provedores de IA está beneficiando quem constrói.

DeepSeek reduziu em 90% o custo de input cache hits em toda sua linha de APIs. A mudança entrou em vigor imediatamente, posicionando a empresa como uma das opções mais agressivas em termos de custo-benefício para aplicações com contexto repetitivo.

O que muda na prática

O corte atinge especificamente o cache de entrada — mecanismo que permite ao modelo reutilizar tokens processados anteriormente quando detecta contexto idêntico ou similar em prompts subsequentes. Com a redução para um décimo do valor original, operações que antes custavam $0,14 por milhão de tokens cacheados (valores ilustrativos) agora custam frações disso.

Para desenvolvedores brasileiros, o impacto é mais acentuado em arquiteturas específicas:

**Sistemas RAG (Retrieval-Augmented Generation)**: quando documentos base são reutilizados entre múltiplas consultas
**Agentes conversacionais multi-turn**: chatbots com memória de longo prazo que mantêm contexto estendido
**Pipelines de processamento batch**: análise de grandes volumes de dados com estrutura repetitiva
**Workflows de agentes autônomos**: loops de raciocínio que reenviam o mesmo contexto várias vezes

Contexto competitivo

A movimentação ocorre simultaneamente à promoção de 75% de desconto no modelo DeepSeek-V4-Pro, válida até 5 de maio de 2026. A estratégia de precificação da empresa chinesa contrasta com a estrutura de custos da OpenAI e Anthropic, onde cache hits geralmente representam fração significativa da conta final em workloads empresariais.

A diferença é crítica para quem opera com context windows extensos. Enquanto o preço por token de entrada nova permanece estável, a capacidade de reutilizar context

💰DeepSeek corta preço de cache pra 1/10

O que muda na prática

Contexto competitivo

Mais da mesma edição

🌐Sam Altman quer repensar o sistema operacional e a internet

Receba no seu email