News24 AbrilClaude Code admite o erro e publica o post-mortem
Edição #73·24 de abril de 2026·2 min

🔍Claude Code admite o erro e publica o post-mortem

Nos últimos 30 dias, muita gente reclamou que o Claude Code tinha piorado. A Anthropic investigou, encontrou três problemas - e fez o que pouca empresa faz: publicou um post-mortem detalhado. --- O ponto mais importante: os modelos em si não regrediram. Os bugs estavam no Claude Code e no Agent SDK (a camada que conecta o modelo à ferramenta de programação). O Cowork, que roda sobre o mesmo SDK, também foi afetado. Todos os problemas já foram corrigidos na versão 2.1.116+. --- E um gesto que conta: a Anthropic resetou os limites de uso de todos os assinantes. Boris Cherny, líder do Claude Code, publicou a análise pessoalmente. Transparência assim gera confiança - e diferencia quem trata usuário como parceiro de quem trata como cliente passivo.

A Anthropic publicou um post-mortem técnico detalhado sobre as falhas de qualidade recentes no Claude Code. A análise confirma que os modelos de linguagem (LLMs) não sofreram degradação de performance, mas sim bugs na camada de integração entre o modelo e a ferramenta de desenvolvimento. Todas as falhas foram corrigidas na versão 2.1.116+, e a empresa resetou os limites de uso de todos os assinantes afetados.

O contexto: regressão percebida vs. realidade técnica

Nos últimos 30 dias, desenvolvedores reportaram queda consistente na qualidade das sugestões de código e na precisão das respostas do Claude Code. A reclamação recorrente sugeria que os modelos Claude 3.5 Sonnet ou Opus tinham "piorado" com o tempo — um fenômeno conhecido como model drift que afeta alguns sistemas de IA.

A investigação interna, conduzida pela equipe técnica liderada por Boris Cherny, revelou três problemas distintos:

  • Falhas no processamento de contexto no Agent SDK, a camada de abstração que conecta os modelos Claude às interfaces de programação
  • Bugs específicos na pipeline de execução do Claude Code, afetando a interpretação de comandos complexos
  • Instabilidade compartilhada com o Cowork, ferramenta que utiliza a mesma base técnica do SDK

A diferença entre modelo e interface

O ponto crítico do post-mortem é a distinção técnica entre o core dos LLMs e o tooling de implementação. Enquanto os pesos do modelo e sua capacidade de raciocínio permaneceram estáveis, a camada de orquestração — responsável por gerenciar contexto, ferramentas e execução — apresentou regressões que degradaram a experiência do usuário final.

Essa distinção importa para arquitetos de software e tech leads brasileiros que estão integrando IA generativa em pipelines de desenvolvimento. Demonstra que falhas em sistemas de IA nem sempre residem nos modelos fundamentais, mas frequentemente na engenharia de conexão entre o modelo e o ambiente de execução.

Transparência como diferencial competitivo

A publicação pessoal de Cherny e o detalhamento técnico das falhas estabelecem um precedente no mercado de coding assistants. O reset dos limites de uso reconhece explicitamente que downtime em ferramentas de produtividade tem custo real para devs e empresas.

Para o ecossistema brasileiro, onde soluções como Claude Code, GitHub Copilot e Cursor competem pela adoção em startups e fintechs, o gesto sinaliza maturidade operacional. Vendors que tratam regressões como incidentes de infraestrutura — com comunicação clara, correção rápida e compensação aos usuários — diferenciam-se daqueles que minimizam falhas ou mantêm usuários como receptores passivos de atualizações.

falhasclaudecodemodelosentremodelotécnicacamadacontextoexecução

Mais da mesma edição

@OpenAI

🧠GPT-5.5: a OpenAI quer que a IA faça o trabalho inteiro

A OpenAI anunciou o GPT-5.5 - e dessa vez o foco não é "ser mais inteligente" no abstrato. O modelo foi construído para entender objetivos complexos, usar ferramentas, conferir o próprio trabalho e levar tarefas até o fim. Traduzindo: em vez de te dar uma resposta bonita e parar, ele tenta terminar o que começou. --- Já está disponível no ChatGPT e no Codex (a ferramenta de programação da OpenAI). A ideia é que o 5.5 marque uma nova forma de usar o computador - não como assistente que sugere, mas como agente que executa. Na prática, pense em pedir "monta essa planilha, confere os dados e me manda o PDF" e ele realmente fazer tudo isso sozinho. --- Theo Browne, criador de conteúdo técnico bastante conhecido, já testou e fez a conta: US$ 5 por milhão de tokens de entrada, US$ 30 por milhão de saída. É o dobro do GPT-5.4 e 20% mais caro que o Opus 4.7 da Anthropic. Inteligente? Sim. Caro? Também.

@deepseek_ai

🐉DeepSeek V4: open-source com 1.6 trilhão de parâmetros

A DeepSeek soltou o V4 Preview - e é grande em todos os sentidos. O modelo Pro tem 1.6 trilhão de parâmetros no total (49 bilhões ativos por vez), o que faz dele o maior modelo open-source já lançado. Detalhe: com janela de contexto de 1 milhão de tokens. Dá pra enfiar um livro inteiro numa conversa. --- Tem também a versão Flash (284 bilhões de parâmetros, 13 bilhões ativos), feita pra quem quer velocidade e economia. As duas já estão disponíveis via API e no chat.deepseek.com. --- A análise independente da Artificial Analysis colocou o V4 Pro como o modelo open-source número 1 em tarefas de trabalho real com agentes. Em raciocínio matemático e programação, ele rivaliza com os melhores modelos fechados. É o primeiro salto de tamanho da família DeepSeek desde o V3 original - todos os modelos intermediários (R1, V3.1, V3.2) usavam a mesma arquitetura menor.

@claudeai

💾Claude ganha memória persistente para agentes gerenciados

A Anthropic lançou memória persistente para os agentes gerenciados do Claude, em beta público. Na prática: seus agentes agora aprendem com cada sessão, usando uma camada de memória que equilibra desempenho com flexibilidade. --- Isso muda a experiência de usar agentes. Antes, cada conversa começava do zero. Agora o agente pode lembrar que você prefere código em TypeScript, que seu projeto usa Tailwind, ou que na última vez que rodou um deploy deu erro no banco. É o tipo de coisa que parece óbvia mas que ninguém tinha resolvido bem até agora.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter