News05 JunhoClaude acerta 76% dos problemas difíceis de código
Edição #114·5 de junho de 2026·2 min

💻Claude acerta 76% dos problemas difíceis de código

A Anthropic divulgou que o Claude, seu modelo de IA, agora resolve 76% dos problemas de programação mais abertos e ambíguos, aqueles em que não existe uma resposta óbvia. Seis meses atrás, esse número era 26%. Um salto de 50 pontos percentuais em meio ano é absurdo por qualquer métrica. --- A empresa vai além e afirma que muitos engenheiros já consideram a qualidade do código gerado pelo Claude comparável à de um programador humano. E faz uma previsão ousada: dentro de um ano, espera que o código da IA seja melhor que o humano. --- Para quem não programa, o impacto é indireto, mas enorme. Se a IA já escreve código tão bom quanto um humano, o custo de criar softwares, aplicativos e ferramentas digitais tende a despencar. Isso muda a economia inteira de tecnologia.

Claude acerta 76% dos problemas difíceis de código

O Claude, modelo de IA da Anthropic, passou a resolver 76% dos problemas de programação abertos e ambíguos — aqueles sem resposta única ou óbvia. O avanço representa um salto de 50 pontos percentuais em apenas seis meses, período em que a taxa de acerto era de 26%. A empresa projeta que, dentro de um ano, o código gerado por IA supere em qualidade o produzido por programadores humanos.

Do benchmark à ambiguidade real

A distinção entre problemas fechados e abertos é técnica e significativa. Benchmarks tradicionais de coding, como o SWE-bench, avaliam a capacidade de resolver bugs específicos em repositórios conhecidos, com contexto delimitado. Os "problemas abertos" exigem interpretação de requisitos mal definidos, tomada de decisão arquitetural e navegação em trade-offs não documentados — habilidades até então consideradas exclusivamente humanas.

Esse salto de 26% para 76% indica que o modelo evoluiu além da geração sintática correta. Ele demonstra compreensão contextual suficiente para escolher entre padrões de design, otimizar para manutenibilidade e inferir intenções do usuário final a partir de descrições incompletas.

Implicações para builders e desenvolvedores brasileiros

Para o ecossistema de tecnologia no Brasil, a mudança é estrutural. Desenvolvedores precisam recalibrar seu valor diferencial:

  • **Arquitetura sobre implementação**: A commoditização acelerada de código boilerplate e lógica intermediária desloca o foco profissional para decisões de arquitetura de software, segurança e alinhamento de negócios.
  • **Engenharia de prompt como stack**: A capacidade de especificar problemas ambíguos de forma clara torna-se tão crítica quanto conhecer linguagens de programação.
  • **Revisão e governança**: Com a IA gerando código comparável ao humano — e em breve superior —, a função do engenheiro migra para auditoria, refinamento e garantia de conformidade.

Redesenho econômico do software

Se a qualidade do código generativo atingiu paridade com desenvolvedores medianos, o custo marginal de criar software tende à redução drástica. Para startups brasileiras, isso significa capacidade de prototipagem de MVPs com equipes menores e menor dependência de financiamento inicial para validação técnica.

A previsão da Anthropic de superação humana em 12 meses acelera a discussão sobre quais camadas da stack tecnológica permanecerão resistentes à automação. Sistemas legados, integrações complexas e domínios com regras de negócio altamente específicas — como fintechs reguladas e healthtechs — podem constituir os últimos redutos de valorização profissional imediata.

problemascódigoabertoscapacidadedesenvolvedoressoftwaremodeloanthropicresolverprogramação

Mais da mesma edição

@AndrewCurran_

🧠ChatGPT ganha memória que funciona enquanto 'dorme'

A OpenAI está liberando hoje um novo sistema de memória para o ChatGPT, disponível para assinantes dos planos Plus e Pro. A grande novidade é uma arquitetura chamada 'dreaming', ou 'sonhar': entre uma conversa e outra, o modelo reorganiza tudo que sabe sobre você, criando resumos mais ricos e acessíveis. É como se ele fizesse a lição de casa enquanto você não está usando. --- Na prática, agora existe uma página de resumo de memória onde você pode ver o que o ChatGPT lembra sobre você, corrigir informações, adicionar detalhes e até definir quais assuntos ele deve puxar e quando. É uma mudança importante porque, até agora, a memória da ferramenta era meio aleatória: às vezes lembrava coisas inúteis e esquecia o essencial. --- Se funcionar como prometido, o ChatGPT fica mais parecido com um assistente pessoal de verdade, que conhece seu contexto sem você precisar repetir tudo a cada conversa nova. Resta ver se a execução acompanha a promessa.

@CristinaCriddle

🕵️Anthropic coloca engenheiros dentro da agência de espionagem dos EUA

Segundo furo da jornalista Cristina Criddle, do Financial Times, a Anthropic (criadora do Claude) instalou engenheiros diretamente dentro da NSA, a Agência de Segurança Nacional dos Estados Unidos. O objetivo é ajudar a agência a usar o Claude Mythos em operações cibernéticas ofensivas. --- Em termos simples: a empresa que mais fala publicamente sobre segurança e ética em IA agora tem gente trabalhando no coração da espionagem americana para ajudar em ataques digitais. É um contraste que chama atenção. Até então, o discurso da Anthropic era centrado em desenvolver IA 'segura e responsável'. --- A movimentação mostra que o mercado de IA e defesa está cada vez mais entrelaçado. A pergunta que fica: dá para ser, ao mesmo tempo, a empresa mais cautelosa com IA e a fornecedora preferida do aparato militar mais poderoso do mundo?

@paulg

🔮Paul Graham agora pergunta: 'sua startup sobrevive se a IA fizer tudo?'

Paul Graham, cofundador da Y Combinator (a maior aceleradora de startups do mundo, que ajudou a lançar Airbnb, Dropbox e Stripe), revelou que adicionou uma nova pergunta obrigatória às reuniões com fundadores: 'podemos tornar essa empresa à prova de IA?'. A ideia é simples e brutal: se a inteligência artificial conseguir fazer a maior parte do trabalho, essa empresa ainda tem motivo para existir? --- A pergunta se junta a duas outras clássicas que ele já usava: 'conseguimos criar efeitos de rede?' e 'faz sentido controlar toda a cadeia?'. O fato de Graham colocar a sobrevivência à IA no mesmo nível dessas perguntas estratégicas mostra o quanto o jogo mudou para quem empreende em tecnologia. --- Para quem trabalha ou investe em startups, o recado é claro: se o valor do seu negócio é algo que uma IA pode replicar facilmente, o relógio está correndo.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter