News10 AbrilSonnet agora liga pro Opus quando trava
Edição #60·10 de abril de 2026·1 min

🧠Sonnet agora liga pro Opus quando trava

A Anthropic oficializou a estratégia de "consultor" na plataforma do Claude. A ideia é simples e genial: o Sonnet (mais rápido e barato) trabalha normalmente, mas quando encontra um problema difícil, ele para e consulta o Opus (mais inteligente e caro). Tipo um estagiário esperto que sabe a hora de perguntar pro sênior. --- Alex Albert, pesquisador da Anthropic, mostrou que essa combinação não só acerta mais como gasta menos no total. Parece contraditório usar um modelo caro pra economizar, mas o truque é que o Sonnet desperdiça muitos tokens tentando resolver sozinho algo que o Opus mata em uma chamada. --- Na prática, é como ter dois cérebros pelo preço de um. Você pode usar Haiku ou Sonnet como executor e Opus como conselheiro, chegando perto da inteligência do Opus por uma fração do custo. Se você constrói com a API do Claude, essa é provavelmente a atualização mais útil do mês.

Sonnet agora liga pro Opus quando trava

A Anthropic validou uma arquitetura de routing inteligente que inverte a lógica tradicional de escolha de modelos: em vez de usar exclusivamente o Claude Sonnet para economizar ou o Opus para precisão máxima, a estratégia recomendada é usar ambos em cascata. Dados divulgados pelo pesquisador Alex Albert demonstram que permitir que o Sonnet "escale" automaticamente para o Opus em tarefas complexas reduz o custo total de inferência enquanto mantém alta performance.

Como funciona o mecanismo de "phone a friend"

O padrão implementado funciona como uma camada de orquestração entre os modelos da família Claude:

  • **Claude Sonnet** atua como executor primário, processando as requisições iniciais com baixa latência e custo reduzido
  • Ao identificar uma tarefa que exige raciocínio avançado, o sistema pausa e dispara uma chamada ao **Claude Opus**
  • O Opus resolve o problema complexo em uma única iteração, devolvendo o resultado para o Sonnet finalizar o fluxo

A economia surge da eliminação de desperdício. Quando forçado a

claudesonnetopusmodelosusarcustofuncionaanthropicvalidouarquitetura

Mais da mesma edição

@noahzweben

👁️Claude Code ganha 'modo sentinela'

O Claude Code acaba de ganhar uma ferramenta chamada Monitor. Em vez do agente ficar rodando em loop perguntando "mudou algo? e agora?", ele cria scripts em background que ficam vigiando e só acordam o Claude quando acontece algo relevante. --- Na prática, o Claude pode: monitorar logs de erro em tempo real, acompanhar pull requests, vigiar deploys - tudo sem gastar tokens desnecessários. Noah Zweben, PM do Claude Code, explicou que é uma economia enorme e uma forma muito mais inteligente de trabalhar com agentes. --- Isso resolve um problema real de quem usa agentes de código no dia a dia. Ficar pagando pra IA fazer polling a cada 30 segundos é desperdício. Agora ela dorme e o script cutuca quando precisa. Parece óbvio, mas é o tipo de melhoria prática que faz diferença no bolso.

@perplexity_ai

💰Perplexity agora acessa seu banco

A Perplexity conectou seu assistente de IA com a Plaid, aquele serviço que vincula contas bancárias, cartões de crédito e empréstimos. Traduzindo: você pode pedir pra IA analisar pra onde tá indo seu dinheiro, montar um orçamento personalizado e até visualizar seu patrimônio. --- Dá raiva ninguém ter feito isso antes de um jeito decente. Toda planilha de gastos é abandonada no segundo mês. A promessa aqui é que a IA puxa os dados direto da fonte e organiza tudo sem você precisar digitar nada. Imagina perguntar "quanto gastei com delivery no último trimestre?" e receber uma resposta real, com gráficos. --- Claro, a ideia de dar acesso às suas finanças pra uma IA levanta questões. Mas se funcionar bem, esse é o tipo de ferramenta que muda comportamento de verdade. Planejar dinheiro com linguagem natural em vez de categorias de planilha é um salto enorme de acessibilidade.

@bcherny

Opus portou código Rust pra TypeScript sozinho

Boris Cherny, engenheiro do Claude Code na Anthropic, contou como pediu pro Opus portar um indexador de arquivos de Rust (via NAPI) pra TypeScript nativo. O prompt foi direto: "compila o código, garante que passa na suite de testes original, profila comparando com NAPI/WASM e abre um PR com o resultado. Não para até provar que a nova implementação é mais rápida." --- Depois foi ajustando na conversa: "mais algo pra melhorar performance? Quero p99 menor que 10ms." E: "ainda tô sentindo um travamento quando começo a digitar." Até que: "legal, tá muito bom. Manda." Quatro prompts e um port completo de Rust pra TypeScript com melhoria de performance. --- É o tipo de caso de uso que mostra onde agentes de código realmente brilham: migrações trabalhosas que ninguém quer fazer manualmente. O modelo não só portou o código como otimizou até ficar mais rápido que o original.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter