News24 AbrilCodex ganha auto-review: menos aprovações, mais autonomia
Edição #73·24 de abril de 2026·2 min

Codex ganha auto-review: menos aprovações, mais autonomia

A OpenAI adicionou o modo auto-review ao Codex, sua ferramenta de programação com IA. A ideia: o agente continua trabalhando por mais tempo sem precisar parar pra pedir aprovação humana em cada passo. --- Funciona assim: um agente separado confere os passos de maior risco antes de executar, considerando o contexto do que está sendo feito. Testes, builds e outras operações rotineiras seguem sem interrupção. Na prática, é como ter um par de olhos extra revisando só o que importa enquanto o trabalho pesado rola automaticamente. Isso faz diferença especialmente em tarefas longas e automações que rodam de madrugada.

Codex ganha auto-review: menos aprovações, mais autonomia

O que mudou

A OpenAI lançou o modo auto-review para o Codex, sua ferramenta de programação com IA. A principal diferença: o agente agora consegue trabalhar por períodos mais longos sem precisar pausar para solicitar aprovação humana em cada etapa. Um agente separado fiscaliza apenas os passos de maior risco antes da execução, enquanto operações rotineiras seguem sem interrupção.

O problema que resolve

Desenvolvedores que usam agentes de IA no dia a dia enfrentam uma frustração comum: a necessidade de aprovação constante. Cada teste, build ou modificação de arquivo exige confirmação, quebrando o fluxo de trabalho especialmente em tarefas longas ou automações que rodam em background — como pipelines de CI/CD que executam de madrugada.

O modo auto-review endereça esse gargalo ao separar a execução em duas camadas: operações de baixo risco (testes unitários, builds, refatorações simples) continuam rodando automaticamente, enquanto ações potencialmente destrutivas ou irreversíveis são verificadas por um agente secundário antes de executar.

Como funciona na prática

O sistema mantém contexto sobre o que está sendo construído. Quando uma operação envolve risco elevado — como modificar arquivos de configuração críticos ou alterar dependências — o agente de review entra em ação, avaliando o impacto antes de permitir a execução. Isso reduz o número de aprovações necessárias sem abrir mão de segurança.

Para tarefas como: - Execução desuíte de testes - Builds contínuos - Refatorações em código existente - Automação de deployment

...o fluxo continua praticamente ininterrupto.

Impacto para devs e builders brasileiros

No contexto de desenvolvimento local, o auto-review representa ganho de produtividade concreto. Times que rodam pipelines automatizados ou usam IA para assistências de código podem manter o agente trabalhando sem intervir manualmente a cada passo. Isso é especialmente relevante para quem trabalha com metodologias ágeis e sprints curtos, onde cada interrupção conta.

A mudança também sinaliza uma tendência no mercado de agentes de IA: equilibrar autonomia com segurança. Em vez de escolher entre "agente livre sem controles" ou "aprovação humana em tudo", a indústria caminha para modelos híbridos onde a IA decide quando precisa de supervisão.

O modo auto-review está disponível para usuários do Codex a partir desta atualização.

agentesemautoreviewcadaexecuçãomodoaprovaçãoriscoantescodex

Mais da mesma edição

@OpenAI

🧠GPT-5.5: a OpenAI quer que a IA faça o trabalho inteiro

A OpenAI anunciou o GPT-5.5 - e dessa vez o foco não é "ser mais inteligente" no abstrato. O modelo foi construído para entender objetivos complexos, usar ferramentas, conferir o próprio trabalho e levar tarefas até o fim. Traduzindo: em vez de te dar uma resposta bonita e parar, ele tenta terminar o que começou. --- Já está disponível no ChatGPT e no Codex (a ferramenta de programação da OpenAI). A ideia é que o 5.5 marque uma nova forma de usar o computador - não como assistente que sugere, mas como agente que executa. Na prática, pense em pedir "monta essa planilha, confere os dados e me manda o PDF" e ele realmente fazer tudo isso sozinho. --- Theo Browne, criador de conteúdo técnico bastante conhecido, já testou e fez a conta: US$ 5 por milhão de tokens de entrada, US$ 30 por milhão de saída. É o dobro do GPT-5.4 e 20% mais caro que o Opus 4.7 da Anthropic. Inteligente? Sim. Caro? Também.

@deepseek_ai

🐉DeepSeek V4: open-source com 1.6 trilhão de parâmetros

A DeepSeek soltou o V4 Preview - e é grande em todos os sentidos. O modelo Pro tem 1.6 trilhão de parâmetros no total (49 bilhões ativos por vez), o que faz dele o maior modelo open-source já lançado. Detalhe: com janela de contexto de 1 milhão de tokens. Dá pra enfiar um livro inteiro numa conversa. --- Tem também a versão Flash (284 bilhões de parâmetros, 13 bilhões ativos), feita pra quem quer velocidade e economia. As duas já estão disponíveis via API e no chat.deepseek.com. --- A análise independente da Artificial Analysis colocou o V4 Pro como o modelo open-source número 1 em tarefas de trabalho real com agentes. Em raciocínio matemático e programação, ele rivaliza com os melhores modelos fechados. É o primeiro salto de tamanho da família DeepSeek desde o V3 original - todos os modelos intermediários (R1, V3.1, V3.2) usavam a mesma arquitetura menor.

@bcherny

🔍Claude Code admite o erro e publica o post-mortem

Nos últimos 30 dias, muita gente reclamou que o Claude Code tinha piorado. A Anthropic investigou, encontrou três problemas - e fez o que pouca empresa faz: publicou um post-mortem detalhado. --- O ponto mais importante: os modelos em si não regrediram. Os bugs estavam no Claude Code e no Agent SDK (a camada que conecta o modelo à ferramenta de programação). O Cowork, que roda sobre o mesmo SDK, também foi afetado. Todos os problemas já foram corrigidos na versão 2.1.116+. --- E um gesto que conta: a Anthropic resetou os limites de uso de todos os assinantes. Boris Cherny, líder do Claude Code, publicou a análise pessoalmente. Transparência assim gera confiança - e diferencia quem trata usuário como parceiro de quem trata como cliente passivo.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter