News16 MaioE se o custo da IA não importasse? A aposta do steipete
Edição #94·16 de maio de 2026·2 min

🎰E se o custo da IA não importasse? A aposta do steipete

O Peter Steinberger (que aparece direto por aqui, trabalha no projeto OpenClaw) levou crítica esta semana por gastar muito com IA. A resposta dele virou uma pergunta interessante: como a gente construiria software se o custo dos tokens não importasse? --- Token é a unidade que mede o custo de usar uma IA. Hoje quase todo mundo economiza token do mesmo jeito que economiza água. Steinberger está apostando no contrário. Ele roda cerca de 100 agentes ao mesmo tempo na nuvem, revisando cada mudança e cada problema do projeto, sem dó. --- A aposta dele é que o preço dos tokens vai cair tanto que pensar pequeno hoje é miopia. Pode estar certo ou errado. Mas é uma forma saudável de pensar: em vez de perguntar "como faço isso barato", perguntar "o que eu faria se fosse ilimitado", e construir na direção disso.

Peter Steinberger está construindo software assumindo que o custo dos tokens de IA será irrelevante. Enquanto a indústria tecnológica otimiza cada chamada de API e monitora quotas de uso, o desenvolvedor austríaco mantém aproximadamente 100 agentes Codex operando simultaneamente na nuvem para gerenciar seu projeto OpenClaw. A aposta é arquitetural: se o preço da inferência em large language models (LLMs) continuar em queda livre, quem pensar pequeno hoje estará em desvantagem amanhã.

A operação: 100 agentes e zero hesitação

A estratégia de Steinberger, compartilhada em resposta a críticas sobre seus gastos com IA, revela uma infraestrutura de automação profundamente integrada ao fluxo de desenvolvimento. O sistema, apelidado de clawsweeper, executa tarefas que vão além do code review tradicional:

  • Revisão automatizada de todos os pull requests e issues abertos, com capacidade de vincular correções atuais a problemas reportados meses atrás
  • Análise de segurança em cada commit, utilizando Codex Security e Vercel's deepsec para identificar vulnerabilidades que revisores humanos poderiam ignorar
  • Desduplicação inteligente de issues, clusterizando problemas similares e priorizando relatórios por urgência
  • Criação proativa de pull requests quando novas issues se alinham à documentação de visão do produto, seguida por revisão cruzada entre agentes
  • Verificação contínua de benchmarks de performance e detecção de regressões, com reportes automáticos em canais como Discord
  • Agentes participativos em reuniões que iniciam trabalho em tempo real, convertendo discussões em código enquanto a conversa acontece
  • Ambientes efêmeros que replicam setups complexos, geram vídeos de before/after e realizam testes end-to-end em plataformas externas como Telegram

O cálculo: miopia versus posicionamento

A controvérsia surge do contraste entre esta abordagem e a realidade atual dos custos de inferência. Para desenvolvedores brasileiros e startups com capital limitado, a ideia de rodar cem instâncias de modelos de ponta simultaneamente soa economicamente inviável hoje. Contudo, Steinberger opera sob uma hipótese de longo prazo: a commoditização do processamento de tokens.

A lógica é técnica, não apenas financeira. Ao projetar arquiteturas que assumem computação ilimitada, os builders preparam suas bases de código para uma futura realidade onde o gargalo não é o custo da API, mas a latência e a orquestração de agentes. Trata-se de antecipar a curva de custo das LLMs, similar ao que ocorreu com armazenamento em nuvem e banda larga nos últimos anos.

Para equipes de desenvolvimento no Brasil, o caso levanta uma questão estratégica imediata: a arquitetura do seu software está preparada para escalar horizontalmente em agentes, ou está otimizada demais para um paradigma de escassez que pode estar ultrapassado em 24 meses? A resposta determinará quem estará pronto para operar quando o custo dos tokens, de fato, deixar de importar.

agentescustosteinbergerestátokensissuessoftwareenquantocadaapi

Mais da mesma edição

@XFreeze

🔓X abriu o código do algoritmo que escolhe o que você vê

A X (antigo Twitter) publicou no GitHub o código do algoritmo de recomendação. Esse algoritmo é a parte do sistema que decide quais posts aparecem no seu feed e em que ordem. É a receita secreta de qualquer rede social. --- A X é a única rede grande do mundo que torna isso público. Instagram, TikTok e YouTube guardam a sete chaves. A ideia é transparência: qualquer pessoa pode ler o código e entender por que um post sobe ou some. --- Pra você, no dia a dia, muda pouco. Mas é munição. Quem cria conteúdo passa a entender o jogo de verdade, e pesquisador consegue checar se a rede está empurrando ou enterrando certos assuntos. Transparência radical tem um custo (o concorrente copia), e a X topou pagar.

@BenjaminDEKR

🔍Já checaram o código da X, e o pânico do 'limite de 4 posts' era falso

Assim que o código saiu, veio o pânico. Espalhou-se um post afirmando que a X pune quem publica mais de 4 vezes por dia, que existiria um gatilho automático cortando o alcance de quem posta demais. --- O Benjamin De Kraker resolveu checar. Pegou o código de verdade, mandou o Claude (a IA da Anthropic) ler linha por linha e conferir a alegação. Resultado: "na maior parte, besteira". Não existe gatilho de 4 por dia. O que existe é um desconto gradual: dentro de uma mesma leva de posts, cada post a mais perde um pouquinho de força. Postar muito satura, mas não tem castigo de tranco. --- Ficam duas lições. A primeira: quando algo vira código aberto, dá pra checar boato em vez de repetir. A segunda: usar IA pra ler código e desmentir post viral é um uso prático que qualquer pessoa pode fazer hoje.

@xai

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter