⚔️O debate: agentes de código funcionam de verdade?
David Cramer, fundador do Sentry, jogou uma bomba: segundo ele, ninguém sério está rodando multidões de agentes de código durante a noite. Quem diz que está estaria desperdiçando dinheiro e gerando código descartável. --- Teknium, cofundador da Nous Research, rebateu na hora: ele roda 12 instâncias do Hermes Agent todo dia em paralelo, e o projeto se tornou referência na comunidade de IA. --- A verdade provavelmente está no meio: agentes geram valor real quando bem orquestrados, mas a maioria das implementações ainda é amadora. A barra de qualidade sobe a cada semana.
I literally run 12 hermes agent instances every day in parallel to build Hermes Agent, and its now a top 100 GitHub repositories of all time. Agents do bring value and do create substantive software and work.
— @Teknium View on X
O que os dados mostram
Agentes de código geram valor real quando bem implementados, mas a maioria das empresas ainda não atingiu esse nível de maturidade. O debate entre David Cramer (fundador do Sentry) e Teknium (cofundador da Nous Research) expõe uma verdade incômoda: o mercado está dividido entre quem usa agentes de forma sofisticada e quem apenas segue a tendência sem infraestrutura adequada.
O embate
Cramer afirmou que "ninguém sério está rodando multidões de agentes de código durante a noite", chamando a prática de desperdício de recursos e geradora de código descartável. A crítica指向 para empresas que adotam agentes sem métricas claras de qualidade ou integração com pipelines de desenvolvimento.
Teknium respondeu com evidências concretas: ele roda 12 instâncias do Hermes Agent em paralelo diariamente, e o projeto atingiu o ranking top 100 de repositórios GitHub de todos os tempos. Para ele, a questão não é se agentes funcionam, mas como implementá-los corretamente.
Por que isso importa para devs brasileiros
O mercado de desenvolvimento no Brasil enfrenta pressão por produtividade. Agentes de IA prometem acelerar ciclos de desenvolvimento, mas a implementação requer:
- Infraestrutura de CI/CD robusta
- Sistemas de revisão de código automatizada
- Métricas de qualidade e cobertura de testes
- Orquestração de múltiplos agentes
Sem esses fundamentos, agentes podem gerar código que funciona superficialmente mas não escala. O custo computacional também é relevante: rodar dezenas de instâncias em paralelo consome recursos significativos, e o retorno precisa ser medido.
A realidade do mercado
A verdade está no meio do caminho. Agentes como Claude Code, Cursor e o próprio Hermes Agent demonstram capacidade real de gerar software funcional. O diferencial está na orquestração: não basta lanzar agentes aleatoriamente, é preciso definir tarefas específicas, validar resultados e integrar com o fluxo de trabalho existente.
Para devs brasileiros, o momento é de experimentação controlada. Começar com tarefas delimitadas (refatoração, geração de testes, documentação) antes de expandir para desenvolvimento completo. A curva de aprendizado existe, mas o potencial de ganho de produtividade é proporcional ao nível de maturidade da equipe.
O cenário evolui rapidamente. A cada semana, novas ferramentas surgem e a barra de qualidade sobe. A questão central não é se agentes funcionam — os dados mostram que sim, nas mãos certas — mas se sua equipe tem a infraestrutura necessária para extrair valor real deles.