💸A Uber já torrou todo o orçamento de IA do ano
O CTO da Uber, Neppalli Naga, admitiu que as ferramentas de IA para programação - especialmente o Claude Code da Anthropic - já estouraram o orçamento inteiro de IA da empresa para 2026. Em abril. O ano mal começou a segunda metade. --- "Estou de volta à prancheta, porque o orçamento que eu achava que ia precisar já foi embora", disse ele. E não é só a Uber. Eric Vishria, sócio da Benchmark, comentou que está vendo isso em todo lugar: depois da fase de "coloca IA em tudo!", as empresas estão sendo forçadas a racionalizar o gasto. --- É o tipo de problema bom de ter, se você pensar bem. Significa que as ferramentas estão tão úteis que o pessoal não para de usar. Mas também mostra que ninguém fazia ideia de quanto ia custar quando a adoção fosse de verdade. O orçamento de IA vai virar a nova briga de CFO.
Seeing this all over. The efficiency and rationalization push is coming. Initially it was just getting everyone to use AI all over. "Opus everything!" Now the spend is material and companies will rationalize.
— @ericvishria View on X
A Uber consumiu todo o orçamento de inteligência artificial previsto para 2026 em apenas quatro meses. A admissão do CTO Neppalli Naga, feita durante conferência em abril, expõe uma realidade que está se tornando comum em empresas de tecnologia: a adoção massiva de ferramentas de coding assistido por LLM está gerando custos operacionais muito superiores às projeções iniciais.
Do experimento à linha de frente
O estouro orçamentário da Uber teve um culpado específico: o Claude Code, ferramenta da Anthropic integrada aos workflows de desenvolvimento. Segundo Naga, a utilização foi tão intensa que o orçamento planejado para o ano fiscal "já foi embora" antes da metade de 2025. O cenário reflete uma transição abrupta do estágio de "prova de conceito" para implementação real em larga escala.
Eric Vishria, sócio da Benchmark, corrobora a tendência em análise recente. Segundo o investidor, o mercado está saindo da fase de "Opus em tudo" — referência ao modelo mais robusto da Anthropic — e entrando em um ciclo de racionalização. Quando o gasto com tokens de API e assinaturas enterprise se torna material, a pressão por eficiência substitui o entusiasmo inicial.
O dilema dos custos de inferência
O problema, embora indicativo de alta produtividade, revela falhas graves de planejamento de infraestrutura. Nenhuma das grandes corporações parecia preparada para o volume real de requisições quando desenvolvedores efetivamente substituem buscas no Stack Overflow e sessões de debugging por queries contínuos em modelos como GPT-4, Claude 3.7 Sonnet ou Gemini 2.5 Pro.
Para builders e desenvolvedores brasileiros, o caso da Uber funciona como alerta prático:
- **Estimativas de uso real**: Projeções de orçamento de IA frequentemente subestimam o número de tokens consumidos em debugging complexo ou refatoração de código legado
- **Trade-off entre modelos**: A diferença de custo entre um modelo frontier (como Claude 3 Opus) e alternativas otimizadas (como Haiku ou GPT-4o-mini) pode representar economia de 90% em escala
- **Governança de acesso**: Times de platform engineering precisam implementar rate limits e routing inteligente, direcionando tarefas simples para modelos locais ou open source
A nova realidade enterprise
A disputa orçamentária está migrando dos CTOs para os CFOs. Em 2025, comissões de compras enterprise já negociam contratos de IA com a mesma rigidez aplicada a licenças de ERP ou cloud computing. A era do "shadow AI" — onde desenvolvedores utilizam chaves de API pessoais em projetos corpor