A Uber já torrou todo o orçamento de IA do ano

O CTO da Uber, Neppalli Naga, admitiu que as ferramentas de IA para programação - especialmente o Claude Code da Anthropic - já estouraram o orçamento inteiro de IA da empresa para 2026. Em abril. O ano mal começou a segunda metade. --- "Estou de volta à prancheta, porque o orçamento que eu achava que ia precisar já foi embora", disse ele. E não é só a Uber. Eric Vishria, sócio da Benchmark, comentou que está vendo isso em todo lugar: depois da fase de "coloca IA em tudo!", as empresas estão sendo forçadas a racionalizar o gasto. --- É o tipo de problema bom de ter, se você pensar bem. Significa que as ferramentas estão tão úteis que o pessoal não para de usar. Mas também mostra que ninguém fazia ideia de quanto ia custar quando a adoção fosse de verdade. O orçamento de IA vai virar a nova briga de CFO.

A Uber consumiu todo o orçamento de inteligência artificial previsto para 2026 em apenas quatro meses. A admissão do CTO Neppalli Naga, feita durante conferência em abril, expõe uma realidade que está se tornando comum em empresas de tecnologia: a adoção massiva de ferramentas de coding assistido por LLM está gerando custos operacionais muito superiores às projeções iniciais.

Do experimento à linha de frente

O estouro orçamentário da Uber teve um culpado específico: o Claude Code, ferramenta da Anthropic integrada aos workflows de desenvolvimento. Segundo Naga, a utilização foi tão intensa que o orçamento planejado para o ano fiscal "já foi embora" antes da metade de 2025. O cenário reflete uma transição abrupta do estágio de "prova de conceito" para implementação real em larga escala.

Eric Vishria, sócio da Benchmark, corrobora a tendência em análise recente. Segundo o investidor, o mercado está saindo da fase de "Opus em tudo" — referência ao modelo mais robusto da Anthropic — e entrando em um ciclo de racionalização. Quando o gasto com tokens de API e assinaturas enterprise se torna material, a pressão por eficiência substitui o entusiasmo inicial.

O dilema dos custos de inferência

O problema, embora indicativo de alta produtividade, revela falhas graves de planejamento de infraestrutura. Nenhuma das grandes corporações parecia preparada para o volume real de requisições quando desenvolvedores efetivamente substituem buscas no Stack Overflow e sessões de debugging por queries contínuos em modelos como GPT-4, Claude 3.7 Sonnet ou Gemini 2.5 Pro.

Para builders e desenvolvedores brasileiros, o caso da Uber funciona como alerta prático:

**Estimativas de uso real**: Projeções de orçamento de IA frequentemente subestimam o número de tokens consumidos em debugging complexo ou refatoração de código legado
**Trade-off entre modelos**: A diferença de custo entre um modelo frontier (como Claude 3 Opus) e alternativas otimizadas (como Haiku ou GPT-4o-mini) pode representar economia de 90% em escala
**Governança de acesso**: Times de platform engineering precisam implementar rate limits e routing inteligente, direcionando tarefas simples para modelos locais ou open source

A nova realidade enterprise

A disputa orçamentária está migrando dos CTOs para os CFOs. Em 2025, comissões de compras enterprise já negociam contratos de IA com a mesma rigidez aplicada a licenças de ERP ou cloud computing. A era do "shadow AI" — onde desenvolvedores utilizam chaves de API pessoais em projetos corpor

💸A Uber já torrou todo o orçamento de IA do ano

Do experimento à linha de frente

O dilema dos custos de inferência

A nova realidade enterprise

Mais da mesma edição

🤖Claude Code agora trabalha enquanto você dorme

Receba no seu email