News20 JunhoEthan Mollick: empresas erram ao economizar usando IA mais burra
Edição #129·20 de junho de 2026·2 min

💡Ethan Mollick: empresas erram ao economizar usando IA mais burra

Ethan Mollick fez uma provocação que merece atenção de qualquer empresa usando IA: muitas companhias escolhem modelos mais fracos (e baratos) porque eles parecem bater as metas, mas podem estar deixando resultados muito melhores na mesa. A tentação de cortar custos com um modelo de IA mais barato é real, mas Mollick argumenta que a diferença de qualidade entre um modelo mediano e um de ponta pode ser maior do que os indicadores tradicionais conseguem captar. --- O conselho dele é prático: mesmo que a empresa já tenha escolhido um modelo mais barato, vale montar uma estrutura flexível que permita testar modelos mais inteligentes de tempos em tempos. Só assim dá para saber se a economia está, na verdade, custando oportunidades. É o tipo de armadilha clássica: otimizar pelo preço quando o verdadeiro diferencial é a qualidade.

Empresas que optam por modelos de linguagem mais baratos para reduzir custos de inferência podem estar sacrificando resultados de maior valor sem perceber. A advertência é do professor Ethan Mollick, da Wharton, que alerta para a armadilha de otimizar métricas de custo enquanto indicadores tradicionais falham em medir o ganho real de qualidade em modelos de ponta.

O custo oculto dos modelos mais baratos

A pressão por cortar despesas com IA é compreensível. Com a proliferação de LLMs — desde opções open source como Llama e Mistral até modelos proprietários como GPT-4 e Claude —, equipes de engenharia e produto enfrentam a tentação de escolher alternativas medianas que atingem benchmarks básicos a um custo por token inferior. O problema, segundo Mollick, é que a distância entre um modelo mediano e um de ponta frequentemente se manifesta em nuances que métricas automáticas não capturam: raciocínio em múltiplas etapas, menor taxa de alucinações em contextos longos, capacidade de seguir instruções complexas e geração de insights não óbvios.

Em pipelines de RAG ou automações críticas, um modelo mais fraco pode devolver uma resposta tecnicamente aceitável, mas omitir conexões relevantes ou exigir mais rodadas de refinamento humano. O custo de oportunidade se acumula silenciosamente.

Por que isso importa para o cenário brasileiro

No Brasil, onde startups e times de tecnologia frequentemente operam com capital limitado, a decisão de abrir mão de modelos mais robustos por questão de budget é comum. Contudo, builders e desenvolvedores precisam distinguir entre redução de custo eficiente e otimização prematura. Um sistema de IA que economiza dólares em API, mas demanda horas extras de revisão humana ou gera saídas genéricas para clientes, pode sair mais caro no balanço final.

A recomendação de Mollick é construir arquiteturas de IA desacopladas. Isso significa estruturar pipelines onde o provedor de LLM possa ser trocado sem reescrever a aplicação inteira. Com essa flexibilidade, é possível rodar testes A/B periódicos comparando modelos de diferentes classes — não apenas pelo preço, mas pela qualidade da saída em cenários reais de negócio.

Como testar sem quebrar o orçamento

  • Implemente uma camada de abstração na sua stack de IA para alternar entre provedores com mudanças mínimas de código.
  • Estabeleça avaliações humanas ou semiautomatizadas que vão além de acurácia simples, medindo utilidade da resposta, criatividade e redução de retrabalho.
  • Programe ciclos de validação trimestrais ou semestrais com modelos de ponta, mesmo que o dia a dia rode em alternativas mais baratas.
  • Monitore custos totais de operação, incluindo tempo de engenharia e revisão, não apenas o valor da API.

A escolha do modelo de linguagem não deve ser uma decisão definitiva feita no lançamento. Em um mercado onde a qualidade do output define a experiência do usuário, a economia na camada de inferência pode ser o primeiro passo para um produto medíocre.

modeloscustonãosemmollickqualidadepontaentremodelopode

Mais da mesma edição

@AndrewYNg

⚠️Andrew Ng: Anthropic usou 'segurança' para frear rivais e acendeu crise global

Andrew Ng, um dos nomes mais respeitados da inteligência artificial, publicou um texto duro contra a Anthropic e o governo dos Estados Unidos. Segundo ele, as duas últimas semanas foram um ponto de virada. A Anthropic lançou o Claude Fable 5, versão de seu modelo Mythos, com restrições que iam além da segurança: proibiu desenvolvedores de usar o modelo para construir tecnologia de IA concorrente. Pior, inicialmente degradou a qualidade das respostas de forma silenciosa para quem foi detectado como pesquisador de IA, sem avisar ninguém. Depois de muita reclamação, a empresa voltou atrás na parte silenciosa, mas manteve o bloqueio. --- Logo em seguida, o governo americano usou seus poderes de controle de exportação para restringir o acesso ao Fable 5, exigindo licença para qualquer estrangeiro usar o modelo. Isso levou a Anthropic a desligar o acesso mundial ao Fable. Andrew Ng aponta que Sam Altman, da OpenAI, resumiu bem a ironia: 'É um marketing incrível dizer que construiu uma bomba, que vai jogá-la na sua cabeça, e depois vender o abrigo por 100 milhões de dólares'. Ng deixa claro que não acha que a Anthropic criou nenhuma bomba e que os controles de exportação são despropositados. --- O efeito colateral, segundo Ng, é que governos do mundo inteiro agora perceberam que os EUA podem cortar seu acesso a modelos de IA da noite para o dia. Isso deve acelerar investimentos em alternativas de código aberto e em soberania digital. Ng compara a situação com o que aconteceu com semicondutores na China: quando os EUA tentaram limitar o acesso, o esforço chinês só ganhou mais força. A conclusão dele é que todos agora enxergam a fragilidade de depender de um único fornecedor, e isso pode, no final, empurrar o setor para um ecossistema mais aberto.

@emollick

📉Estudo com alunos na China confirma: IA no dever de casa derruba notas

Um estudo de larga escala feito na China encontrou o que muitos professores já desconfiavam: quando alunos usam IA para fazer dever de casa e o tempo de estudo cai, as notas nas provas caem junto. Não é que a IA seja inútil para aprender. O problema está em como ela é usada. Quando substitui o esforço mental do aluno, em vez de apoiá-lo, o resultado é negativo. --- Ethan Mollick, professor da Wharton e uma das vozes mais ativas sobre IA na educação, resumiu o padrão que aparece em vários estudos: tutoria com IA dentro da sala de aula funciona bem, mas usar IA como atalho para o dever de casa faz mal. É a diferença entre ter um professor particular e ter alguém fazendo o exercício por você. A ferramenta é a mesma, o que muda é a intenção.

@rahulgs

🤖Fintech Ramp já gera mais de 75% do seu código com agente de IA

A Ramp, fintech americana de gestão de despesas corporativas, revelou que mais de 75% do código produzido na empresa agora vem de um agente de IA interno chamado Inspect. Não é um experimento: é o dia a dia. Rahul, líder técnico do projeto, detalhou o que foi preciso para chegar nesse ponto. A lista inclui preparação minuciosa dos repositórios (a 'base de código' da empresa), remoção de ferramentas desnecessárias, testes automáticos paralelos e obsessão com velocidade, perseguindo cada milissegundo de atraso. --- Um detalhe interessante é a regra de ouro que eles seguem: as instruções para a IA devem ser descritivas ('corrija isso', 'implemente essa funcionalidade'), nunca prescritivas ('use tal ferramenta específica'). Outro ponto revelador: por enquanto, os 75% se referem principalmente a alterações menores e menos complexas. Para funcionalidades grandes, alguns engenheiros já usam o agente, mas a equipe reconhece que ainda há uma lacuna a fechar. Mesmo assim, o caso da Ramp é um dos exemplos mais concretos de adoção massiva de IA na produção de software.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter