🤡KPMG e EY publicaram relatórios sobre IA que eram alucinação de IA
A KPMG, uma das quatro maiores consultorias do mundo, publicou um relatório em outubro sobre como empresas estão adotando IA. O documento trazia estudos de caso de organizações de peso como o banco UBS, o sistema de saúde britânico NHS e o metrô de Londres. Problema: todas essas organizações disseram publicamente que as informações sobre elas no relatório eram falsas. A ferramenta GPTZero identificou que os trechos inventados eram alucinações de IA. A KPMG retirou o relatório do ar. Um mês antes, a concorrente EY já tinha feito o mesmo com outro estudo que continha notas de rodapé fabricadas. --- Pare um segundo para absorver a ironia. As consultorias que cobram fortunas para dizer às maiores empresas do planeta como adotar IA com segurança não conseguiram checar se a própria IA delas estava inventando coisas. É como um nutricionista que vende dieta e come fast food no almoço. --- Esse caso deveria ser leitura obrigatória para qualquer empresa que está terceirizando decisões estratégicas sobre IA para consultorias externas. Se os "especialistas" não verificam, quem verifica?

A KPMG, uma das quatro maiores consultorias do mundo, publicou um relatório em outubro sobre como empresas estão adotando IA. O documento trazia estudos de caso de organizações de peso como o banco UBS, o sistema de saúde britânico NHS e o metrô de Londres. Problema: todas essas organizações disseram publicamente que as informações sobre elas no relatório eram falsas. A ferramenta GPTZero identificou que os trechos inventados eram alucinações de IA. A KPMG retirou o relatório do ar. Um mês antes, a concorrente EY já tinha feito o mesmo com outro estudo que continha notas de rodapé fabricadas.
— @HedgieMarkets View on X
As consultorias KPMG e EY, duas das maiores do mundo, retiraram relatórios sobre inteligência artificial generativa após descobrir que trechos inteiros — incluindo estudos de caso e notas de rodapé — eram alucinações produzidas por modelos de linguagem (LLMs). Em outubro, a KPMG publicou um estudo sobre adoção de IA que citava falsamente o banco UBS, o NHS britânico e o metrô de Londres. Todas as organizações negaram publicamente as informações. A ferramenta GPTZero confirmou que os trechos apresentavam padrões típicos de geração automática. Um mês antes, a EY já havia removido um documento com referências bibliográficas fabricadas.
O problema técnico por trás dos erros
O caso expõe uma falha operacional recorrente no uso de LLMs: a ausência de um pipeline de validação robusto entre a geração de texto e a publicação final. Alucinações em modelos como GPT-4, Claude ou Llama não são exceções técnicas, mas comportamentos inerentes à arquitetura transformer, que prevê tokens baseado em probabilidade estatística e não em verificação factual ou acesso a base de dados verificada.
Quando empresas utilizam IA generativa para produzir conteúdo corporativo sem camadas de checagem — seja por Retrieval-Augmented Generation (RAG) conectado a fontes primárias, revisão editorial especializada ou cruzamento sistemático com dados oficiais — o resultado são informações sintéticas apresentadas como verdadeiras.
Para desenvolvedores, engenheiros de machine learning e líderes técnicos no Brasil, os episódios reforçam pontos críticos:
- Fine-tuning e prompt engineering reduzem, mas não eliminam, a taxa de alucinação em conteúdo factual;
- Sistemas de IA corporativa exigem governança de dados, versionamento de prompts e auditoria humana antes de qualquer deploy público;
- Ferramentas de detecção de IA, como o GPTZero, funcionam como alarmes reativos, não como barreiras preventivas no fluxo de publicação.
O alerta para o mercado brasileiro
No Brasil, onde grandes corporações, bancos e startups frequentemente terceirizam estratégias de transformação digital para consultorias globais, o risco é duplo. Além de danos reputacionais imediatos, a disseminação de informações incorretas por documentos oficiais pode gerar consequências legais e regulatórias, especialmente sob a Lei Geral de Proteção de Dados (LGPD) e futuras normas de inteligência artificial em tramitação no Congresso Nacional.
Builders e devs brasileiros devem tratar o episódio como um teste de estresse real: se as maiores consultorias do planeta falharam na validação básica de saída de modelo, a responsabilidade pela verificação de fatos recai sobre quem constrói e implementa a tecnologia. A lição é direta: IA generativa acelera a produção de conteúdo e pode auxiliar na pesquisa, mas jamais substitui o controle de qualidade, a checagem humana e a responsabilidade final sobre o que é publicado.
