OpenAI sob fogo: funcionários denunciam falha com ameaças reais

O Wall Street Journal revelou que funcionários da OpenAI levantaram alertas internos sobre a falta de um sistema para avisar a polícia quando usuários descrevem planos de violência real no ChatGPT. --- É um problema sério e que vai muito além de segurança de modelo. Quando centenas de milhões de pessoas usam um produto como confidente - pra desabafar, pedir conselho, processar emoções - inevitavelmente alguém vai descrever intenções perigosas. A questão não é se isso acontece, é o que você faz quando acontece. --- A OpenAI está numa posição que nenhuma empresa de tecnologia ocupou antes: intermediar conversas íntimas de uma fatia enorme da população mundial. A responsabilidade que vem com isso é proporcional. E pelos relatos, eles ainda não encontraram o equilíbrio.

Funcionários da OpenAI alertaram internamente sobre a ausência de protocolos claros para notificar autoridades policiais quando usuários descrevem planos de violência real no ChatGPT. A denúncia, revelada pelo Wall Street Journal, expõe uma lacuna crítica na governança de segurança da empresa líder em IA generativa, levantando questões sobre o dever de intervenção em casos de risco iminente à vida.

O caso reportado pelo WSJ

De acordo com a reportagem, colaboradores da OpenAI questionaram a falta de sistemas estruturados para comunicar law enforcement sobre ameaças concretas identificadas nas conversas. Diferente de plataformas como Meta ou WhatsApp, que mantêm canais estabelecidos com autoridades e equipes especializadas em segurança pública, a OpenAI parece operar sem procedimentos definidos para escalar situações envolvendo perigo físico iminente. O problema emerge em um contexto onde centenas de milhões de usuários tratam o ChatGPT como espaço íntimo para desabafo e processamento emocional, tornando inevitável o aparecimento de conteúdo que descreve intenções violentas.

Além da safety técnica: o dilema operacional

O debate transcende a segurança de modelo em si — aspectos técnicos como alignment, RLHF (Reinforcement Learning from Human Feedback) ou content moderation automatizada. A questão central é de governança operacional e arquitetura de responsabilidade algorítm

🚨OpenAI sob fogo: funcionários denunciam falha com ameaças reais

O caso reportado pelo WSJ

Além da safety técnica: o dilema operacional

Mais da mesma edição

🧠Sam Altman: inteligência ainda é mais importante que preço

Receba no seu email