🔓Anthropic hackeada: modelo de ciberataque vazou
A Anthropic, que vive repetindo que é "o lab responsável de IA", acaba de passar pelo vexame do ano. Hackers conseguiram acesso ao Mythos, um modelo secreto da empresa capaz de hackear qualquer sistema operacional e navegador. Um modelo tão perigoso que a própria Anthropic decidiu não liberar para o público. --- O caminho da invasão é quase cômico: a Mercor, empresa terceirizada que ajuda no treinamento, foi comprometida. Com acesso às convenções internas de nomes dos modelos, os hackers adivinharam os padrões de URL, usaram credenciais que ainda funcionavam e entraram. Não só no Mythos - em todo o pipeline de modelos não lançados. --- A empresa confirmou estar "investigando um relato de acesso por meio de um fornecedor terceirizado". Traduzindo: o modelo mais perigoso que eles já criaram foi acessado no primeiro dia. Dá raiva que uma empresa que se posiciona como a mais segura tenha um fornecedor com credenciais ativas sem rotação.

BREAKING: Anthropic's Most Dangerous Model Ever Breached By Hackers anthropic builds a cyberweapon, calls it mythos, "can hack every major OS and browser", dario: "we're the safe & responsible ai lab", "can't release it to the public", Mercor (their training contractor) gets breached, leaks anthropic's model naming conventions, hackers guess the URL pattern, contractor credentials still work, they're inside. The group also has access to other unreleased Anthropic models. Not just Mythos. The whole pipeline. Anthropic's statement: "investigating a report of access through one of our third-party vendor environments." Mythos got breached on day one.
— @ns123abc View on X
O modelo de IA restrito Mythos, desenvolvido pela Anthropic como ferramenta de ciberataque capaz de comprometer sistemas operacionais e navegadores, foi acessado por hackers no primeiro dia de sua existência. A brecha ocorreu não por falha técnica sofisticada nos servidores da Anthropic, mas por vulnerabilidades básicas em sua cadeia de suprimentos digitais.
Como aconteceu o vazamento
A invasão teve origem na Mercor, contratada para treinamento de modelos. Após comprometer os sistemas da empresa terceirizada, os atacantes obtiveram acesso às convenções internas de nomenclatura dos modelos da Anthropic. Com esses padrões em mãos, conseguiram deduzir a estrutura de URLs dos endpoints não públicos e utilizaram credenciais de contratantes que permaneciam ativas — aparentemente sem rotação adequada — para acessar não apenas o Mythos, mas todo o pipeline de modelos não lançados.
A Anthropic confirmou estar "investigando um relato de acesso por meio de um fornecedor terceirizado", validando que a falha estrutural reside na governança de acessos externos.
O paradoxo do "laboratório responsável"
A ironia é evidente: enquanto a empresa se posiciona publicamente como o "laboratório seguro e responsável de IA", recusando-se a liberar o Mythos por seus riscos à cibersegurança global, mantinha práticas de segurança elementares negligenciadas. O modelo, descrito internamente como capaz de hackear "todo sistema operacional e navegador majoritário", representa exatamente o tipo de capacidade ofensiva que a comunidade tech teme cair em mãos erradas.
Implicações para builders e devs brasileiros
Para desenvolvedores e arquitetos de software no Brasil, o incidente expõe falhas críticas em estratégias de segurança:
- **Riscos de supply chain**: Terceirização de treinamento de IA não pode ignorar controles de acesso rigorosos
- **Gestão de credenciais**: A ausência de rotação automática de tokens e chaves em ambientes de contratantes representa vetor de ataque de baixo custo para adversários
- **Segurança por obscuridade**: Depender de padrões de nomenclatura secretos para proteger endpoints provou-se insuficiente contra reconhecimento de padrões
O caso demonstra que mesmo laboratórios de ponta em pesquisa de IA falham em implementar zero-trust architecture em seus ecossistemas de desenvolvimento. Para times brasileiros que integram APIs de modelos fechados ou dependem de contractors remotos, a lição é clara: a superfície de ataque estende-se além dos próprios servidores, exigindo auditoria contínua de permissões e isolamento estrito de ambientes de terceiros.


