News›17 Maio›O maior site de artigos científicos proibiu citação inventada por IA

Edição #95·17 de maio de 2026·1 min

📚O maior site de artigos científicos proibiu citação inventada por IA

O arxiv é o maior repositório de artigos científicos do mundo. É onde pesquisadores de física, matemática e computação publicam o trabalho antes mesmo de sair em revista. Ele acaba de proibir artigos com "citações alucinadas": referências a outros trabalhos que a IA inventou e que não existem. --- Por que virou problema: pesquisadores passaram a usar IA pra escrever partes dos artigos, e a IA, quando não sabe, inventa uma fonte que parece real. Autor plausível, título plausível, tudo falso. Isso já estava poluindo a literatura científica de verdade. --- A cientista Sabine Hossenfelder fez uma observação afiada sobre isso. Metade das citações em artigos científicos sempre foi "política": o autor cita certos trabalhos pra agradar quem vai revisar o dele, não porque ajudam o leitor. A IA só escancarou um vício que já existia. O lado bom é que pode forçar a academia a citar com mais honestidade.

O arxiv é o maior repositório de artigos científicos do mundo. É onde pesquisadores de física, matemática e computação publicam o trabalho antes mesmo de sair em revista. Ele acaba de proibir artigos com "citações alucinadas": referências a outros trabalhos que a IA inventou e que não existem.
— @skdh View on X

O repositório arXiv, maior arquivo de preprints científicos do mundo, atualizou suas diretrizes para proibir explicitamente citações fabricadas por inteligência artificial. A medida visa conter a disseminação de referências bibliográficas inexistentes — um fenômeno técnico conhecido como *hallucination* — geradas por modelos de linguagem (LLMs) durante a redação de artigos.

O problema das referências inexistentes

O arXiv hospeda trabalhos de física, matemática e ciência da computação antes mesmo da revisão por pares tradicional. Pesquisadores têm utilizado LLMs para acelerar a escrita de seções metodológicas e revisões de literatura. Ocorre que, quando esses modelos não encontram dados específicos em seus parâmetros de treinamento, tendem a inventar autores, títulos e até DOIs plausíveis, mas falsos.

Esse tipo de erro não é meramente cosmético. Uma citação inexistente inserida em um artigo pode ser replicada em trabalhos subsequentes, criando um efeito cascata que corrompe a integridade da literatura acadêmica. Para desenvolvedores que utilizam papers como fonte primária de validação técnica — especialmente em áreas como machine learning e engenharia de software —, a presença de referências fantasmas compromete a rastreabilidade de algoritmos e técnicas citadas.

Um v

referênciasarxivinexistentesmodelosllmstrabalhosliteraturanãorepositóriomaior

Mais da mesma edição

@gregisenberg

🗺️Greg Isenberg lista as 36 maiores oportunidades de negócio do momento

O Greg Isenberg (investidor e empreendedor conhecido por mapear tendências) publicou uma lista das 36 maiores oportunidades de negócio agora. Não é teoria solta. É o tipo de mapa que dá pra usar pra decidir o que construir. --- Alguns destaques que conversam com quem está aprendendo a construir: a maior oportunidade para consumidor seria resolver solidão (espaços de convívio, apps de comunidade, encontros presenciais). A maior entre empresas seria "funcionários de IA gerenciados", agentes que a empresa contrata como contrataria gente. A mais negligenciada seria tecnologia para idosos. E uma das maiores em talento é justamente treinar pessoas não técnicas para operar agentes de IA. --- Outras que valem o olho: verificação de que você é humano de verdade (toda plataforma vai precisar disso em 2 anos, segundo ele), e produtos com cara analógica, vinil, papel, feito à mão, como contraposição a tudo virar IA. A lista inteira está no link. Vale ler com calma e marcar duas ou três que conversam com o que você já sabe fazer.

@testingcatalog

🐘Próximo Grok é gigante e treina com dados do Cursor pra codar melhor

A xAI (empresa de IA do Elon Musk) está perto de lançar a próxima grande versão do Grok. O Elon confirmou: o modelo tem 1,5 trilhão de parâmetros e sai em 3 a 4 semanas. Parâmetros são, de forma simples, os "neurônios" do modelo. Quanto mais, maior a capacidade bruta. --- O detalhe que importa: ele está sendo treinado com dados do Cursor, um dos editores de código com IA mais usados do mundo. Treinar o Grok com esse material é uma aposta direta em fazer dele um modelo forte pra programação, território hoje dominado por Claude e Codex. --- Elon prometeu que vai ser um "banger", um estouro. Promessa de Elon a gente desconta pela metade. Mas se o Grok virar uma opção real pra código, a briga de quatro (Anthropic, OpenAI, Google e xAI) fica de verdade equilibrada.

@jxnlco

☕Como fazer o Codex preparar a sua manhã sozinho

O Jason Liu (engenheiro conhecido, usa o apelido jxnlco) compartilhou um uso prático e fácil de copiar do Codex, o agente de programação da OpenAI. Ele automatizou a preparação da manhã. --- O pedido que ele dá ao agente, traduzido: "Toda manhã, vasculhe meu Slack, Gmail, calendário e Linear pra me ajudar a preparar o dia. Salve no meu Obsidian e revise as notas anteriores pra entender o que preciso priorizar." Linear é um app de organizar tarefas. Obsidian é um app de notas. --- O agente faz isso sozinho todo dia. Quando o Jason senta pra trabalhar, já tem um resumo pronto do que importa. Você não precisa ser programador pra adaptar a ideia. É um exemplo concreto de agente cuidando de trabalho administrativo chato, o tipo de tarefa que some da sua lista sem você sentir falta.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter