News03 JulhoO jeito de buscar informação dentro da IA mudou completamente em 3 anos
Edição #142·3 de julho de 2026·1 min

🔍O jeito de buscar informação dentro da IA mudou completamente em 3 anos

Jerry Liu, criador do LlamaIndex (uma das ferramentas mais usadas para conectar IAs a bases de dados), fez um balanço de como a área evoluiu. Há três anos, ele ensinava técnicas avançadas de RAG, a sigla para o método que permite à IA consultar documentos antes de responder. Era tudo muito manual: você precisava ajustar como os textos eram cortados, indexados e recuperados. --- Hoje, segundo Jerry, a complexidade saiu das mãos do desenvolvedor e foi para o próprio agente de IA. Você dá ferramentas simples de busca para o agente e ele mesmo decide quais perguntas fazer para encontrar o que precisa. Outra mudança: antes o foco era hackear a janela de contexto (o limite de texto que a IA consegue processar de uma vez). Agora, o foco é decidir qual informação é realmente relevante para o problema. --- O resumo prático é que construir um assistente de IA que consulta seus documentos ficou mais simples por fora, porque a inteligência de busca migrou para dentro do modelo. Para quem usa, isso significa respostas melhores com menos configuração.

O jeito de buscar informação dentro da IA mudou completamente em 3 anos

A busca por informações dentro de modelos de IA deixou de ser um processo técnico manual para tornar-se uma capacidade autônoma dos agentes. Em três anos, a arquitetura passou de configurações complexas de RAG (Retrieval-Augmented Generation) para sistemas onde o próprio modelo decide como, onde e o que perguntar para recuperar dados relevantes.

O fim do RAG artesanal

Há três anos, implementar capacidades de busca em aplicações de IA exigia expertise profundo em estratégias de chunking, modelos de embedding e fine-tuning de parâmetros de recuperação. Desenvolvedores precisavam:

  • Segmentar documentos manualmente com tamanhos específicos de chunks
  • Ajustar algoritmos de similaridade para indexação vetorial
  • Otimizar pipelines de preprocessing para "hackear" a context window

O trabalho era essencialmente de engenharia de infraestrutura: forçar o modelo a processar mais texto do que suportava nativamente através de técnicas avançadas de fragmentação e recomposição de contexto.

Agentes como arquitetos da busca

Hoje, segundo Jerry Liu, criador do LlamaIndex, a complexidade migrou da infraestrutura para a cognição do agente. Em vez de pipelines rígidos e pré-configurados, desenvolvedores entregam ferramentas de busca simples ao agente, que formula suas próprias queries, decide quais fontes consultar e navega autonomamente entre bases de dados.

O desafio técnico deslocou-se de "como encaixar o máximo de dados possível na janela de contexto" para "como identificar informação realmente relevante para o problema específico". O intelligence retrieval migrou do middleware para dentro do próprio modelo.

O que muda para builders brasileiros

Para desenvolvedores e equipes de produto no Brasil, essa evolução representa uma redução significativa de boilerplate e complexidade operacional. S

buscamodelodadosdesenvolvedoresdentromodelostécnicoagentestrêsanos

Mais da mesma edição

@Hesamation

🔩Anthropic quer chip próprio e negocia parceria com a Samsung

A Anthropic, criadora do Claude, está em conversas com a Samsung para fabricar um chip de IA sob medida. Isso a coloca no mesmo caminho da OpenAI, que anunciou recentemente o Jalapeño, seu próprio processador. A guerra dos modelos de linguagem está virando, aos poucos, uma guerra de hardware. --- Faz sentido: depender da Nvidia para tudo é caro e cria um gargalo enorme. Quando cada empresa de IA desenha seu próprio chip, ela controla custos, otimiza desempenho e, em teoria, pode oferecer um serviço mais barato para quem usa. Dario Amodei, CEO da Anthropic, já havia sinalizado isso no ensaio 'A Adolescência da Tecnologia'. --- O recado é claro: quem quiser dominar a próxima fase da IA não vai competir só com algoritmos. Vai precisar de fábricas, engenheiros de silício e parcerias industriais pesadas. O jogo ficou muito mais caro.

@ivanhzhao

Notion entrega blocos HTML e agentes de código em menos de 24 horas

Ivan Zhao, CEO do Notion, postou um 'entrega no dia seguinte' que chamou atenção. Usuários pediram suporte a blocos HTML integrados a agentes de programação, e a equipe construiu e lançou o recurso no mesmo dia. Funciona com qualquer agente que use o protocolo MCP, o padrão aberto que conecta IAs a ferramentas externas. --- Na prática, isso significa que você pode pedir para um assistente de código gerar um componente visual (um gráfico, um formulário, uma mini aplicação) e colá-lo direto dentro de uma página do Notion. Sem sair do app, sem copiar e colar código para outro lugar. --- Velocidade de entrega virou argumento de marketing. E quando o CEO faz questão de mostrar que a funcionalidade saiu em horas, a mensagem é dupla: o produto é ágil e a equipe também. Resta ver se a qualidade acompanha o ritmo.

@emollick

🎬IA transforma livro de domínio público em filme de 15 minutos

Ethan Mollick, professor de Wharton e um dos maiores divulgadores de IA no mundo, fez um experimento curioso com a ferramenta Fable. Ele pediu que a IA pegasse o livro 'Last and First Men' (que já está em domínio público), narrasse os primeiros 15 minutos com voz gerada pela ElevenLabs e criasse animações e imagens para acompanhar a leitura. --- O resultado é um curta-metragem gerado quase inteiramente por IA, com direito a narração expressiva e visuais que acompanham o tom da história. Mollick ajustou o roteiro pelo chat, pedindo para remover o prólogo porque estava chato. A direção, se é que dá para chamar assim, foi conversacional. --- É um exemplo concreto de algo que antes exigiria uma equipe de produção, estúdio de áudio e horas de edição. Não substitui um filme de verdade, mas mostra que a barreira para contar histórias com qualidade razoável está despencando.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter