News30 MaioHermes Agent aprende a carregar só as ferramentas que precisa
Edição #108·30 de maio de 2026·2 min

🧰Hermes Agent aprende a carregar só as ferramentas que precisa

A Nous Research, laboratório por trás do Hermes Agent (um assistente de IA que executa tarefas conectando-se a vários serviços), lançou um recurso chamado Tool Search. Na prática, o agente agora só carrega na memória as ferramentas que realmente vai usar naquela tarefa, em vez de empilhar tudo de uma vez. --- Por que isso importa? Todo modelo de IA tem um limite de "contexto", a quantidade de informação que consegue processar de uma vez. Quando você conecta dezenas de ferramentas externas, elas ocupam esse espaço e o agente fica mais lento e impreciso. Com o Tool Search, se as ferramentas passarem de 10% do contexto disponível, o sistema ativa automaticamente a busca inteligente. --- Parece um detalhe técnico, mas faz diferença enorme: é o que permite que um agente de IA se conecte a centenas de serviços sem perder qualidade. Tecnologias assim vão definir quais assistentes realmente funcionam no dia a dia.

O Hermes Agent, assistente de IA da Nous Research que executa tarefas conectando-se a serviços externos, agora carrega apenas as ferramentas necessárias para cada tarefa. O novo recurso Tool Search ativa uma busca inteligente quando as ferramentas ultrapassam 10% do contexto disponível, resolvendo um dos principais gargalos de agentes de IA.

O problema do contexto em agentes de IA

Todo modelo de linguagem possui um limite de contexto, a quantidade de informação que consegue processar simultaneamente. Quando um agente precisa se conectar a dezenas de serviços externos, cada ferramenta adicionada consume esse espaço limitado. O resultado é queda de performance, latência elevada e respostas menos precisas.

O Tool Search resolve isso fazendo uma seleção dinâmica. Em vez de carregar todas as ferramentas disponíveis na memória, o sistema identifica apenas aquelas relevantes para a tarefa específica e as carrega sob demanda. O threshold de 10% do contexto serve como gatilho automático para ativar essa busca inteligente.

Impacto para developers e builders brasileiros

Para quem desenvolve agentes de IA no Brasil, essa abordagem representa uma mudança arquitetural significativa. A capacidade de conectar centenas de serviços sem degradação de performance é o que separa assistentes que funcionam na prática daqueles que ficam restritos a demos.

Desenvolvedores que trabalham com integrações via API, automações de workflows e agentes multi-serviços enfrentam diretamente esse desafio. O Tool Search permite escalar o número de conexões sem comprometer a qualidade das respostas, algo essencial para aplicações comerciais reais.

Além disso, a otimização de contexto reduz custos computacionais. Menos tokens processados significa menor gasto com inference, algo relevante tanto para startups quanto para empresas que inúmerem agentes em produção.

O futuro dos assistentes de IA

Tecnologias de seleção inteligente de ferramentas são o que possibilitam agentes realmente funcionais no dia a dia. A tendência é que mais frameworks adotem abordagens similares, onde a gestão eficiente do contexto se torna um diferencial competitivo.

Para o ecossistema brasileiro de IA, isso significa que a barreira para construir assistentes complexos diminui. Builders podem focar na lógica de negócio e nas integrações necessárias, sem precisar otimizar manualmente o consumo de contexto de seus agentes.

contextoagentesferramentasserviçostoolsearchinteligentesemassistentesexternos

Mais da mesma edição

@koltregaskes

🖥️OpenAI leva o Codex ao Windows com controle remoto pelo celular

A OpenAI liberou o Codex, seu agente de programação, para Windows. A novidade permite que o Codex controle diretamente o computador do usuário, executando tarefas reais na máquina. E tem mais: agora dá para iniciar, acompanhar e ajustar essas tarefas pelo aplicativo do ChatGPT no celular, enquanto o trabalho continua rodando no PC. --- O recurso ainda está em fase inicial, mas a ideia é clara: você sai de casa, abre o celular e continua pilotando o que a IA está fazendo no seu computador. É um passo concreto na direção de agentes que realmente trabalham por você, não só respondem perguntas. --- Vale o alerta honesto de quem já testou: Kolt Regas, que acompanha de perto essas ferramentas, elogiou a velocidade da entrega da OpenAI, mas notou que o acesso remoto do Claude (da Anthropic) ainda trava bastante. A esperança é que a versão da OpenAI seja mais estável.

@AndrewMayne

📉O que custava US$ 1,2 milhão com o GPT-3 agora sai por centavos

Andrew Mayne, escritor e divulgador de tecnologia, fez uma conta que assusta: processar 20 bilhões de tokens (a unidade que mede o volume de texto que a IA lê e gera) com a versão original do GPT-3, lançada em 2020, custaria US$ 1,2 milhão. Hoje, o mesmo volume custa uma fração disso, graças à queda brutal nos preços das APIs. --- Para ter uma ideia, o GPT-3 cobrava US$ 0,06 a cada mil tokens. Os modelos atuais, especialmente os mais leves, cobram valores centenas de vezes menores. Isso muda completamente quem consegue usar IA: o que era privilégio de grandes empresas com orçamento gordo agora está ao alcance de startups pequenas e até de projetos pessoais. --- É o tipo de número que coloca em perspectiva a velocidade dessa revolução. Em menos de cinco anos, o custo de usar inteligência artificial desabou de forma que quase nenhuma outra tecnologia conseguiu igualar.

@LundukeJournal

🎤Jensen Huang faz keynote em Taipei na segunda e o mercado especula

O CEO da NVIDIA, Jensen Huang, vai subir ao palco do Taipei Music Center, em Taiwan, na próxima segunda-feira. O evento acontece durante a Computex, a maior feira de tecnologia da Ásia, e tradicionalmente é palco de grandes anúncios da empresa. --- A pergunta que muita gente faz: será mais um "PC focado em IA" ou teremos algo realmente novo? O ceticismo é compreensível. Nos últimos anos, várias keynotes de hardware prometeram revoluções que, na prática, eram reempacotamentos. Mas a NVIDIA tem carta na manga: ela domina o mercado de chips para treinar modelos de IA e qualquer novidade sobre a próxima geração de GPUs pode mexer com todo o setor. --- Fique de olho. Se vier anúncio de novo hardware ou parceria estratégica, a gente cobre na edição de terça.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter