News06 JunhoPerplexity adiciona Nemotron 3 Ultra, modelo aberto da Nvidia
Edição #115·6 de junho de 2026·2 min

🔍Perplexity adiciona Nemotron 3 Ultra, modelo aberto da Nvidia

A Perplexity, buscador com IA, disponibilizou o Nemotron 3 Ultra para seus assinantes dos planos Pro e Max. O modelo foi criado pela Nvidia e é descrito como o principal modelo aberto de IA dos Estados Unidos, projetado especialmente para tarefas longas com agentes, aquelas em que a IA precisa executar vários passos seguidos sem perder o fio da meada. --- O anúncio foi feito por Aravind Srinivas, CEO da Perplexity, que vem integrando cada vez mais modelos de diferentes empresas na plataforma. A ideia é dar ao usuário a opção de escolher qual 'cérebro' quer por trás das suas buscas, dependendo da tarefa. Para pesquisas complexas que exigem muitos passos, o Nemotron pode ser uma opção melhor que modelos mais generalistas. --- É um movimento que reforça uma tendência: em vez de apostar tudo em um único modelo, plataformas como a Perplexity estão virando 'supermercados de IA', onde você escolhe o modelo mais adequado para cada situação.

Perplexity oferece acesso ao Nemotron 3 Ultra para assinantes Pro e Max

A Perplexity, plataforma de busca com IA, agora permite que seus assinantes dos planos Pro e Max utilizem o Nemotron 3 Ultra, modelo desenvolvido pela Nvidia. A inclusão foi anunciada por Aravind Srinivas, CEO da empresa, e posiciona o modelo como uma opção para tarefas complexas que exigem raciocínio prolongado.

O Nemotron 3 Ultra é descrito pela Nvidia como o principal modelo aberto de IA dos Estados Unidos. Diferente de modelos fechados, seu código e pesos estão disponíveis para desenvolvedores que desejam fine-tuning ou implementação em ambientes próprios. O modelo foi projetado especificamente para tarefas longas com agentes, onde a IA precisa executar múltiplos passos consecutivos mantendo coerência no raciocínio.

Essa característica o diferencia de modelos mais generalistas. Enquanto assistentes tradicionais respondem perguntas em uma única interação, agentes de IA precisam planejar, executar sub-tarefas e adaptar o plano conforme o resultado parcial. O Nemotron 3 Ultra foi otimizado justamente para esse fluxo de trabalho.

O que muda para usuários da Perplexity

A adição reforça a estratégia da plataforma de funcionar como agregadora de modelos. Em vez de depender de um único "cérebro" para todas as consultas, usuários podem escolher qual modelo melhor atende cada necessidade. Para pesquisas que exigem análise profunda e múltiplas etapas, o Nemotron pode oferecer desempenho superior a alternativas mais generalistas.

Essa abordagem de mercado de modelos representa uma mudança no ecossistema de IA. Em vez de competir apenas pelo melhor modelo único, plataformas competem pela melhor experiência de seleção e combinação de ferramentas.

Relevância para builders e devs brasileiros

Para desenvolvedores que integram IA em aplicações, a disponibilidade do Nemotron na Perplexity oferece uma referência prática de desempenho. O modelo aberto da Nvidia pode ser testado sem custos elevados de infraestrutura, permitindo comparação com alternativas como Llama, Mistral ou modelos da Anthropic.

No contexto brasileiro, onde muitas startups constroem soluções de IA sobre modelos de terceiros, entender as diferenças entre opções disponíveis ajuda na tomada de decisão técnica. Tasks que exigem raciocínio em cadeia — como análise de documentos extensos, automação de fluxos de trabalho ou construção de agentes autônomos — podem se beneficiar da arquitetura especializada do Nemotron.

A tendência de agregadores como Perplexity também sinalizadireção para o mercado: em vez de depender de um único fornecedor, arquiteturas modernas de IA tendem a combinar múltiplos modelos conforme a tarefa. Para builders brasileiros, isso significa maior flexibilidade na escolha de ferramentas, mas também a necessidade de avaliar custo-benefício e latência de cada opção.

nemotronmodelomodelosperplexityultrapelanvidiafoiexigemraciocínio

Mais da mesma edição

@SemiAnalysis_

🔓Nvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro

A Nvidia fez algo raro: abriu publicamente os diagramas e a lista completa de componentes dos seus novos servidores da linha Rubin, os mais poderosos que a empresa já produziu. E dentro dessa documentação apareceu um detalhe que chamou atenção de todo o setor: cada rack (aquele armário gigante de servidores) usa 9 pequenos processadores da AMD, sua principal concorrente em chips. --- O chip em questão é o AMD EPYC 3151, um processador simples, de uso embutido, que faz o papel de gerenciar funções internas do servidor. Não é o cérebro do sistema, mas é curioso ver a Nvidia precisando da rival para fazer seu próprio hardware funcionar. O projeto foi publicado no GitHub com licença aberta, o que significa que qualquer fabricante pode estudar e até replicar partes da arquitetura. --- É um movimento estratégico: ao abrir o projeto, a Nvidia facilita a vida de quem monta data centers e quer padronizar infraestrutura. E a presença da AMD ali dentro mostra que, por mais que as duas disputem mercado ferozmente, na prática o ecossistema de chips é mais interdependente do que parece.

@eglyman

💸Ramp levanta US$ 750 milhões e expõe o maior problema das empresas com IA

A Ramp, fintech americana de gestão de gastos corporativos, levantou uma rodada de US$ 750 milhões com avaliação de US$ 44 bilhões. Mas o mais interessante não foi o cheque: foi o alerta do CEO Eric Glyman sobre como as empresas estão queimando dinheiro com inteligência artificial sem ter a menor ideia do que está funcionando. --- Glyman deu um exemplo prático: a maioria das empresas usa os modelos mais caros e poderosos (os chamados 'de fronteira') para qualquer tarefa, inclusive para resumir reuniões ou atualizar calendários, coisas que modelos mais baratos resolvem perfeitamente. Redirecionar apenas 10% de uma fatura de US$ 10 milhões em IA para modelos mais simples economizaria quase US$ 1 milhão. --- O ponto central é que a IA está se tornando o terceiro grande pilar de custo das empresas, junto com pessoas e software. Mas, diferente de salários e licenças, quase ninguém sabe medir se aquele gasto em IA realmente gerou resultado. O financeiro quer cortar, a engenharia quer dobrar, e ninguém tem dados para resolver a briga.

@ai_for_success

📱Google comprime modelos de IA para rodar no celular sem internet

O Google lançou versões ultracomprimidas dos seus modelos Gemma 4, projetadas para rodar localmente em celulares, notebooks e computadores com pouca memória. A versão mais leve, chamada Gemma 4 E2B (só texto), funciona com menos de 1 GB de memória. Para comparação, isso é menos do que muitos aplicativos de redes sociais ocupam. --- A mágica está numa técnica chamada QAT, que, em vez de simplesmente 'espremer' o modelo depois de pronto (o que destrói qualidade), já treina o modelo sabendo que ele vai ser comprimido. O resultado é um modelo muito menor que mantém boa parte da capacidade de raciocínio do original. Algumas camadas foram comprimidas a ponto de usar apenas 2 bits por parâmetro. --- Na prática, isso significa que estamos cada vez mais perto de ter IA competente funcionando offline, direto no aparelho, sem depender de servidores na nuvem. Mais privacidade, mais velocidade, menos custo. O Google já liberou os arquivos prontos para uso em dispositivos móveis.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter