6 de junho de 2026

Nvidia usa chip da AMD nos próprios servidores

9 notícias

🔓Nvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro

A Nvidia fez algo raro: abriu publicamente os diagramas e a lista completa de componentes dos seus novos servidores da linha Rubin, os mais poderosos que a empresa já produziu. E dentro dessa documentação apareceu um detalhe que chamou atenção de todo o setor: cada rack (aquele armário gigante de servidores) usa 9 pequenos processadores da AMD, sua principal concorrente em chips. --- O chip em questão é o AMD EPYC 3151, um processador simples, de uso embutido, que faz o papel de gerenciar funções internas do servidor. Não é o cérebro do sistema, mas é curioso ver a Nvidia precisando da rival para fazer seu próprio hardware funcionar. O projeto foi publicado no GitHub com licença aberta, o que significa que qualquer fabricante pode estudar e até replicar partes da arquitetura. --- É um movimento estratégico: ao abrir o projeto, a Nvidia facilita a vida de quem monta data centers e quer padronizar infraestrutura. E a presença da AMD ali dentro mostra que, por mais que as duas disputem mercado ferozmente, na prática o ecossistema de chips é mais interdependente do que parece.

@eglyman

💸Ramp levanta US$ 750 milhões e expõe o maior problema das empresas com IA

A Ramp, fintech americana de gestão de gastos corporativos, levantou uma rodada de US$ 750 milhões com avaliação de US$ 44 bilhões. Mas o mais interessante não foi o cheque: foi o alerta do CEO Eric Glyman sobre como as empresas estão queimando dinheiro com inteligência artificial sem ter a menor ideia do que está funcionando. --- Glyman deu um exemplo prático: a maioria das empresas usa os modelos mais caros e poderosos (os chamados 'de fronteira') para qualquer tarefa, inclusive para resumir reuniões ou atualizar calendários, coisas que modelos mais baratos resolvem perfeitamente. Redirecionar apenas 10% de uma fatura de US$ 10 milhões em IA para modelos mais simples economizaria quase US$ 1 milhão. --- O ponto central é que a IA está se tornando o terceiro grande pilar de custo das empresas, junto com pessoas e software. Mas, diferente de salários e licenças, quase ninguém sabe medir se aquele gasto em IA realmente gerou resultado. O financeiro quer cortar, a engenharia quer dobrar, e ninguém tem dados para resolver a briga.

@ai_for_success

📱Google comprime modelos de IA para rodar no celular sem internet

O Google lançou versões ultracomprimidas dos seus modelos Gemma 4, projetadas para rodar localmente em celulares, notebooks e computadores com pouca memória. A versão mais leve, chamada Gemma 4 E2B (só texto), funciona com menos de 1 GB de memória. Para comparação, isso é menos do que muitos aplicativos de redes sociais ocupam. --- A mágica está numa técnica chamada QAT, que, em vez de simplesmente 'espremer' o modelo depois de pronto (o que destrói qualidade), já treina o modelo sabendo que ele vai ser comprimido. O resultado é um modelo muito menor que mantém boa parte da capacidade de raciocínio do original. Algumas camadas foram comprimidas a ponto de usar apenas 2 bits por parâmetro. --- Na prática, isso significa que estamos cada vez mais perto de ter IA competente funcionando offline, direto no aparelho, sem depender de servidores na nuvem. Mais privacidade, mais velocidade, menos custo. O Google já liberou os arquivos prontos para uso em dispositivos móveis.

@GeminiApp

🎨Gemini Live agora cria e edita imagens em tempo real pela câmera

O Gemini Live, modo de conversa ao vivo do assistente do Google, ganhou a capacidade de criar e editar imagens durante a conversa. Você abre o app, aperta o botão Live, compartilha a câmera e vai pedindo o que quer ver. Quer testar como ficaria um sofá diferente na sua sala? Mostra o ambiente e pede. Precisa de ajuda visual com um problema de matemática? Aponta a câmera e conversa. --- O diferencial aqui é que tudo acontece dentro da conversa, sem precisar trocar de app ou de modo. Você fala naturalmente com o Gemini enquanto ele gera e ajusta imagens na hora. É o tipo de funcionalidade que soa como demonstração de feira de tecnologia, mas que está chegando de fato ao celular de qualquer pessoa com o app instalado. --- A aposta do Google é clara: transformar o Gemini num assistente visual que entende o contexto do que você está vendo e consegue criar em cima disso. Se funcionar bem no dia a dia, é o tipo de coisa que muda a forma como pessoas decoram casas, escolhem roupas ou explicam ideias.

@paulg

🏥Startup do YC constrói máquina de ressonância magnética em 101 dias

Paul Graham, cofundador da Y Combinator (a mais famosa aceleradora de startups do mundo), revelou que uma startup da turma atual do programa construiu uma máquina de ressonância magnética em apenas 101 dias. Para quem não sabe, um equipamento desses normalmente leva anos de desenvolvimento, custa milhões de dólares e é dominado por um punhado de gigantes como Siemens e GE. --- Graham não deu muitos detalhes sobre a startup, mas o fato em si é um sinal poderoso de como a combinação de IA, simulação computacional e uma equipe pequena e focada está encurtando ciclos que antes pareciam intocáveis. Construir hardware médico complexo em pouco mais de três meses seria impensável há poucos anos. --- É o tipo de história que ilustra uma tendência maior: startups conseguindo competir em mercados de hardware pesado que antes eram reservados para corporações com orçamentos bilionários. Se a máquina realmente funcionar com qualidade clínica, pode sacudir um mercado onde um único equipamento pode custar mais de US$ 1 milhão.

@leerob

⚡Vice-presidente do Cursor mostra o que faz num dia com agentes de IA

Lee Robinson, vice-presidente de produto do Cursor (editor de código turbinado com IA), compartilhou o que fez em um único dia usando agentes de código. A lista é absurda: criou uma landing page inteira a partir de um áudio de 10 minutos, saiu para jantar e voltou com 90% pronto. Mandou agentes analisarem dados de SEO e aplicarem correções automaticamente. Usou IA para filtrar milhares de e-mails de uma lista de espera e gerar uma planilha com os contatos mais relevantes e o motivo de cada um. Atualizou um app interno de pesquisas em poucas horas. E ainda colocou agentes para pesquisar móveis na internet e montar um 'carrinho de compras' personalizado com fotos, preços e links. --- O ponto mais revelador: a maioria dessas tarefas rodou em segundo plano, na nuvem, enquanto ele estava em reuniões. Ele só checava o progresso pelo celular entre um compromisso e outro. E mesmo com esse uso intenso, ele calcula que ficaria dentro do plano de US$ 200 por mês. --- É tentador descontar isso como propaganda, já que ele trabalha no Cursor. Mas o nível de detalhe e a variedade das tarefas dão uma ideia concreta de para onde o trabalho de conhecimento está caminhando: menos execução manual, mais supervisão e direção.

@AnthropicAI

🧪Claude vira químico e rivaliza com software especializado de laboratório

A Anthropic publicou uma pesquisa mostrando que o Claude Opus 4.7 consegue analisar espectros de ressonância magnética nuclear (NMR), a principal ferramenta que químicos usam para entender a estrutura de moléculas. Em vários testes, o modelo igualou e, em algumas tarefas, superou softwares dedicados que os laboratórios usam há décadas. --- Para quem não é da área: a espectroscopia NMR é como um 'raio-X' das moléculas. Ela revela como os átomos estão organizados, algo essencial para desenvolver remédios, materiais e compostos químicos. Interpretar esses dados exige anos de treinamento especializado, e agora um modelo de linguagem está mostrando que consegue fazer parte desse trabalho. --- Isso não significa que químicos vão ser substituídos amanhã. Mas mostra que a IA generativa está encontrando utilidade em áreas técnicas muito específicas, bem longe de chatbots e geração de texto. Se o Claude consegue ler um espectro de NMR, a lista de profissões que vão ganhar um 'copiloto' de IA acaba de ficar bem maior.

@AravSrinivas

🔍Perplexity adiciona Nemotron 3 Ultra, modelo aberto da Nvidia

A Perplexity, buscador com IA, disponibilizou o Nemotron 3 Ultra para seus assinantes dos planos Pro e Max. O modelo foi criado pela Nvidia e é descrito como o principal modelo aberto de IA dos Estados Unidos, projetado especialmente para tarefas longas com agentes, aquelas em que a IA precisa executar vários passos seguidos sem perder o fio da meada. --- O anúncio foi feito por Aravind Srinivas, CEO da Perplexity, que vem integrando cada vez mais modelos de diferentes empresas na plataforma. A ideia é dar ao usuário a opção de escolher qual 'cérebro' quer por trás das suas buscas, dependendo da tarefa. Para pesquisas complexas que exigem muitos passos, o Nemotron pode ser uma opção melhor que modelos mais generalistas. --- É um movimento que reforça uma tendência: em vez de apostar tudo em um único modelo, plataformas como a Perplexity estão virando 'supermercados de IA', onde você escolhe o modelo mais adequado para cada situação.

@ai_for_success

🎙️Google lança app gratuito que transcreve e traduz por voz, tudo offline

O Google lançou o Eloquent, um aplicativo gratuito de ditado e transcrição por voz para Mac e iPhone que funciona inteiramente no seu aparelho, sem enviar nada para a nuvem. Ele roda com o modelo Gemma 12B e consegue transcrever áudio, traduzir entre idiomas, ditar texto e até polir o que você falou, tudo localmente. --- Quem testou relata que a transcrição é surpreendentemente boa, mesmo em arquivos curtos de 3 a 4 minutos. O app faz parte do projeto Google AI Edge, a aposta da empresa em colocar inteligência artificial para funcionar direto nos dispositivos, sem depender de conexão com internet. --- Para quem trabalha com entrevistas, reuniões ou simplesmente prefere falar em vez de digitar, é o tipo de ferramenta que pode entrar na rotina rápido. O fato de ser offline resolve duas dores de uma vez: funciona em qualquer lugar e seus dados não saem do aparelho.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter