News06 JunhoNvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro
Edição #115·6 de junho de 2026·2 min

🔓Nvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro

A Nvidia fez algo raro: abriu publicamente os diagramas e a lista completa de componentes dos seus novos servidores da linha Rubin, os mais poderosos que a empresa já produziu. E dentro dessa documentação apareceu um detalhe que chamou atenção de todo o setor: cada rack (aquele armário gigante de servidores) usa 9 pequenos processadores da AMD, sua principal concorrente em chips. --- O chip em questão é o AMD EPYC 3151, um processador simples, de uso embutido, que faz o papel de gerenciar funções internas do servidor. Não é o cérebro do sistema, mas é curioso ver a Nvidia precisando da rival para fazer seu próprio hardware funcionar. O projeto foi publicado no GitHub com licença aberta, o que significa que qualquer fabricante pode estudar e até replicar partes da arquitetura. --- É um movimento estratégico: ao abrir o projeto, a Nvidia facilita a vida de quem monta data centers e quer padronizar infraestrutura. E a presença da AMD ali dentro mostra que, por mais que as duas disputem mercado ferozmente, na prática o ecossistema de chips é mais interdependente do que parece.

Nvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro

A Nvidia publicou no GitHub os diagramas completos de especificação de seus novos servidores Rubin, plataforma destinada a workloads de inteligência artificial de alta performance. O anúncio trouxe uma revelação curiosa: cada rack da linha utiliza nove processadores AMD EPYC 3151, modelo da principal concorrente da empresa no mercado de semicondutores.

O hardware em detalhe

Os servidores Rubin representam a próxima geração de infraestrutura da Nvidia para treinamento de grandes modelos de linguagem (LLMs) e inferência em escala. Enquanto as GPUs Rubin permanecem como núcleo computacional, os processadores AMD EPYC 3151 desempenham funções de gerenciamento interno. Trata-se de CPUs embedded de baixo consumo, responsáveis pelo controle de energia, monitoramento térmico e diagnósticos do sistema — tarefas técnicas conhecidas como Baseboard Management Controller (BMC).

A escolha da AMD não indica competição direta com as GPUs da Nvidia no processamento de IA. Os EPYC 3151 operam em nicho específico de processamento auxiliar, distante do mercado de aceleração paralela onde as empresas disputam market share. Ainda assim, a presença da rival nos racks Rubin demonstra a interdependência prática do ecossistema de semicondutores, onde até concorrentes fornecem componentes críticos uns aos outros.

Abertura estratégica e padronização

A publicação dos esquemáticos no GitHub sob licença aberta configura um movimento atípico para a Nvidia. Ao liberar a arquitetura, a empresa permite que fabricantes de hardware, cloud providers e integradores de sistemas estudem o design sem barreiras de propriedade intelectual. A padronização resultante facilita a manutenção de data centers, reduz custos de desenvolvimento e acelera a implementação de clusters de machine learning em larga escala.

Implicações para o mercado brasileiro

Para desenvolvedores e engenheiros de infraestrutura no Brasil, a documentação aberta oferece valor técnico concreto. Empresas nacionais que buscam construir data centers próprios de IA — seja para soberania digital ou redução de custos com importação — ganham acesso a referências validadas pela maior fabricante de GPUs do mundo.

Os benefícios práticos incluem: - Acesso a esquemáticos de referência para montagem de servidores customizados - Redução da curva de aprendizado em projeto de infraestrutura de alta densidade - Possibilidade de adaptar conceitos do Rubin para realidades orçamentárias locais, utilizando componentes disponíveis no mercado doméstico

A iniciativa sinaliza uma tendência de desbloqueio de especificações de hardware corporativo, tradicionalmente mantidas sob sigilo. Em um mercado onde o custo de infraestrutura de IA representa gargalo crítico para startups e centros de pesquisa, a transparência técnica permite que builders brasileiros projetem soluções mais eficientes sem depender exclusivamente de integradores internacionais.

rubinmercadonvidiainfraestruturaservidoresamdepychardwaregpusonde

Mais da mesma edição

@eglyman

💸Ramp levanta US$ 750 milhões e expõe o maior problema das empresas com IA

A Ramp, fintech americana de gestão de gastos corporativos, levantou uma rodada de US$ 750 milhões com avaliação de US$ 44 bilhões. Mas o mais interessante não foi o cheque: foi o alerta do CEO Eric Glyman sobre como as empresas estão queimando dinheiro com inteligência artificial sem ter a menor ideia do que está funcionando. --- Glyman deu um exemplo prático: a maioria das empresas usa os modelos mais caros e poderosos (os chamados 'de fronteira') para qualquer tarefa, inclusive para resumir reuniões ou atualizar calendários, coisas que modelos mais baratos resolvem perfeitamente. Redirecionar apenas 10% de uma fatura de US$ 10 milhões em IA para modelos mais simples economizaria quase US$ 1 milhão. --- O ponto central é que a IA está se tornando o terceiro grande pilar de custo das empresas, junto com pessoas e software. Mas, diferente de salários e licenças, quase ninguém sabe medir se aquele gasto em IA realmente gerou resultado. O financeiro quer cortar, a engenharia quer dobrar, e ninguém tem dados para resolver a briga.

@ai_for_success

📱Google comprime modelos de IA para rodar no celular sem internet

O Google lançou versões ultracomprimidas dos seus modelos Gemma 4, projetadas para rodar localmente em celulares, notebooks e computadores com pouca memória. A versão mais leve, chamada Gemma 4 E2B (só texto), funciona com menos de 1 GB de memória. Para comparação, isso é menos do que muitos aplicativos de redes sociais ocupam. --- A mágica está numa técnica chamada QAT, que, em vez de simplesmente 'espremer' o modelo depois de pronto (o que destrói qualidade), já treina o modelo sabendo que ele vai ser comprimido. O resultado é um modelo muito menor que mantém boa parte da capacidade de raciocínio do original. Algumas camadas foram comprimidas a ponto de usar apenas 2 bits por parâmetro. --- Na prática, isso significa que estamos cada vez mais perto de ter IA competente funcionando offline, direto no aparelho, sem depender de servidores na nuvem. Mais privacidade, mais velocidade, menos custo. O Google já liberou os arquivos prontos para uso em dispositivos móveis.

@GeminiApp

🎨Gemini Live agora cria e edita imagens em tempo real pela câmera

O Gemini Live, modo de conversa ao vivo do assistente do Google, ganhou a capacidade de criar e editar imagens durante a conversa. Você abre o app, aperta o botão Live, compartilha a câmera e vai pedindo o que quer ver. Quer testar como ficaria um sofá diferente na sua sala? Mostra o ambiente e pede. Precisa de ajuda visual com um problema de matemática? Aponta a câmera e conversa. --- O diferencial aqui é que tudo acontece dentro da conversa, sem precisar trocar de app ou de modo. Você fala naturalmente com o Gemini enquanto ele gera e ajusta imagens na hora. É o tipo de funcionalidade que soa como demonstração de feira de tecnologia, mas que está chegando de fato ao celular de qualquer pessoa com o app instalado. --- A aposta do Google é clara: transformar o Gemini num assistente visual que entende o contexto do que você está vendo e consegue criar em cima disso. Se funcionar bem no dia a dia, é o tipo de coisa que muda a forma como pessoas decoram casas, escolhem roupas ou explicam ideias.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter