News30 MaioDeepSeek-V4-Pro ganha versão corrigida no Hugging Face
Edição #108·30 de maio de 2026·2 min

🔧DeepSeek-V4-Pro ganha versão corrigida no Hugging Face

Julien Chaumond, cofundador do Hugging Face (a maior plataforma aberta para modelos de IA), anunciou que uma versão corrigida do DeepSeek-V4-Pro já está disponível. O modelo, otimizado pela NVIDIA no formato NVFP4 (uma técnica de compressão que reduz o tamanho sem perder muita qualidade), tinha problemas na primeira publicação. --- O DeepSeek é um dos modelos chineses de IA que mais chamaram atenção nos últimos meses, competindo de frente com modelos ocidentais em benchmarks de raciocínio e programação. A colaboração com a NVIDIA para otimizar o modelo é um sinal interessante: mesmo com tensões geopolíticas, a comunidade técnica continua trocando figurinhas. --- Para quem usa IA no dia a dia, a versão corrigida significa um modelo poderoso rodando de forma mais leve e acessível. Mais uma peça no quebra-cabeça da democratização dessa tecnologia.

Versão corrigida do DeepSeek-V4-Pro chega ao Hugging Face

Uma versão corrigida do DeepSeek-V4-Pro otimizada no formato NVFP4 está disponível no Hugging Face. O modelo, originalmente publicado com problemas, passou por ajustes e agora pode ser utilizado sem as falhas identificadas na primeira release.

O DeepSeek é um dos modelos de IA desenvolvidos na China que mais ganhou atenção da comunidade técnica internacional nos últimos meses. Em benchmarks de raciocínio e programação, o modelo competes diretamente com alternativas ocidentais como o GPT-4 e o Claude, apresentando resultados competitivos em diversas métricas.

O que é o formato NVFP4

A otimização em NVFP4 é uma técnica de quantização desenvolvida pela NVIDIA que reduz o tamanho do modelo sem perda significativa de qualidade. O formato utiliza precisão de 4 bits, permitindo que modelos grandes rodem em hardware com menos memória VRAM. Para desenvolvedores que trabalham com GPUs de consumo, essa compressão é essencial para viabilizar o uso de modelos de alta performance em máquinas pessoais ou instâncias cloud mais acessíveis.

Impacto para desenvolvedores brasileiros

Para builders e devs que utilizam IA no dia a dia, a disponibilidade do DeepSeek-V4-Pro em formato NVFP4 representa uma opção poderosa e mais leve. A versão corrigida elimina as barreiras técnicas que impediam o uso adequado do modelo, permitindo:

  • Execução em GPUs com memória limitada
  • Inferência mais rápida em aplicações de produção
  • Redução de custos em infraestrutura cloud

A comunidade brasileira de IA, especialmente aquela que trabalha com modelos open source, ganha mais uma alternativa para experimentar e implementar soluções sem depender exclusivamente de APIs de modelos fechados.

Colaboração técnica entre NVIDIA e Hugging Face

A parceria entre NVIDIA e Hugging Face para otimizar um modelo chinês demonstra como a comunidade técnica internacional continua colaboranto apesar das tensões geopolíticas. O Hugging Face, maior plataforma aberta para modelos de IA, atua como repositório central para dezenas de milhares de modelos, e o suporte da NVIDIA garante que otimizações de hardware estejam disponíveis para a comunidade.

Para quem desenvolve aplicações de IA em Python utilizando bibliotecas como Transformers ou vLLM, o modelo já está pronto para integração. A versão corrigida pode ser carregada diretamente via API do Hugging Face ou utilizada em ambientes de inference locais.

modeloshuggingfacemodeloversãocorrigidaformatonvfpcomunidadetécnica

Mais da mesma edição

@koltregaskes

🖥️OpenAI leva o Codex ao Windows com controle remoto pelo celular

A OpenAI liberou o Codex, seu agente de programação, para Windows. A novidade permite que o Codex controle diretamente o computador do usuário, executando tarefas reais na máquina. E tem mais: agora dá para iniciar, acompanhar e ajustar essas tarefas pelo aplicativo do ChatGPT no celular, enquanto o trabalho continua rodando no PC. --- O recurso ainda está em fase inicial, mas a ideia é clara: você sai de casa, abre o celular e continua pilotando o que a IA está fazendo no seu computador. É um passo concreto na direção de agentes que realmente trabalham por você, não só respondem perguntas. --- Vale o alerta honesto de quem já testou: Kolt Regas, que acompanha de perto essas ferramentas, elogiou a velocidade da entrega da OpenAI, mas notou que o acesso remoto do Claude (da Anthropic) ainda trava bastante. A esperança é que a versão da OpenAI seja mais estável.

@AndrewMayne

📉O que custava US$ 1,2 milhão com o GPT-3 agora sai por centavos

Andrew Mayne, escritor e divulgador de tecnologia, fez uma conta que assusta: processar 20 bilhões de tokens (a unidade que mede o volume de texto que a IA lê e gera) com a versão original do GPT-3, lançada em 2020, custaria US$ 1,2 milhão. Hoje, o mesmo volume custa uma fração disso, graças à queda brutal nos preços das APIs. --- Para ter uma ideia, o GPT-3 cobrava US$ 0,06 a cada mil tokens. Os modelos atuais, especialmente os mais leves, cobram valores centenas de vezes menores. Isso muda completamente quem consegue usar IA: o que era privilégio de grandes empresas com orçamento gordo agora está ao alcance de startups pequenas e até de projetos pessoais. --- É o tipo de número que coloca em perspectiva a velocidade dessa revolução. Em menos de cinco anos, o custo de usar inteligência artificial desabou de forma que quase nenhuma outra tecnologia conseguiu igualar.

@LundukeJournal

🎤Jensen Huang faz keynote em Taipei na segunda e o mercado especula

O CEO da NVIDIA, Jensen Huang, vai subir ao palco do Taipei Music Center, em Taiwan, na próxima segunda-feira. O evento acontece durante a Computex, a maior feira de tecnologia da Ásia, e tradicionalmente é palco de grandes anúncios da empresa. --- A pergunta que muita gente faz: será mais um "PC focado em IA" ou teremos algo realmente novo? O ceticismo é compreensível. Nos últimos anos, várias keynotes de hardware prometeram revoluções que, na prática, eram reempacotamentos. Mas a NVIDIA tem carta na manga: ela domina o mercado de chips para treinar modelos de IA e qualquer novidade sobre a próxima geração de GPUs pode mexer com todo o setor. --- Fique de olho. Se vier anúncio de novo hardware ou parceria estratégica, a gente cobre na edição de terça.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter