DeepSeek V4: open-source com 1.6 trilhão de parâmetros

🐉DeepSeek V4: open-source com 1.6 trilhão de parâmetros

A DeepSeek soltou o V4 Preview - e é grande em todos os sentidos. O modelo Pro tem 1.6 trilhão de parâmetros no total (49 bilhões ativos por vez), o que faz dele o maior modelo open-source já lançado. Detalhe: com janela de contexto de 1 milhão de tokens. Dá pra enfiar um livro inteiro numa conversa. --- Tem também a versão Flash (284 bilhões de parâmetros, 13 bilhões ativos), feita pra quem quer velocidade e economia. As duas já estão disponíveis via API e no chat.deepseek.com. --- A análise independente da Artificial Analysis colocou o V4 Pro como o modelo open-source número 1 em tarefas de trabalho real com agentes. Em raciocínio matemático e programação, ele rivaliza com os melhores modelos fechados. É o primeiro salto de tamanho da família DeepSeek desde o V3 original - todos os modelos intermediários (R1, V3.1, V3.2) usavam a mesma arquitetura menor.

🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models. 🔹 DeepSeek-V4-Flash: 284B total / 13B active params. Your fast, efficient, and economical choice. Try it now at https://t.co/GCdiMzk1Dl via Expert Mode / Instant Mode. API is updated & available today! 📄 Tech Report: https://t.co/drlDrxkYtp 🤗 Open Weights: https://t.co/T13Y8i7SDM
— @deepseek_ai View on X

O maior modelo open-source já lançado

A DeepSeek lançou o V4 Preview, o maior modelo de linguagem open-source da história. A versão Pro conta com 1,6 trilhão de parâmetros totais (49 bilhões ativos por推理), accompanied by a context window de 1 milhão de tokens — suficiente para processar um livro inteiro em uma única conversa.

Duas versões para diferentes necessidades

O DeepSeek-V4-Pro foi projetado para desempenho máximo, rivalizando com os principais modelos fechados do mundo em tarefas de raciocínio matemático e programação. A análise independente da Artificial Analysis o colocou como o modelo open-source número um em tarefas de trabalho real com agentes.

Já o DeepSeek-V4-Flash oferece 284 bilhões de parâmetros totais (13 bilhões ativos), priorizando velocidade e economia sem abrir mão de capacidade substancial. Ambas as versões estão disponíveis via API e no chat.deepseek.com.

Por que o contexto de 1 milhão de tokens importa

A janela de contexto expandida permite que desenvolvedores processem documentos longos, bases de código completas ou múltiplos arquivos em uma única interação. Para builders brasileiros, isso significa a possibilidade de analisar repositórios inteiros, gerar testes abrangentes ou realizar code review de projetos complexos sem fragmentar o contexto em múltiplas sessões.

Impacto para devs e builders brasileiros

O lançamento representa uma mudança significativa no ecossistema de LLMs open-source. Com custo acessível e desempenho competitivo frente a modelos fechados como GPT-4 e Claude, o DeepSeek-V4-Pro oferece uma alternativa viável para startups e desenvolvedores individuais que precisam de alta capacidade computacional sem os custos das APIs proprietárias.

A arquitetura com parâmetros ativos menores que o total permite implementar modelos grandes em hardware mais modesto, democratizando o acesso a IA avançada para equipes com recursos limitados.

Disponibilidade

Os modelos já podem ser testados via Expert Mode ou Instant Mode no site oficial. Os pesos abertos estão disponíveis no Hugging Face, e a documentação técnica está acessível no tech report publicado pela DeepSeek.

opensourcemodelosmodeloparâmetrosbilhõesativossemcontextomaiordeepseek

🐉DeepSeek V4: open-source com 1.6 trilhão de parâmetros

O maior modelo open-source já lançado

Duas versões para diferentes necessidades

Por que o contexto de 1 milhão de tokens importa

Impacto para devs e builders brasileiros

Disponibilidade

Mais da mesma edição

🧠GPT-5.5: a OpenAI quer que a IA faça o trabalho inteiro

🔍Claude Code admite o erro e publica o post-mortem

💾Claude ganha memória persistente para agentes gerenciados

Receba no seu email