News24 AbrilDeepSeek V4: open-source com 1.6 trilhão de parâmetros
Edição #73·24 de abril de 2026·2 min

🐉DeepSeek V4: open-source com 1.6 trilhão de parâmetros

A DeepSeek soltou o V4 Preview - e é grande em todos os sentidos. O modelo Pro tem 1.6 trilhão de parâmetros no total (49 bilhões ativos por vez), o que faz dele o maior modelo open-source já lançado. Detalhe: com janela de contexto de 1 milhão de tokens. Dá pra enfiar um livro inteiro numa conversa. --- Tem também a versão Flash (284 bilhões de parâmetros, 13 bilhões ativos), feita pra quem quer velocidade e economia. As duas já estão disponíveis via API e no chat.deepseek.com. --- A análise independente da Artificial Analysis colocou o V4 Pro como o modelo open-source número 1 em tarefas de trabalho real com agentes. Em raciocínio matemático e programação, ele rivaliza com os melhores modelos fechados. É o primeiro salto de tamanho da família DeepSeek desde o V3 original - todos os modelos intermediários (R1, V3.1, V3.2) usavam a mesma arquitetura menor.

DeepSeek V4: open-source com 1.6 trilhão de parâmetros

O maior modelo open-source já lançado

A DeepSeek lançou o V4 Preview, o maior modelo de linguagem open-source da história. A versão Pro conta com 1,6 trilhão de parâmetros totais (49 bilhões ativos por推理), accompanied by a context window de 1 milhão de tokens — suficiente para processar um livro inteiro em uma única conversa.

Duas versões para diferentes necessidades

O DeepSeek-V4-Pro foi projetado para desempenho máximo, rivalizando com os principais modelos fechados do mundo em tarefas de raciocínio matemático e programação. A análise independente da Artificial Analysis o colocou como o modelo open-source número um em tarefas de trabalho real com agentes.

Já o DeepSeek-V4-Flash oferece 284 bilhões de parâmetros totais (13 bilhões ativos), priorizando velocidade e economia sem abrir mão de capacidade substancial. Ambas as versões estão disponíveis via API e no chat.deepseek.com.

Por que o contexto de 1 milhão de tokens importa

A janela de contexto expandida permite que desenvolvedores processem documentos longos, bases de código completas ou múltiplos arquivos em uma única interação. Para builders brasileiros, isso significa a possibilidade de analisar repositórios inteiros, gerar testes abrangentes ou realizar code review de projetos complexos sem fragmentar o contexto em múltiplas sessões.

Impacto para devs e builders brasileiros

O lançamento representa uma mudança significativa no ecossistema de LLMs open-source. Com custo acessível e desempenho competitivo frente a modelos fechados como GPT-4 e Claude, o DeepSeek-V4-Pro oferece uma alternativa viável para startups e desenvolvedores individuais que precisam de alta capacidade computacional sem os custos das APIs proprietárias.

A arquitetura com parâmetros ativos menores que o total permite implementar modelos grandes em hardware mais modesto, democratizando o acesso a IA avançada para equipes com recursos limitados.

Disponibilidade

Os modelos já podem ser testados via Expert Mode ou Instant Mode no site oficial. Os pesos abertos estão disponíveis no Hugging Face, e a documentação técnica está acessível no tech report publicado pela DeepSeek.

opensourcemodelosmodeloparâmetrosbilhõesativossemcontextomaiordeepseek

Mais da mesma edição

@OpenAI

🧠GPT-5.5: a OpenAI quer que a IA faça o trabalho inteiro

A OpenAI anunciou o GPT-5.5 - e dessa vez o foco não é "ser mais inteligente" no abstrato. O modelo foi construído para entender objetivos complexos, usar ferramentas, conferir o próprio trabalho e levar tarefas até o fim. Traduzindo: em vez de te dar uma resposta bonita e parar, ele tenta terminar o que começou. --- Já está disponível no ChatGPT e no Codex (a ferramenta de programação da OpenAI). A ideia é que o 5.5 marque uma nova forma de usar o computador - não como assistente que sugere, mas como agente que executa. Na prática, pense em pedir "monta essa planilha, confere os dados e me manda o PDF" e ele realmente fazer tudo isso sozinho. --- Theo Browne, criador de conteúdo técnico bastante conhecido, já testou e fez a conta: US$ 5 por milhão de tokens de entrada, US$ 30 por milhão de saída. É o dobro do GPT-5.4 e 20% mais caro que o Opus 4.7 da Anthropic. Inteligente? Sim. Caro? Também.

@bcherny

🔍Claude Code admite o erro e publica o post-mortem

Nos últimos 30 dias, muita gente reclamou que o Claude Code tinha piorado. A Anthropic investigou, encontrou três problemas - e fez o que pouca empresa faz: publicou um post-mortem detalhado. --- O ponto mais importante: os modelos em si não regrediram. Os bugs estavam no Claude Code e no Agent SDK (a camada que conecta o modelo à ferramenta de programação). O Cowork, que roda sobre o mesmo SDK, também foi afetado. Todos os problemas já foram corrigidos na versão 2.1.116+. --- E um gesto que conta: a Anthropic resetou os limites de uso de todos os assinantes. Boris Cherny, líder do Claude Code, publicou a análise pessoalmente. Transparência assim gera confiança - e diferencia quem trata usuário como parceiro de quem trata como cliente passivo.

@claudeai

💾Claude ganha memória persistente para agentes gerenciados

A Anthropic lançou memória persistente para os agentes gerenciados do Claude, em beta público. Na prática: seus agentes agora aprendem com cada sessão, usando uma camada de memória que equilibra desempenho com flexibilidade. --- Isso muda a experiência de usar agentes. Antes, cada conversa começava do zero. Agora o agente pode lembrar que você prefere código em TypeScript, que seu projeto usa Tailwind, ou que na última vez que rodou um deploy deu erro no banco. É o tipo de coisa que parece óbvia mas que ninguém tinha resolvido bem até agora.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter