News30 JunhoDeepSeek v4 confirmado para meados de julho
Edição #139·30 de junho de 2026·2 min

📅DeepSeek v4 confirmado para meados de julho

Salvatore Sanfilippo (mais conhecido como antirez, o criador do Redis) confirmou que o DeepSeek v4, a próxima versão do modelo de IA chinês que chacoalhou o mercado no começo do ano, será atualizado em meados de julho. É um prazo apertado que mostra o ritmo acelerado da corrida entre modelos abertos. --- Antirez também comentou que os modelos estão mudando demais entre versões, o que é bom para a qualidade, mas caro para quem desenvolve em cima deles. Toda vez que a arquitetura muda (a estrutura interna do modelo), quem construiu ferramentas e integrações precisa adaptar tudo de novo. É como reformar a fundação de uma casa enquanto as pessoas ainda moram nela. --- Para o público geral, a notícia prática é: mais uma opção poderosa e gratuita de IA está a caminho, enquanto o duopólio OpenAI e Google segue sendo pressionado por competidores que entregam qualidade sem cobrar.

O DeepSeek v4 será lançado em meados de julho. A confirmação veio de Salvatore Sanfilippo, criador do Redis (conhecido como antirez), destacando o ritmo acelerado de iteração nos modelos de inteligência artificial abertos. O prazo de seis meses entre versões majoritárias sinaliza uma pressão competitiva inédita no mercado de LLMs, especialmente contra o domínio de OpenAI e Google.

O contexto da corrida acelerada

Desde o lançamento do DeepSeek-R1 em janeiro, a startup chinesa consolidou-se como referência em modelos de linguagem de código aberto. A arquitetura MoE (Mixture of Experts) e os custos reduzidos de inferência chacoalharam o setor, provando que performance comparável às APIs fechadas poderia coexistir com transparência técnica e baixo custo de computação.

O ciclo de desenvolvimento de sete meses para uma nova versão principal, porém, expõe uma característica crítica do ecossistema open source em IA: a velocidade de evolução arquitetural está em conflito direto com a estabilidade necessária para produção.

O custo oculto das mudanças arquiteturais

Antirez alertou para um problema técnico subestimado: cada versão nova traz alterações estruturais profundas. Para desenvolvedores e empresas que construíram pipelines de dados, sistemas de fine-tuning ou integrações específicas sobre o DeepSeek, mudanças na arquitetura interna equivalem a refatorações massivas.

  • **Quebra de compatibilidade**: Adaptadores e camadas de abstração precisam ser reescritos
  • **Custo de migração**: Equipes precisam revalidar benchmarks de segurança e performance
  • **Dívida técnica**: Ferramentas construídas sobre versões anteriores tornam-se obsoletas rapidamente

Esse fenômeno, conhecido como "breaking changes" em APIs de modelo, afeta diretamente builders brasileiros que apostaram na stack open source para reduzir dependência de provedores estrangeiros caros.

Implicações para o mercado brasileiro

A chegada do v4 reforça uma tendência clara: o duopólio norte-americano enfrenta agora concorrência técnica viável em modelos abertos. Para desenvolvedores e startups no Brasil, isso significa acesso a capacidades de reasoning e processamento de linguagem natural sem barreiras de licenciamento ou custos proibitivos de tokens.

Contudo, a escolha entre estabilidade e inovação torna-se mais complexa. Enquanto OpenAI e Google mantêm compatibilidade retroativa em suas APIs por meses, os

modelosmesesapistécnicacustodeepseekconhecidoantirezabertosentre

Mais da mesma edição

@omarsar0

🧠Meta decodifica frases do cérebro sem precisar de cirurgia

A Meta publicou na Nature o Brain2Qwerty, um sistema que lê sinais cerebrais e os transforma em texto. Até aqui, converter pensamento em palavras com precisão aceitável exigia implantes dentro do crânio, algo caro, arriscado e restrito a poucos pacientes. O novo sistema usa apenas sensores externos, como os de um eletroencefalograma comum, sem bisturi. --- A versão 2 do projeto dá um salto importante: não decodifica letra por letra, mas palavras e até frases inteiras em tempo real. Segundo a equipe, a precisão se aproxima da que antes só era possível com técnicas invasivas. Estamos falando de milhões de pessoas que perderam a capacidade de falar por doenças como ELA podendo, no futuro, se comunicar usando apenas um aparelho na cabeça. --- É claro que ainda estamos no território da pesquisa, longe de um produto de prateleira. Mas a combinação de modelos de linguagem (os mesmos que movem o ChatGPT) com leitura cerebral não invasiva abre um caminho que, há cinco anos, parecia ficção científica. Fique de olho nesse campo.

@claudeai

☁️Claude chega oficialmente ao Azure da Microsoft

A Anthropic liberou para todos os clientes do Azure o acesso ao Claude dentro do Microsoft Foundry. Isso significa que empresas que já usam a nuvem da Microsoft podem contratar os modelos Claude Opus 4.8 e Claude Haiku 4.5 sem sair do ambiente que conhecem: mesma autenticação, mesma fatura, mesmos contratos. --- Na prática, é mais uma peça no jogo de distribuição da IA. A OpenAI nasceu dentro do Azure, mas a Microsoft agora abre a porta para o concorrente direto. Para as empresas, é ótimo: mais opção de modelo sem trocar de fornecedor de nuvem. Para a Anthropic, é acesso a uma base gigantesca de clientes corporativos sem precisar convencê-los a migrar de infraestrutura. --- A tendência é clara: os grandes provedores de nuvem estão virando supermercados de IA, onde você escolhe o modelo que quiser na prateleira. Quem ganha, no fim, é quem compra.

@AlexFinn

🔒Governo dos EUA lança modelo de IA que cabe no navegador

O governo americano publicou o Rampart, um modelo de IA com apenas 14,7 megabytes. Para ter ideia, isso é menor que a maioria das fotos do seu celular. Ele roda direto no navegador e tem uma única função: apagar dados pessoais de textos antes que eles sejam enviados a qualquer servidor. Nada de chatbot genérico, nada de resposta criativa. Um trabalho específico, feito com eficiência. --- Alex Finn, empreendedor de tecnologia, usou o caso para defender o que ele chama de 'a próxima categoria de software': modelos minúsculos e ultraespecializados que rodam no seu celular ou computador sem precisar de internet. Ele mesmo está treinando um que faz verificações de segurança em código a cada 20 minutos. Outros exemplos que ele sugere: um modelo que limpa código mal escrito, outro que deixa textos com tom mais humano, outro que gerencia e-mails e calendário. --- A lógica é o oposto do que vemos com os grandes modelos como GPT e Claude: em vez de um cérebro gigante que faz tudo, vários cérebros minúsculos que fazem uma coisa só, muito bem, sem depender da nuvem. É mais barato, mais privado e, em muitos casos, mais útil.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter