News22 AbrilKimi K2.6: código aberto batendo modelos fechados
Edição #71·22 de abril de 2026·1 min

🏆Kimi K2.6: código aberto batendo modelos fechados

A Moonshot, empresa chinesa por trás do Kimi, lançou o K2.6, um modelo de código aberto focado em programação. Os números assustam: é o melhor da categoria em 7 benchmarks diferentes, incluindo SWE-Bench Pro (58.6) e BrowseComp (83.2). --- O diferencial vai além dos benchmarks. O K2.6 consegue rodar tarefas de programação longas - mais de 4 mil chamadas de ferramenta e 12 horas de execução contínua. Funciona com Rust, Go, Python, frontend, DevOps. É o tipo de modelo que desenvolvedores independentes podem rodar sem pagar assinatura de lab. --- A corrida dos modelos abertos não para. Enquanto OpenAI e Anthropic trancam funcionalidades atrás de planos caros, a China está entregando modelos de ponta de graça. Me impressiona como o open source consegue competir dessa forma.

A Moonshot AI disponibilizou o Kimi K2.6, modelo de linguagem open source que alcança estado da arte (SOTA) em sete benchmarks de programação, superando sistemas proprietários fechados como GPT-4 e Claude em métricas específicas de codificação. O registro de 58.6% no SWE-Bench Pro e 83.2% no BrowseComp posiciona o sistema chinês como alternativa viável para desenvolvedores que precisam de inference-time compute prolongado sem custos de assinatura enterprise.

Performance técnica e benchmarks

Os números do K2.6 indicam avanços consistentes em tarefas complexas de software engineering. Além do SWE-Bench Pro, o modelo atinge 76.7% no SWE-bench Multilingual, 54.0% no HLE (Humanity’s Last Exam) com ferramentas e 93.2% em Math Vision com Python. Esses índices medem capacidade de resolução de bugs reais, navegação autônoma em documentação técnica e raciocínio matemático aplicado a código, áreas onde modelos fechados tradicionalmente mantinham vantagem significativa.

Long-horizon coding e aplicações práticas

O diferencial arquitetural do K2.6 reside na capacidade de execução contínua: mais de 4.000 chamadas de ferramenta (tool calls) durante até 12 horas de processamento ininterrupto. Essa característica de long-horizon reasoning permite automação de pipelines complexos, inclu

swebenchmodelobenchmarksfechadosprotécnicacapacidadelonghorizonmoonshotdisponibilizou

Mais da mesma edição

@OpenAI

🎨ChatGPT Images 2.0: agora a coisa ficou séria

A OpenAI lançou o ChatGPT Images 2.0, uma atualização grande do gerador de imagens integrado ao ChatGPT. O modelo novo renderiza texto com precisão, gera interfaces de software detalhadas e permite edição fina - coisas que antes eram impossíveis. --- O mais impressionante é a renderização de interfaces. Ele gera telas de apps e sites com todos os detalhes: botões, tipografia, ícones, hierarquia visual. Parece screenshot de produto real. Vários designers já estão testando como ferramenta de prototipação rápida - e o resultado é surpreendentemente bom. --- Não é mais aquela imagem genérica com texto distorcido. É produção visual de qualidade profissional direto no chat. Se você trabalha com design, marketing ou conteúdo, esse é o tipo de atualização que muda a rotina.

@mntruell

🚀SpaceX pode comprar o Cursor por US$ 60 bilhões

O negócio mais maluco do ano em tecnologia acabou de acontecer. A SpaceX, empresa aeroespacial de Elon Musk, fechou uma parceria com o Cursor - o editor de código com IA que virou febre entre programadores. Até aí, ok. O detalhe que ninguém esperava: a SpaceX agora tem o direito de comprar o Cursor inteiro por US$ 60 bilhões. --- Para ter noção do tamanho disso: em maio do ano passado, o Cursor valia US$ 9,9 bilhões. Agora só a taxa para desistir do negócio custa US$ 10 bilhões - mais do que a empresa toda valia há 12 meses. Elon basicamente comprou uma opção de compra bilionária. --- O ponto estratégico é o supercomputador da SpaceX - o Colossus, com 230 mil GPUs em Memphis e planos para chegar a 1 milhão até o fim do ano. O Cursor precisa desse poder de treino para competir com Google e OpenAI. A SpaceX tem o hardware. É um casamento que faz sentido, por mais improvável que pareça.

@ns123abc

🔓Anthropic hackeada: modelo de ciberataque vazou

A Anthropic, que vive repetindo que é "o lab responsável de IA", acaba de passar pelo vexame do ano. Hackers conseguiram acesso ao Mythos, um modelo secreto da empresa capaz de hackear qualquer sistema operacional e navegador. Um modelo tão perigoso que a própria Anthropic decidiu não liberar para o público. --- O caminho da invasão é quase cômico: a Mercor, empresa terceirizada que ajuda no treinamento, foi comprometida. Com acesso às convenções internas de nomes dos modelos, os hackers adivinharam os padrões de URL, usaram credenciais que ainda funcionavam e entraram. Não só no Mythos - em todo o pipeline de modelos não lançados. --- A empresa confirmou estar "investigando um relato de acesso por meio de um fornecedor terceirizado". Traduzindo: o modelo mais perigoso que eles já criaram foi acessado no primeiro dia. Dá raiva que uma empresa que se posiciona como a mais segura tenha um fornecedor com credenciais ativas sem rotação.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter