News01 JunhoMiniMax lança o M3, modelo com janela de 1 milhão de tokens
Edição #110·1 de junho de 2026·2 min

📖MiniMax lança o M3, modelo com janela de 1 milhão de tokens

A MiniMax, empresa chinesa de IA, lançou o M3, seu mais novo modelo de linguagem. O destaque é a janela de contexto de 1 milhão de tokens, que é basicamente a quantidade de texto que o modelo consegue processar de uma vez. Para dar uma ideia: isso equivale a algo como 10 livros inteiros numa única conversa. --- O M3 foi projetado para raciocínio com agentes, uso de ferramentas, programação e tarefas que exigem lidar com documentos muito longos. A MiniMax vinha ganhando atenção com seus modelos de vídeo e áudio, e agora reforça a aposta no lado texto. Mais um competidor forte entrando na briga dos modelos de contexto gigante, uma tendência que não para de crescer.

MiniMax lança o M3, modelo com janela de 1 milhão de tokens

A MiniMax lançou o M3, seu mais novo modelo de linguagem, com uma janela de contexto de 1 milhão de tokens — a maior já vista em modelos de linguagem comercial. Essa capacidade permite processar o equivalente a cerca de 10 livros inteiros em uma única conversa.

O que muda com 1 milhão de tokens

A janela de contexto determina quanta informação o modelo consegue considerar de uma vez. Em modelos tradicionais, esse limite fica entre 8 mil e 128 mil tokens. Com 1 milhão de tokens, o M3 consegue:

  • Analisar documentos extensos sem perda de contexto
  • Manter coerência em conversas longas
  • Processar bases de código inteiras de uma só vez
  • Executar tarefas de raciocínio que exigem agregação de informações distribuídas em múltiplos arquivos

Para que o M3 foi projetado

A MiniMax posicionou o M3 para três frentes principais:

  • **Raciocínio com agentes**: capacidade de manter estado e contexto em interações autonomyas
  • **Uso de ferramentas**: integração com APIs e sistemas externos de forma consistente
  • **Programação**: análise de códigobases grandes, onde contexto é essencial para refatoração e debugging

A empresa já havia ganhado atenção com modelos de vídeo e áudio. O lançamento do M3 mostra que a aposta no processamento de texto longo é uma estratégia central, não apenas um complemento.

Por que isso importa para devs brasileiros

O mercado de modelos de contexto longo está em expansão. Além da MiniMax, concorrentes como Anthropic (Claude), Google (Gemini) e OpenAI (GPT-4 Turbo) investem nessa direção. Para desenvolvedores e builders no Brasil, algumas implicações práticas:

  • **Arquitetura de aplicações**: modelos com janelas maiores permitem designs que antes eram inviáveis, como assistentes que leem bases de conhecimento inteiras
  • **Custo-benefício**: processar documentos grandes em uma única passagem é mais eficiente que estratégias de chunking
  • **Diferenciação**: entender as capacidades específicas de cada modelo ajuda na escolha da ferramenta certa para cada caso de uso

O cenário competitivo

A tendência de aumentar a janela de contexto refleja uma demanda real por modelos que consigam lidar com informação volumosa. O M3 coloca a MiniMax entre os players que lideram essa corrida. Para o ecossistema brasileiro de IA, a chegada de novos competidores pode significar mais opções e pressão por preços melhores — especialmente em um momento em que muitas empresas avaliam infraestruturas próprias versus APIs de terceiros.

contextomodelosminimaxtokensmodelojanelamilhãoprocessarlinguagemessa

Mais da mesma edição

@sama

🤖OpenAI anuncia divisão de robótica: o objetivo é um robô pessoal para cada pessoa

Sam Altman, CEO da OpenAI, anunciou oficialmente a criação da OpenAI Robotics, uma nova divisão inteiramente dedicada a construir robôs. A equipe nasceu do programa de simulação de mundo liderado por Aditya Ramesh, o mesmo criador do DALL-E, e já está contratando engenheiros de hardware, sistemas e aprendizado de máquina. --- A visão de curto prazo é criar robôs que ajudem trabalhadores qualificados a construir infraestrutura, tipo obras e fábricas. A de longo prazo é mais ambiciosa: todo mundo ter um robô pessoal capaz de fazer qualquer coisa que você precise. Se parece ficção científica, é porque até pouco tempo era mesmo. --- O mais interessante é que a OpenAI está apostando no co-design, ou seja, desenvolver o hardware e a inteligência artificial juntos desde o início, em vez de tentar encaixar um modelo de IA num corpo mecânico depois. Faz sentido, mas a distância entre um chatbot brilhante e um robô que não tropeça na escada ainda é enorme.

@ArtificialAnlys

💚NVIDIA lança Nemotron 3 Ultra, o modelo aberto americano mais inteligente

Jensen Huang, CEO da NVIDIA, subiu ao palco da Computex em Taipei para anunciar o Nemotron 3 Ultra: um modelo de IA com 550 bilhões de parâmetros (dos quais 55 bilhões ficam ativos por vez, graças a uma técnica de esparsidade de 90%). É o maior e mais capaz modelo de pesos abertos já lançado por uma empresa americana. --- Em benchmarks, ele marcou 48 pontos no índice de inteligência da Artificial Analysis, ficando bem à frente de outros modelos abertos americanos como o Gemma 4 (39 pontos) e o gpt-oss-120b (33 pontos). Só que, detalhe importante: o chinês Kimi K2.6 ainda lidera com 54 pontos. A corrida EUA vs China nos modelos abertos continua acirrada. --- A velocidade também impressiona: mais de 300 tokens (as unidades de texto que o modelo processa) por segundo, algo entre 3 e 6 vezes mais rápido que concorrentes chineses de porte similar. A NVIDIA promete ainda uma versão quantizada, mais leve, para rodar com desempenho ainda maior.

@NVIDIAAI

🌍Cosmos 3 da NVIDIA: um modelo que vê, pensa e cria vídeo

Ainda na Computex, a NVIDIA apresentou o Cosmos 3, que a empresa chama de primeiro "omomodelo" totalmente aberto para IA física. Traduzindo: é um modelo que consegue entender imagens, raciocinar sobre o que vê e gerar vídeos a partir disso. Tudo num pacote só, disponível em duas versões: Super (32 bilhões de parâmetros) e Nano (8 bilhões). --- A ideia é dar aos desenvolvedores uma base pronta para criar sistemas de IA que interagem com o mundo real, como robôs e veículos autônomos, sem precisar começar do zero. Os pesos do modelo e as receitas de treinamento estão disponíveis gratuitamente no Hugging Face. --- Uma demonstração mostrou o modelo transformando uma foto de dashcam num vídeo simulado de corrida de Fórmula 1, completo com som gerado pela própria IA. É bonito, mas o valor real está em aplicações industriais: simular cenários físicos antes de colocar um robô para agir no mundo de verdade.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter