News02 MaioGrok 4.3: rápido, barato e com 1 milhão de contexto
Edição #81·2 de maio de 2026·1 min

Grok 4.3: rápido, barato e com 1 milhão de contexto

A xAI lançou o Grok 4.3, e os números chamam atenção: US$ 1,25 por milhão de tokens de entrada, 100 tokens por segundo de velocidade e uma janela de contexto de 1 milhão de tokens. Tudo isso com foco em chamadas de ferramentas - o que faz agentes de IA funcionarem na prática. --- Eric Nakagawa, da equipe de treinamento da xAI, explicou que conversaram direto com desenvolvedores e empresas para entender o que precisavam no dia a dia. O resultado é um modelo pensado para uso real, não só para brilhar em testes de laboratório. --- Para quem constrói com IA, é mais uma opção forte no mercado. O preço agressivo e a velocidade alta fazem dele um concorrente direto do GPT-5 mini e do Gemini Flash para tarefas do cotidiano.

Grok 4.3: rápido, barato e com 1 milhão de contexto

O Grok 4.3 chega ao mercado como uma aposta pragmática da xAI: em vez de perseguir recordes em benchmarks sintéticos, o modelo prioriza eficiência de custo, velocidade de inferência e capacidade real de execução de tarefas. Com janela de contexto de 1 milhão de tokens, preço de US$ 1,25 por milhão de tokens de entrada e throughput de 100 tokens por segundo, o lançamento mira diretamente desenvolvedores e empresas que operam agentes de IA em produção.

Da teoria para a prática em tool calling

A equipe de treinamento da xAI, liderada por Eric Nakagawa, adotou uma abordagem diferente para desenvolver o Grok 4.3: entrevistou desenvolvedores e negócios para mapear necessidades reais. O resultado é um modelo otimizado para *tool calling* — a capacidade de invocar funções externas, APIs e ferramentas de forma confiável.

Para quem constrói sistemas autônomos no Brasil, essa característica é crucial. Agentes de IA dependem de chamadas precisas a bancos de dados, sistemas internos e serviços externos. Um modelo que erra na sintaxe da requisição ou alucina parâmetros gera custos operacionais invisíveis em planilhas de preço. O Grok 4.3 foi calibrado especificamente para reduzir essa fricção em pipelines de RAG e automação empresarial.

Custo-benefício e latência no mundo real

Os números posicionam o Grok 4.3 como alternativa viável ao GPT-4o mini e ao Gemini Flash:

  • **Custo**: US$ 1,25 (entrada) / US$ 2,50 (saída) por milhão de tokens
  • **Velocidade**: 100 tokens por segundo
  • **Contexto**: 1 milhão de tokens — suficiente para processar documentos extensos, repositórios de código completos ou históricos longos de conversação sem técnicas de chunking agressivas
tokensgrokmilhãomodeloxaicustovelocidadecapacidaderealcontexto

Mais da mesma edição

@xai

🎙️xAI abre clonagem de voz via API

Além do Grok 4.3, a xAI também lançou clonagem de voz via API. Em menos de 2 minutos você cria uma voz personalizada a partir de uma amostra de áudio. Também dá para escolher entre mais de 80 vozes prontas em 28 idiomas. --- As aplicações são variadas: agentes de atendimento com voz humana, audiobooks narrados pela voz do próprio autor, personagens de jogos, assistentes virtuais personalizados. A barreira entre texto e voz está sumindo rápido. --- Se você já experimentou serviços de voz como o ElevenLabs, sabe o potencial. A diferença é que agora vem direto da xAI, integrada ao ecossistema Grok - o que pode significar preços mais competitivos e integração nativa com os outros serviços deles.

@sama

@steipete

🔄Codex ganha modo /goal para loops automáticos

O Codex da OpenAI ganhou uma funcionalidade chamada /goal que permite criar loops automáticos de execução. Em vez de mandar um comando e esperar, o agente recebe um objetivo e fica rodando sozinho até atingir o resultado. --- Peter Steinberger, desenvolvedor conhecido no ecossistema Apple, elogiou a novidade abertamente. O recurso foi compartilhado por Greg Brockman, co-fundador da OpenAI, e está gerando empolgação entre quem programa com IA no dia a dia. --- É o tipo de melhoria que separa "ferramenta de código" de "agente de verdade". Em vez de funcionar como um autocomplete avançado, o Codex começa a agir como alguém que recebe uma tarefa e vai até o fim sem precisar de supervisão constante.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter