Grok 4.3: rápido, barato e com 1 milhão de contexto

A xAI lançou o Grok 4.3, e os números chamam atenção: US$ 1,25 por milhão de tokens de entrada, 100 tokens por segundo de velocidade e uma janela de contexto de 1 milhão de tokens. Tudo isso com foco em chamadas de ferramentas - o que faz agentes de IA funcionarem na prática. --- Eric Nakagawa, da equipe de treinamento da xAI, explicou que conversaram direto com desenvolvedores e empresas para entender o que precisavam no dia a dia. O resultado é um modelo pensado para uso real, não só para brilhar em testes de laboratório. --- Para quem constrói com IA, é mais uma opção forte no mercado. O preço agressivo e a velocidade alta fazem dele um concorrente direto do GPT-5 mini e do Gemini Flash para tarefas do cotidiano.

O Grok 4.3 chega ao mercado como uma aposta pragmática da xAI: em vez de perseguir recordes em benchmarks sintéticos, o modelo prioriza eficiência de custo, velocidade de inferência e capacidade real de execução de tarefas. Com janela de contexto de 1 milhão de tokens, preço de US$ 1,25 por milhão de tokens de entrada e throughput de 100 tokens por segundo, o lançamento mira diretamente desenvolvedores e empresas que operam agentes de IA em produção.

Da teoria para a prática em tool calling

A equipe de treinamento da xAI, liderada por Eric Nakagawa, adotou uma abordagem diferente para desenvolver o Grok 4.3: entrevistou desenvolvedores e negócios para mapear necessidades reais. O resultado é um modelo otimizado para *tool calling* — a capacidade de invocar funções externas, APIs e ferramentas de forma confiável.

Para quem constrói sistemas autônomos no Brasil, essa característica é crucial. Agentes de IA dependem de chamadas precisas a bancos de dados, sistemas internos e serviços externos. Um modelo que erra na sintaxe da requisição ou alucina parâmetros gera custos operacionais invisíveis em planilhas de preço. O Grok 4.3 foi calibrado especificamente para reduzir essa fricção em pipelines de RAG e automação empresarial.

Custo-benefício e latência no mundo real

Os números posicionam o Grok 4.3 como alternativa viável ao GPT-4o mini e ao Gemini Flash:

**Custo**: US$ 1,25 (entrada) / US$ 2,50 (saída) por milhão de tokens
**Velocidade**: 100 tokens por segundo
**Contexto**: 1 milhão de tokens — suficiente para processar documentos extensos, repositórios de código completos ou históricos longos de conversação sem técnicas de chunking agressivas

⚡Grok 4.3: rápido, barato e com 1 milhão de contexto

Da teoria para a prática em tool calling

Custo-benefício e latência no mundo real

Mais da mesma edição

🎙️xAI abre clonagem de voz via API

🔄Codex ganha modo /goal para loops automáticos

Receba no seu email