⚡Grok 4.3: rápido, barato e com 1 milhão de contexto
A xAI lançou o Grok 4.3, e os números chamam atenção: US$ 1,25 por milhão de tokens de entrada, 100 tokens por segundo de velocidade e uma janela de contexto de 1 milhão de tokens. Tudo isso com foco em chamadas de ferramentas - o que faz agentes de IA funcionarem na prática. --- Eric Nakagawa, da equipe de treinamento da xAI, explicou que conversaram direto com desenvolvedores e empresas para entender o que precisavam no dia a dia. O resultado é um modelo pensado para uso real, não só para brilhar em testes de laboratório. --- Para quem constrói com IA, é mais uma opção forte no mercado. O preço agressivo e a velocidade alta fazem dele um concorrente direto do GPT-5 mini e do Gemini Flash para tarefas do cotidiano.

When training Grok 4.3, we spoke directly with devs and businesses to understand what they actually needed: a model that's fast, affordable, and great at tool calling. The result is a daily driver that doesn't just look good on random benchmarks, but is actually useful in the real world. 💰 $1.25 in / $2.50 out ⚡️ 100 tokens / second 📖 1 million context window Try it through Hermes Agent or direct through the xAI API!
— @veggie_eric View on X
O Grok 4.3 chega ao mercado como uma aposta pragmática da xAI: em vez de perseguir recordes em benchmarks sintéticos, o modelo prioriza eficiência de custo, velocidade de inferência e capacidade real de execução de tarefas. Com janela de contexto de 1 milhão de tokens, preço de US$ 1,25 por milhão de tokens de entrada e throughput de 100 tokens por segundo, o lançamento mira diretamente desenvolvedores e empresas que operam agentes de IA em produção.
Da teoria para a prática em tool calling
A equipe de treinamento da xAI, liderada por Eric Nakagawa, adotou uma abordagem diferente para desenvolver o Grok 4.3: entrevistou desenvolvedores e negócios para mapear necessidades reais. O resultado é um modelo otimizado para *tool calling* — a capacidade de invocar funções externas, APIs e ferramentas de forma confiável.
Para quem constrói sistemas autônomos no Brasil, essa característica é crucial. Agentes de IA dependem de chamadas precisas a bancos de dados, sistemas internos e serviços externos. Um modelo que erra na sintaxe da requisição ou alucina parâmetros gera custos operacionais invisíveis em planilhas de preço. O Grok 4.3 foi calibrado especificamente para reduzir essa fricção em pipelines de RAG e automação empresarial.
Custo-benefício e latência no mundo real
Os números posicionam o Grok 4.3 como alternativa viável ao GPT-4o mini e ao Gemini Flash:
- **Custo**: US$ 1,25 (entrada) / US$ 2,50 (saída) por milhão de tokens
- **Velocidade**: 100 tokens por segundo
- **Contexto**: 1 milhão de tokens — suficiente para processar documentos extensos, repositórios de código completos ou históricos longos de conversação sem técnicas de chunking agressivas
