💎Google lança Gemma 4: IA de ponta que roda no seu notebook
O Google lançou o Gemma 4, sua nova família de modelos abertos, e desta vez com licença Apache 2.0 - o que significa que qualquer pessoa ou empresa pode usar sem restrições comerciais. Isso é uma mudança enorme em relação à versão anterior. --- São 4 tamanhos: o maior tem 31 bilhões de parâmetros e entrega resultados comparáveis a modelos 20 vezes maiores. O mais compacto roda direto no celular. Todos suportam texto, imagem e áudio, com janela de contexto de até 256 mil tokens (dá pra processar um repositório de código inteiro de uma vez). --- Na prática, quem tem um MacBook Pro ou uma placa de vídeo RTX 3090 pode rodar uma IA de nível profissional sem pagar nada, sem mandar dados pra nuvem. Em paralelo, o Google também lançou camadas de preço na API do Gemini: o modo "flex" custa 50% menos (com menor prioridade), enquanto o modo "priority" garante respostas mais rápidas por 80% a mais.

Excited to launch Gemma 4: the best open models in the world for their respective sizes. Available in 4 sizes that can be fine-tuned for your specific task: 31B dense for great raw performance, 26B MoE for low latency, and effective 2B & 4B for edge device use - happy building!
— @demishassabis View on X
O Google disponibilizou a quarta geração da família Gemma, sua linha de modelos de linguagem abertos, sob licença Apache 2.0. Pela primeira vez, desenvolvedores e empresas podem utilizar, modificar e distribuir as arquiteturas sem restrições comerciais, eliminando barreiras legais que limitavam versões anteriores. A release inclui quatro variantes otimizadas para diferentes cenários de hardware, desde estações de trabalho até smartphones.
Da pesquisa à produção sem atrito
A transição para Apache 2.0 marca uma inflexão na estratégia de open source do Google. Anteriormente, termos de uso mais restritivos impediam aplicações empresariais amplas. Agora, startups e equipes de engenharia brasileiras podem integrar os modelos em produtos comerciais sem royalties ou aprovações prévias, acelerando o ciclo de prototipagem para produção.
O Gemma 4 disponibiliza arquiteturas especializadas por caso de uso:
- **31B dense**: Configuração completa para máxima precisão em tarefas complexas de raciocínio, rivalizando com modelos proprietários 20 vezes maiores em benchmarks de linguagem
- **26B MoE (Mixture of Experts)**: Arquitetura esparsa que ativa apenas subconjuntos de parâmetros por inferência, reduzindo latência em ambientes de alta concorrência
- **2B e 4B effective**: Variantes quantizadas otimizadas para edge computing, capazes de rodar offline em dispositivos ARM
