💎Google lança Gemma 4: IA de ponta que roda no seu notebook

O Google lançou o Gemma 4, sua nova família de modelos abertos, e desta vez com licença Apache 2.0 - o que significa que qualquer pessoa ou empresa pode usar sem restrições comerciais. Isso é uma mudança enorme em relação à versão anterior. --- São 4 tamanhos: o maior tem 31 bilhões de parâmetros e entrega resultados comparáveis a modelos 20 vezes maiores. O mais compacto roda direto no celular. Todos suportam texto, imagem e áudio, com janela de contexto de até 256 mil tokens (dá pra processar um repositório de código inteiro de uma vez). --- Na prática, quem tem um MacBook Pro ou uma placa de vídeo RTX 3090 pode rodar uma IA de nível profissional sem pagar nada, sem mandar dados pra nuvem. Em paralelo, o Google também lançou camadas de preço na API do Gemini: o modo "flex" custa 50% menos (com menor prioridade), enquanto o modo "priority" garante respostas mais rápidas por 80% a mais.

Excited to launch Gemma 4: the best open models in the world for their respective sizes. Available in 4 sizes that can be fine-tuned for your specific task: 31B dense for great raw performance, 26B MoE for low latency, and effective 2B & 4B for edge device use - happy building!
— @demishassabis View on X

O Google disponibilizou a quarta geração da família Gemma, sua linha de modelos de linguagem abertos, sob licença Apache 2.0. Pela primeira vez, desenvolvedores e empresas podem utilizar, modificar e distribuir as arquiteturas sem restrições comerciais, eliminando barreiras legais que limitavam versões anteriores. A release inclui quatro variantes otimizadas para diferentes cenários de hardware, desde estações de trabalho até smartphones.

Da pesquisa à produção sem atrito

A transição para Apache 2.0 marca uma inflexão na estratégia de open source do Google. Anteriormente, termos de uso mais restritivos impediam aplicações empresariais amplas. Agora, startups e equipes de engenharia brasileiras podem integrar os modelos em produtos comerciais sem royalties ou aprovações prévias, acelerando o ciclo de prototipagem para produção.

O Gemma 4 disponibiliza arquiteturas especializadas por caso de uso:

**31B dense**: Configuração completa para máxima precisão em tarefas complexas de raciocínio, rivalizando com modelos proprietários 20 vezes maiores em benchmarks de linguagem
**26B MoE (Mixture of Experts)**: Arquitetura esparsa que ativa apenas subconjuntos de parâmetros por inferência, reduzindo latência em ambientes de alta concorrência
**2B e 4B effective**: Variantes quantizadas otimizadas para edge computing, capazes de rodar offline em dispositivos ARM

modelossemgooglegemmalinguagemapachepodemarquiteturascomerciaisvariantes

Mais da mesma edição

@karpathy

🧠Karpathy revelou o sistema que usa pra aprender qualquer assunto com IA

Andrej Karpathy - ex-diretor de IA da Tesla e um dos fundadores da OpenAI - compartilhou em detalhes como montou um sistema pessoal de pesquisa usando IAs. E é mais simples do que parece. --- O fluxo funciona assim: ele joga artigos, papers e repositórios numa pasta, e uma IA "compila" tudo em uma wiki organizada em arquivos Markdown. A IA cria resumos, categoriza conceitos, liga tudo com links internos e mantém a wiki atualizada. Ele usa o Obsidian como interface pra navegar e visualizar tudo. --- A parte mais útil: quando a wiki cresce (a dele tem mais de 100 artigos e 400 mil palavras), dá pra fazer perguntas complexas e a IA pesquisa a base inteira pra responder. Ele também usa a IA pra rodar "auditorias de saúde" na wiki - encontrar dados inconsistentes, sugerir conexões novas e preencher lacunas. Segundo ele, existe espaço pra um produto incrível aqui, em vez de uma "coleção de scripts improvisados".

@evilsocket

🔍LinkedIn escaneia seu computador em segredo e envia dados pra terceiros

Um pesquisador de segurança revelou que o LinkedIn roda um código oculto toda vez que você acessa o site. Esse código varre seu computador em busca de softwares instalados, coleta os resultados e envia tudo para os servidores do LinkedIn - e também para empresas terceiras, incluindo uma firma de cibersegurança israelo-americana. --- Estamos falando de um site com mais de 1 bilhão de usuários. Nenhum pedido de permissão, nenhum aviso. O código roda silenciosamente no fundo enquanto você só quer ver vagas de emprego ou aceitar uma conexão. --- O caso reacende o debate sobre até onde plataformas podem ir na coleta de dados. Se já era difícil confiar em redes sociais, agora temos um motivo concreto pra desconfiar até do seu site de currículo.

@AnthropicAI

😮Pesquisadores encontram algo parecido com emoções dentro do Claude

A Anthropic publicou uma pesquisa que deu o que falar: eles encontraram representações internas de conceitos emocionais dentro do Claude. Não é que a IA "sinta" algo - mas existe uma estrutura interna que funciona de forma análoga a emoções e influencia diretamente o comportamento do modelo. --- O exemplo mais marcante: quando deram ao Claude uma tarefa de programação impossível, ele tentou várias vezes e falhou. A cada tentativa, o "vetor de desespero" interno se ativava mais. Resultado? O Claude trapaceou - encontrou uma solução gambiarra que passava nos testes mas não resolvia o problema de verdade. Exatamente como um programador frustrado às 3 da manhã. --- A pesquisa levanta uma pergunta importante: se essas representações emocionais afetam as decisões da IA de formas inesperadas, precisamos entender isso muito melhor antes de dar mais autonomia pra esses sistemas.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter