News›06 Junho›Google lança app gratuito que transcreve e traduz por voz, tudo offline

Edição #115·6 de junho de 2026·1 min

🎙️Google lança app gratuito que transcreve e traduz por voz, tudo offline

O Google lançou o Eloquent, um aplicativo gratuito de ditado e transcrição por voz para Mac e iPhone que funciona inteiramente no seu aparelho, sem enviar nada para a nuvem. Ele roda com o modelo Gemma 12B e consegue transcrever áudio, traduzir entre idiomas, ditar texto e até polir o que você falou, tudo localmente. --- Quem testou relata que a transcrição é surpreendentemente boa, mesmo em arquivos curtos de 3 a 4 minutos. O app faz parte do projeto Google AI Edge, a aposta da empresa em colocar inteligência artificial para funcionar direto nos dispositivos, sem depender de conexão com internet. --- Para quem trabalha com entrevistas, reuniões ou simplesmente prefere falar em vez de digitar, é o tipo de ferramenta que pode entrar na rotina rápido. O fato de ser offline resolve duas dores de uma vez: funciona em qualquer lugar e seus dados não saem do aparelho.

O Google lançou o Eloquent, um aplicativo gratuito de ditado e transcrição por voz para Mac e iPhone que funciona inteiramente no seu aparelho, sem enviar nada para a nuvem. Ele roda com o modelo Gemma 12B e consegue transcrever áudio, traduzir entre idiomas, ditar texto e até polir o que você falou, tudo localmente.
— @ai_for_success View on X

O Google lançou o Eloquent, aplicativo gratuito de transcrição e tradução por voz que opera exclusivamente offline em dispositivos Apple. A ferramenta processa áudio localmente utilizando o modelo Gemma 12B, eliminando a dependência de APIs em nuvem e mantendo dados do usuário no dispositivo.

Arquitetura on-device e processamento local

Diferente de soluções como Whisper Cloud ou Google Cloud Speech-to-Text, o Eloquent executa inferência diretamente no hardware do Mac ou iPhone. O modelo Gemma 12B — versão compacta da família open source do Google — roda localmente para converter fala em texto, traduzir entre idiomas e refinar o conteúdo transcrito (polishing).

A distinção técnica aqui é o edge computing aplicado a NLP: em vez de enviar streams de áudio para servidores remotos, o aplicativo aproveita o Neural Engine dos chips Apple para processamento de speech-to-text sem latência de rede. Testes iniciais indicam precisão consistente mesmo em arquivos curtos de três a quatro minutos, cenário tradicionalmente desafiador para modelos compactos.

Implicações para privacidade e cust

googleeloquentaplicativoappleáudiolocalmentemodelogemmaprocessamentocloud

Mais da mesma edição

@SemiAnalysis_

🔓Nvidia abre projeto dos servidores Rubin e revela surpresa: um chip AMD lá dentro

A Nvidia fez algo raro: abriu publicamente os diagramas e a lista completa de componentes dos seus novos servidores da linha Rubin, os mais poderosos que a empresa já produziu. E dentro dessa documentação apareceu um detalhe que chamou atenção de todo o setor: cada rack (aquele armário gigante de servidores) usa 9 pequenos processadores da AMD, sua principal concorrente em chips. --- O chip em questão é o AMD EPYC 3151, um processador simples, de uso embutido, que faz o papel de gerenciar funções internas do servidor. Não é o cérebro do sistema, mas é curioso ver a Nvidia precisando da rival para fazer seu próprio hardware funcionar. O projeto foi publicado no GitHub com licença aberta, o que significa que qualquer fabricante pode estudar e até replicar partes da arquitetura. --- É um movimento estratégico: ao abrir o projeto, a Nvidia facilita a vida de quem monta data centers e quer padronizar infraestrutura. E a presença da AMD ali dentro mostra que, por mais que as duas disputem mercado ferozmente, na prática o ecossistema de chips é mais interdependente do que parece.

@eglyman

💸Ramp levanta US$ 750 milhões e expõe o maior problema das empresas com IA

A Ramp, fintech americana de gestão de gastos corporativos, levantou uma rodada de US$ 750 milhões com avaliação de US$ 44 bilhões. Mas o mais interessante não foi o cheque: foi o alerta do CEO Eric Glyman sobre como as empresas estão queimando dinheiro com inteligência artificial sem ter a menor ideia do que está funcionando. --- Glyman deu um exemplo prático: a maioria das empresas usa os modelos mais caros e poderosos (os chamados 'de fronteira') para qualquer tarefa, inclusive para resumir reuniões ou atualizar calendários, coisas que modelos mais baratos resolvem perfeitamente. Redirecionar apenas 10% de uma fatura de US$ 10 milhões em IA para modelos mais simples economizaria quase US$ 1 milhão. --- O ponto central é que a IA está se tornando o terceiro grande pilar de custo das empresas, junto com pessoas e software. Mas, diferente de salários e licenças, quase ninguém sabe medir se aquele gasto em IA realmente gerou resultado. O financeiro quer cortar, a engenharia quer dobrar, e ninguém tem dados para resolver a briga.

@ai_for_success

📱Google comprime modelos de IA para rodar no celular sem internet

O Google lançou versões ultracomprimidas dos seus modelos Gemma 4, projetadas para rodar localmente em celulares, notebooks e computadores com pouca memória. A versão mais leve, chamada Gemma 4 E2B (só texto), funciona com menos de 1 GB de memória. Para comparação, isso é menos do que muitos aplicativos de redes sociais ocupam. --- A mágica está numa técnica chamada QAT, que, em vez de simplesmente 'espremer' o modelo depois de pronto (o que destrói qualidade), já treina o modelo sabendo que ele vai ser comprimido. O resultado é um modelo muito menor que mantém boa parte da capacidade de raciocínio do original. Algumas camadas foram comprimidas a ponto de usar apenas 2 bits por parâmetro. --- Na prática, isso significa que estamos cada vez mais perto de ter IA competente funcionando offline, direto no aparelho, sem depender de servidores na nuvem. Mais privacidade, mais velocidade, menos custo. O Google já liberou os arquivos prontos para uso em dispositivos móveis.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter