News18 AbrilVoiceBox: clone de voz gratuito que roda inteiro na sua máquina
Edição #68·18 de abril de 2026·2 min

🎙️VoiceBox: clone de voz gratuito que roda inteiro na sua máquina

Apareceu um concorrente open source do ElevenLabs que chamou atenção: o VoiceBox. Com poucos segundos de áudio de referência, ele clona qualquer voz em 23 idiomas. Roda 100% local - nada sai do seu computador. --- O diferencial que pega: ele tem uma timeline estilo DAW (aqueles editores de áudio profissionais) pra montar podcasts e conversas completas. São 5 motores de síntese de voz diferentes, mais efeitos de áudio. Tudo de graça, tudo na sua máquina. --- Pra quem cria conteúdo - YouTubers, podcasters, quem faz cursos online - isso muda o jogo. Não pela tecnologia em si (clonagem de voz já existe há um tempo), mas pela combinação de qualidade, privacidade e custo zero. Dá raiva ninguém ter empacotado isso direito antes.

VoiceBox: clone de voz gratuito que roda inteiro na sua máquina

O que é o VoiceBox

O VoiceBox é um modelo de síntese de voz open source que permite clonar qualquer voz com apenas alguns segundos de áudio de referência. Desenvolvido para rodar 100% localmente, nada sai do seu computador durante o processo — um diferencial direto em relação a serviços como o ElevenLabs, que dependem de processamento em nuvem.

A ferramenta suporta 23 idiomas e oferece cinco motores TTS distintos, além de efeitos de áudio integrados. O recurso que mais se destaca é a timeline estilo DAW, permitindo a montagem de podcasts e conversas completas diretamente na interface.

Por que isso importa para criadores brasileiros

Para YouTubers, podcasters e quem produz cursos online, o VoiceBox resolve três problemas simultâneos:

  • **Custo zero**: diferentemente de APIs pagos que cobram por minuto gerado, o VoiceBox não tem custos de uso após a instalação
  • **Privacidade**: áudios sensíveis ou testes com vozes não precisam sair da máquina
  • **Flexibilidade de edição**: a timeline integrada permite ajustar entonação, pausas e ritmo sem depender de ferramentas externas

A combinação desses fatores é o que tem chamado a atenção de criadores de conteúdo e desenvolvedores de IA no Brasil e abroad.

O angle técnico

O VoiceBox utiliza modelos de deep learning para síntese de voz que funcionam em hardware comum. A clonagem a partir de poucos segundos de referência reduz a barreira de entrada — não é mais necessário gravar horas de amostra para obter resultados razoáveis.

Os cinco motores TTS permitem escolher entre diferentes perfis de voz e entonação, enquanto os efeitos de áudio integrados (como ajuste de velocidade e pitch) eliminam a necessidade de pós-produção em software separado.

Implicações para devs e builders

Para desenvolvedores que integram síntese de voz em aplicações, o VoiceBox oferece uma alternativa self-hosted às APIs comerciais. Isso significa controle total sobre custos operacionais, compliance com políticas de privacidade de dados e possibilidade de customização fine-tuned do modelo.

O formato open source também permite que a comunidade contribua com melhorias, correções e novos idiomas — algo que serviços proprietários não oferecem com a mesma transparência.

O cenário competitivo

Serviços como ElevenLabs e Murf dominam o mercado de síntese de voz via API, mas operam exclusivamente em nuvem. O VoiceBox não pretende necessariamente substituir essas soluções para todos os casos de uso — especialmente onde a infraestrutura local é limitada —, mas preenche uma lacuna clara para quem precisa de controle total sobre o pipeline de áudio.

A chegada de alternativas open source como esta tende a pressionar preços do mercado e acelerar a adoção de ferramentas locais em contextos onde privacidade e custo são prioritários.

voiceboxvoznãosínteseáudioopensourcepermiteserviçosprivacidade

Mais da mesma edição

@patrickc

🧬O CEO do Stripe analisou o próprio DNA com IA e salvou sua pele - literalmente

Patrick Collison, CEO do Stripe (a empresa que processa pagamentos de metade da internet), contou que a coisa mais útil que já fez pela própria saúde não veio de nenhum médico caro do Vale do Silício. Veio de soltar agentes de IA no próprio genoma. --- O resultado? Ele descobriu que tem uma predisposição 30 vezes maior do que a média para melanoma. Trinta vezes. Com essa informação, conseguiu encontrar suplementos específicos para as mutações dele e aumentar a frequência dos exames de pele. Tudo isso por menos de US$ 100 de análise, mais algumas centenas pelo sequenciamento genético. --- O ponto que ele levanta é certeiro: a medicina trabalha com médias populacionais, mas nós não somos médias. Cada genoma tem particularidades que exames padrão simplesmente não pegam. E os modelos de IA atuais já são bons o suficiente pra fazer essa análise personalizada - desde que você use modelos recentes, não os de dois anos atrás que os papers acadêmicos insistem em testar.

@xai

@svpino

🌍Modelo open source gera mundos 3D inteiros a partir de texto

Um novo modelo de código aberto consegue gerar mundos 3D completos a partir de um prompt de texto, imagem ou vídeo. Os resultados podem ser exportados como meshes e arquivos 3DGS para edição no Unity e Unreal Engine - as duas maiores plataformas de desenvolvimento de jogos. --- Mas não é só cenário estático. Dá pra gerar personagens 3D dentro do mundo e andar por ele. O modelo funciona tanto para criação de mundos novos quanto para reconstrução de ambientes a partir de referências. Tudo disponível no GitHub e no Hugging Face. --- Me impressionou porque isso encurta absurdamente o caminho entre ter uma ideia e ter um protótipo jogável. Antes, criar um cenário 3D era trabalho de semanas com equipe especializada. Agora, uma pessoa sozinha digita uma descrição e tem um mundo navegável em minutos.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter