🎙️OpenAI prepara novo modelo de voz chamado Bidi 1

Segundo o TestingCatalog, um perfil conhecido por descobrir novidades nos bastidores dos apps de IA, a OpenAI está preparando o lançamento de um modelo de voz chamado "Bidi 1" para a versão web do ChatGPT. O modelo aparecerá como uma terceira opção nas configurações, ao lado dos modos "padrão" e "avançado" que já existem. Visualmente, o botão de voz vai trocar a cor azul por amarelo. --- Os detalhes técnicos ainda são escassos, mas o nome "Bidi" sugere comunicação bidirecional, ou seja, um modo de conversa mais natural onde a IA pode falar e ouvir ao mesmo tempo, sem aquele vai e volta de turnos. Se for isso, é um passo importante para tornar a conversa por voz com IA menos parecida com uma ligação de telemarketing e mais parecida com uma conversa real.

Segundo o TestingCatalog, um perfil conhecido por descobrir novidades nos bastidores dos apps de IA, a OpenAI está preparando o lançamento de um modelo de voz chamado "Bidi 1" para a versão web do ChatGPT. O modelo aparecerá como uma terceira opção nas configurações, ao lado dos modos "padrão" e "avançado" que já existem. Visualmente, o botão de voz vai trocar a cor azul por amarelo.
— @testingcatalog View on X

A OpenAI está preparando o lançamento do "Bidi 1", um novo modelo de voz projetado para a versão web do ChatGPT. A informação, revelada pelo perfil TestingCatalog — conhecido por identificar funcionalidades em desenvolvimento através de engenharia reversa — indica que a ferramenta surgirá como terceira opção nas configurações de áudio, ao lado dos modos "padrão" e "avançado". A mudança também trará uma alteração visual: o botão de microfone passará da cor azul para amarelo.

Arquitetura bidirecional e latência reduzida

O nome "Bidi" sugere implementação full-duplex, permitindo que o sistema processe fala e áudio simultaneamente. Isso elimina o padrão atual de turnos — onde usuário fala, espera, e depois a IA responde — aproximando a interação de uma conversa humana natural.

Modelos tradicionais de speech-to-text e text-to-speech operam em pipeline sequencial, gerando latência perceptível entre interações. Sistemas bidirecionais implementam streaming contínuo de áudio, com processamento em tempo real que detecta pausas naturais e interrupções, redu

áudiobidipadrãolatênciafalaopenaiestápreparandolançamentonovo

Mais da mesma edição

@sama

🛡️OpenAI lança modelo de IA focado em cibersegurança

Sam Altman anunciou o GPT-5.5-Cyber, um modelo treinado especificamente para encontrar e corrigir falhas de segurança digital. É a primeira vez que a OpenAI foca um modelo inteiro nessa área. E não para por aí: junto vieram duas ferramentas novas, o Patch The Planet e o Codex Security, que prometem não só detectar problemas, mas resolvê-los de verdade. --- A diferença importa. Até agora, a maioria das ferramentas de segurança baseadas em IA funcionava como um alarme: avisava que algo estava errado, mas o trabalho pesado de consertar ficava com o time humano. A ideia aqui é que a própria IA aplique as correções. Se funcionar como prometido, empresas menores, que não têm orçamento para times gigantes de segurança, são as que mais ganham. --- O movimento também sinaliza uma aproximação da OpenAI com o governo americano. Altman mencionou explicitamente a parceria com o governo dos EUA e o ecossistema de segurança. Em tempos de ataques cibernéticos cada vez mais sofisticados, ter IA do lado da defesa pode ser tão importante quanto tê-la do lado da criação.

@AndrewCurran_

🎬Google investe US$ 75 milhões na A24 para levar IA ao cinema

O Google está colocando US$ 75 milhões na A24, a produtora indie por trás de filmes como Tudo em Todo o Lugar ao Mesmo Tempo e Moonlight. O acordo inclui uma parceria de pesquisa para criar ferramentas de IA voltadas para produção e distribuição de filmes. Não é um investimento qualquer: é a big tech entrando de vez no cinema autoral. --- A pergunta que fica é o que exatamente essas ferramentas vão fazer. Edição automatizada? Efeitos visuais mais baratos? Distribuição personalizada? O Google não detalhou, mas a A24 é conhecida por ser experimental e aberta a novos formatos. Em paralelo, um estúdio chinês chamado Utopai já está produzindo uma adaptação totalmente gerada por IA do clássico Jornada ao Oeste. --- Para quem acompanha o debate sobre IA no entretenimento, esse é um ponto de virada. Quando uma das produtoras mais respeitadas de Hollywood aceita dinheiro de big tech para experimentar com IA, fica difícil manter o discurso de que isso é só moda passageira.

@AndrewCurran_

⚛️Trump assina decreto para computador quântico até 2028

O presidente Trump assinou uma ordem executiva criando um esforço nacional para desenvolver pelo menos um computador quântico funcional até 2028. O objetivo declarado é inaugurar uma nova era de descobertas científicas possibilitadas pela computação quântica. É, basicamente, uma corrida espacial, só que com átomos. --- Para quem não acompanha: computadores quânticos processam informações de um jeito radicalmente diferente dos computadores normais. Em vez de bits (0 ou 1), usam qubits, que podem ser 0 e 1 ao mesmo tempo. Isso permite resolver problemas que levariam milhares de anos em computadores convencionais, como simulações de moléculas para novos remédios ou quebra de criptografia. --- O prazo de 2028 é ambicioso. Empresas como Google e IBM já têm protótipos, mas nenhum deles é grande e estável o suficiente para uso prático em escala. Ter o governo americano empurrando com dinheiro e prioridade pode acelerar as coisas, mas três anos é pouco tempo para a física cooperar.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter