News04 AbrilAgora você pode fazer videochamada com seus agentes de IA
Edição #54·4 de abril de 2026·1 min

📹Agora você pode fazer videochamada com seus agentes de IA

Shubham Saboo mostrou que já é possível entrar em uma videochamada no Google Meet com agentes do OpenClaw. Basta mandar um convite de reunião, e o agente entra na call como se fosse um participante humano - com voz, vídeo e tudo. --- Parece coisa de ficção científica, mas o detalhe que chamou atenção é o custo: US$ 0,50 por minuto, ou US$ 30 por hora. Para comparação, um atendente humano terceirizado custa em média US$ 1 por hora. Ou seja: por enquanto, conversar cara a cara com IA é 30 vezes mais caro que falar com uma pessoa. A tecnologia é impressionante, mas os custos ainda precisam cair muito para fazer sentido no dia a dia.

Agora você pode fazer videochamada com seus agentes de IA

Agentes de IA deixaram de ser interfaces de texto exclusivamente. A partir de agora, eles podem participar de videochamadas no Google Meet como participantes convencionais, com voz, vídeo e capacidade de interação em tempo real. A demonstração recente do OpenClaw, compartilhada pelo desenvolvedor Shubham Saboo, mostra que basta enviar um convite de calendário para que o agente entre na sala de reunião.

De chat para vídeo: a nova fronteira dos agentes

A evolução representa um salto na arquitetura de agentes autônomos. Enquanto modelos de linguagem (LLMs) tradicionais operam via API de texto, a integração demonstrada pelo OpenClaw combina processamento de linguagem natural com pipelines de áudio e vídeo em tempo real. O agente não apenas escuta e responde: ele apresenta um avatar digital sincronizado com a fala, criando a ilusão de presença humana na call.

Tecnicamente, isso exige infraestrutura de baixa latência para processamento de fala (STT), geração de resposta pelo modelo de fundação, e síntese de voz (TTS) com sincronização labial. A integração nativa com o Google Meet sugere que a plataforma está utilizando APIs de comunicação em nuvem ou WebRTC customizado para se comportar como um endpoint de vídeo legítimo.

A matemática que não fecha (ainda)

O detalhe que separa o protótipo da adoção em massa está nos números. O serviço cobra US$ 0,50 por minuto de conversação, totalizando US$ 30 por hora. Para comparação, um atendente humano terceirizado em mercados emergentes custa cerca de US$ 1 por hora. A razão de custo de 30 para 1 torna a tecnologia economicamente inviável para operações de alto volume, como suporte técnico de primeiro nível ou telemarketing.

A discrepância de preço reflete o custo computacional de modelos multimodais em tempo real. Processar streaming de vídeo, gerar respostas contextuais e renderizar avatares digitais

vídeoagentestemporealpelotextogooglemeetvozopenclaw

Mais da mesma edição

@bcherny

Anthropic corta assinaturas do Claude em ferramentas de terceiros

A Anthropic anunciou que, a partir de amanhã (sábado, 12h no horário do Pacífico), assinaturas do Claude - incluindo os planos Pro e Max - não vão mais funcionar em ferramentas de terceiros como o OpenClaw. Quem quiser continuar usando, precisa comprar pacotes extras de uso ou usar uma chave de API. --- Boris Cherny, da Anthropic, disse que assinantes vão receber um crédito único equivalente ao valor do plano mensal. Quem preferir, pode pedir reembolso total. Mas a comunidade não recebeu bem: Peter Steinberger, criador do OpenClaw, disse que tentou negociar com a Anthropic e só conseguiu adiar a mudança em uma semana. Segundo ele, o timing é suspeito - primeiro a empresa copiou funcionalidades populares para seu próprio produto, depois cortou o acesso de ferramentas abertas. --- Para piorar, um post no Reddit levantou a suspeita de que o Claude Code já entregava resultados piores para usuários dos planos Pro e Max em comparação com clientes Enterprise. Se confirmado, isso significaria que os assinantes pagantes estavam sendo usados como vitrine para atrair empresas, enquanto recebiam um serviço inferior. --- A reação foi imediata: desenvolvedores influentes como Theo e Alex Finn recomendaram migrar para modelos locais (como Gemma 4 rodando em Mac Mini) ou para a API da OpenAI. A lição? Depender de uma assinatura de uma única empresa para suas ferramentas de trabalho é um risco real.

@steipete

@xai

📹Pika Labs lança videochamada com agentes de IA em tempo real

A Pika Labs lançou em beta a primeira skill de videochat em tempo real para agentes de IA, usando seu novo modelo PikaStream 1.0. Na prática: você pode mandar um convite do Google Meet pro seu agente e ele entra na chamada com rosto e voz. --- O sistema mantém memória e personalidade durante a conversa, e se adapta em tempo real ao que está acontecendo na call. Se for um Pika AI Self (o avatar personalizado da Pika), ele ainda consegue executar tarefas durante a videochamada - agendar coisas, buscar informações, tomar ações. --- Parece detalhe, mas muda bastante a dinâmica. Conversar cara a cara (mesmo que o outro "rosto" seja gerado por IA) cria um nível de interação que texto puro simplesmente não alcança. É o tipo de coisa que daqui a um ano a gente vai achar normal.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter