📱Agente agora chama Uber pra você de um celular hospedado em outro país
O Peter Steinberger (mesmo do Peekaboo das semanas anteriores) montou um setup novo: um celular Android físico instalado num datacenter, conectado ao computador dele via Tailscale (programa que cria uma rede privada entre dispositivos como se eles estivessem na mesma casa). --- Aí ele soltou o agente dele em cima. O agente, rodando no Mac dele, agora controla o Android remoto. Faz tudo que um humano faria no celular: toca tela, abre app, digita. Steinberger brincou: "agora meu agente pode chamar Uber pra mim". --- Não é um produto pronto pra você usar. É demo de capacidade: o agente já não está mais preso ao seu computador, pode operar dispositivo físico em qualquer lugar do mundo. Tarefa que precisa de celular (apps que não têm versão web, autenticação em duas etapas, leitura de SMS) finalmente entra no menu de coisas que agente faz.

Streaming an Android phone to my Mac in a data center via Tailscale + https://t.co/iT7Eq2zYG7 and my claw controls it via https://t.co/2cXk37Lxt7. Now my claw can order me an Uber.
— @steipete View on X
Peter Steinberger, desenvolvedor conhecido pelo aplicativo Peekaboo, demonstrou uma arquitetura que elimina a barreira física entre agentes de IA e dispositivos móveis. Em uma configuração experimental publicada no Twitter, seu agente controla um smartphone Android fisicamente instalado em um datacenter estrangeiro, executando tarefas complexas como solicitar corridas via aplicativos de transporte através de streaming de tela e controle remoto.
Como funciona o setup técnico
A implementação combina três camadas de infraestrutura. O hardware físico — um celular Android — permanece em um datacenter, conectado à internet via Tailscale, uma VPN mesh que cria uma rede privada persistente entre dispositivos dispersos geograficamente como se compartilhassem a mesma LAN local. Steinberger faz streaming da interface do Android para seu Mac usando ferramentas de mirror de tela, enquanto o agente de IA, operando no computador local, envia comandos de toque e digitação através do protocolo de controle remoto.
O resultado é um "braço robótico" digital que opera o celular via interface visual, não por APIs. O agente enxerga a tela, identifica elementos de UI e interage com eles exatamente como um usuário humano faria, mas sem limitação geográfica.
O problema real que isso resolve
Para builders e desenvolvedores brasileiros, a demonstração resolve gargalos críticos de automação que persistem no ecossistema mobile:
- **Apps mobile-only**: Serviços que não oferecem APIs públicas ou versões web completas — como alguns bancos, governos e marketplaces locais — agora podem ser automatizados sem engenharia reversa complexa
- **Autenticação 2FA via SMS**: Sistemas de verificação em duas etapas dependentes de leitura de mensagens de texto em hardware físico podem ser integrados a pipelines de automação corporativa
- **Testes em hardware real**: Desenvolvedores podem executar testes de interface em dispositivos reais localizados em outros países, simulando condições de rede e geolocalização específicas sem manter farms de celulares localmente
Limitações e contexto
Não se trata de um produto pronto para consumo em massa. A latência entre o datacenter e o endpoint local, o custo operacional de manter hardware físico remoto ativo 24/7 e a fragilidade de automações baseadas em posicionamento de elementos visuais ainda representam barreiras significativas para adoção comercial.
Contudo, a prova de conceito sinaliza uma mudança de paradigma na arquitetura de agentes de IA: a capacidade de "computer use" deixa de estar restrita ao ambiente desktop local e expande-se para qualquer dispositivo conectado à internet, independentemente de sua localização geográfica ou sistema de APIs expostas. Para o mercado brasileiro, onde muitos serviços essenciais operam apenas através de aplicativos móveis fechados, essa abordagem pode viabilizar integrações até então impossíveis via métodos tradicionais.
