🤖Agente de IA agenda posts no Instagram e TikTok clicando nos botões por você
Peter Yang, gerente de produto, revelou um fluxo de trabalho que parece saído de um filme de ficção científica, mas já funciona no dia a dia dele. Como as APIs (as portas de comunicação entre sistemas) do Instagram e do TikTok são péssimas, ele criou um agente usando o Codex da OpenAI que corta vídeos automaticamente e depois literalmente navega pelo site do Meta Business Suite e do TikTok, clicando em botões como um humano faria, para agendar as publicações. --- O processo tem mais de 20 etapas e Peter admite que vive com medo de que a coisa quebre. Mas até agora, está funcionando. Isso mostra um padrão curioso: quando as empresas não oferecem boas integrações, os agentes de IA simplesmente contornam o problema imitando um ser humano na tela. As plataformas que não se adaptarem vão ser automatizadas à força.
Peter Yang, gerente de produto, revelou um fluxo de trabalho que parece saído de um filme de ficção científica, mas já funciona no dia a dia dele. Como as APIs (as portas de comunicação entre sistemas) do Instagram e do TikTok são péssimas, ele criou um agente usando o Codex da OpenAI que corta vídeos automaticamente e depois literalmente navega pelo site do Meta Business Suite e do TikTok, clicando em botões como um humano faria, para agendar as publicações.
— @petergyang View on X
Peter Yang, gerente de produto, automatizou o agendamento de posts no Instagram e TikTok sem escrever uma linha de integração com as APIs oficiais. Ele construiu um agente usando o Codex da OpenAI que edita vídeos e controla o navegador, clicando nos botões da Meta Business Suite e do site do TikTok como um usuário real. A solução já está em uso no dia a dia dele.
O problema por trás da gambiarra
Qualquer desenvolvedor que já tentou publicar conteúdo em escala nessas plataformas conhece a fricção: as APIs do Meta e do TikTok são instáveis, limitadas ou inexistentes para fluxos completos de agendamento. Documentação fragmentada, permissões rigorosas e rate limits agressivos tornam o desenvolvimento lento. Para quem constrói produtos no Brasil, onde agências e creators dependem de volumetria alta, esperar pela integração ideal não é opção viável.
Como o agente opera
O fluxo tem mais de 20 etapas e combina processamento de mídia com automação de navegador:
- **Edição automática**: o agente processa e corta o vídeo antes da publicação;
- **Navegação autônoma**: acessa o Meta Business Suite e o painel do TikTok via navegador;
- **Interação visual**: localiza botões, preenche campos de legenda, define datas e confirma o agendamento interpretando a interface gráfica.
O modelo é essencialmente RPA (Robotic Process Automation) potencializado por LLM, onde o agente lê a tela em vez de consumir endpoints REST.
A fragilidade do método
Yang admitiu que vive com medo do sistema quebrar. A razão é simples: interfaces web mudam constantemente. Uma alteração no DOM, um novo seletor de CSS ou um botão de consentimento inesperado pode interromper todo o pipeline. A abordagem funciona, mas carrega risco operacional real.
O que muda para builders e devs brasileiros
Esse caso sinaliza uma mudança concreta na arquitetura de automação. Quando plataformas mantêm APIs deficientes, os agentes de IA não desistem — eles passam a operar o sistema pelo navegador, interpretando elementos visuais. Para o ecossistema brasileiro de startups, agências tech e devs independentes, isso levanta questões práticas: automação de redes sociais via controle de navegador vive em zona cinzenta nos termos de serviço, mas é exatamente onde o mercado está migrando por necessidade.
O padrão é claro. Integrações nativas ruins criam demanda direta por agentes autônomos baseados em visão computacional e modelos de linguagem. Empresas que não oferecerem interfaces programáticas estáveis serão integradas à força, com ou sem permissão. O trabalho do desenvolvedor deixa de ser apenas consumir APIs e passa a ser orquestrar agentes que enxergam a tela.