News03 JunhoPerplexity vai dividir tarefas entre IA local e nuvem
Edição #112·3 de junho de 2026·2 min

🔀Perplexity vai dividir tarefas entre IA local e nuvem

A Perplexity anunciou uma novidade interessante para o seu produto Perplexity Computer: inferência híbrida, que nada mais é do que dividir o trabalho entre um modelo de IA rodando no seu próprio computador e modelos mais poderosos na nuvem. A ideia é simples: dados sensíveis ficam na sua máquina, enquanto tarefas que exigem mais poder são enviadas para servidores externos. --- Na prática, isso resolve uma das maiores preocupações de quem usa IA no trabalho: "será que meus dados estão seguros?". Se o modelo local cuida das informações privadas e só manda para a nuvem o que não é confidencial, o risco diminui bastante. Além disso, a empresa promete que o sistema otimiza o uso de tokens, o que pode significar custos menores. --- O recurso ainda não tem data exata de lançamento, mas mostra uma tendência clara no mercado: o futuro da IA não é tudo na nuvem nem tudo no seu computador. É um meio-termo inteligente entre os dois.

A Perplexity anunciou uma atualização significativa para o Perplexity Computer: **inferência híbrida**, uma arquitetura que distribui processamento entre modelos locais e servidores em nuvem. A funcionalidade separa dados sensíveis — processados no hardware do usuário — de tarefas computacionalmente intensivas, enviadas para infraestrutura remota.

Como funciona a arquitetura híbrida

O sistema opera com duas camadas distintas:

  • **Processamento local**: Modelos leves executam no dispositivo, manipulando informações confidenciais sem sair da máquina
  • **Nuvem especializada**: Tarefas complexas — como raciocínio avançado ou geração de código — são direcionadas para LLMs maiores em servidores externos

Essa abordagem de **edge computing** combinado com **cloud inference** representa uma evolução na arquitetura de aplicações de IA generativa.

Por que importa para desenvolvedores brasileiros

A estratégia da Perplexity endereça três gargalos críticos do desenvolvimento com IA no Brasil:

**Privacidade de dados corporativos**: Empresas que lidam com LGPD podem manter PII (Personally Identifiable Information) e dados proprietários no hardware local, reduzindo vetores de vazamento e complexidade de compliance.

**Latência e custos**: O roteamento inteligente otimiza consumo de tokens — recurso particularmente relevante dada a flutuação do câmbio e preços de APIs em dólar. Tarefas simples não sobrecarregam endpoints caros.

**Sovereign AI**: A tendência alinha-se com demandas crescentes por **AI on-premise** e soluções híbridas, onde organizações mantêm controle sobre dados críticos enquanto acessam capacidade computacional elástica.

O cenário técnico atual

Ainda sem data de lançamento definida, o anúncio posiciona a Perplexity junto a outras iniciativas de **federated learning** e inferência distribuída — como as implementações da Apple com seus modelos on-device e estratégias similares da Microsoft com Copilot+ PCs.

Para builders, a mensagem é clara: a próxima geração de aplicações de IA não será binária entre local e nuvem. A arquitetura vencedora combina **privacy-preserving AI** com poder computacional remoto, exigindo novos padrões de orquestração entre edge e cloud.

O movimento também sinaliza pressão sobre provedores de infraestrutura brasileiros: à medida que workloads sensíveis permanecem nos dispositivos, a demanda por data centers locais pode se concentrar em casos de uso específicos, não em processamento generalizado de IA.

perplexityarquiteturadadosprocessamentoentremodelosnuvemtarefaslocalnão

Mais da mesma edição

@LundukeJournal

🔒Microsoft vai desativar o Office 2019 para Mac, mesmo para quem comprou

Se você é daqueles que comprou o Office 2019 para Mac justamente para não depender de assinatura, prepare-se para uma notícia desagradável. A Microsoft anunciou que, em 13 de julho de 2026, vai colocar o software em "modo de funcionalidade reduzida". Na prática, isso significa que você não vai mais conseguir criar documentos novos nem editar os que já tem. Sim, o programa que custou 149,99 dólares como licença "permanente" vai virar um peso morto no seu computador. --- A situação é revoltante por um motivo simples: as pessoas pagaram um valor cheio, de uma vez, exatamente para evitar o modelo de assinatura mensal que a Microsoft empurra com o Microsoft 365. A promessa era clara: pague uma vez, use para sempre. Agora, "para sempre" aparentemente tem data de validade. --- É o tipo de decisão que corrói a confiança do consumidor. Se software comprado pode ser desligado à distância, qual a diferença real entre comprar e alugar? A resposta, pelo visto, é nenhuma.

@OpenAI

🌐OpenAI lança Sites: crie um site inteiro pedindo em texto

A OpenAI acaba de lançar o Sites, um recurso integrado ao Codex que transforma ideias escritas em sites e aplicativos interativos, completos com URL para compartilhar. Você descreve o que quer, o Codex constrói, e qualquer pessoa da sua equipe pode acessar pelo navegador. Sem instalar nada, sem saber uma linha de código. --- O recurso está sendo liberado primeiro para os planos Business e Enterprise, com expansão prevista para mais usuários em breve. A jogada da OpenAI aqui é clara: transformar o ChatGPT de uma ferramenta de conversa numa plataforma onde você realmente produz coisas. Se antes a promessa era "a IA escreve código por você", agora é "a IA entrega o produto pronto". --- Claro, vale o ceticismo saudável: a distância entre "gerar um site funcional" e "gerar um site que resolva problemas reais de um negócio" ainda é grande. Mas para protótipos rápidos e ferramentas internas, o potencial é real.

@scaling01

🧠Microsoft revela modelo de IA com 1 trilhão de parâmetros

A Microsoft entrou de vez na corrida dos modelos gigantes com o MAI-Thinking-1. Os números impressionam: o modelo foi treinado com 1 trilhão de parâmetros (os "neurônios" artificiais que definem o que a IA sabe) e depois comprimido para 35 bilhões, uma técnica chamada destilação que tenta manter a inteligência num formato mais leve e barato de rodar. --- Para dar contexto, o treinamento consumiu 30 trilhões de tokens (as unidades de texto que a IA processa) e usou 8.192 chips GB200 da NVIDIA, o que é uma quantidade absurda de poder computacional. O modelo consegue lidar com até 256 mil tokens de contexto, o que significa que pode ler e processar textos muito longos de uma vez. --- Nos testes de desempenho, o MAI-Thinking-1 ficou no nível do GLM-5, um modelo chinês de ponta. Não é o melhor do mundo, mas mostra que a Microsoft não quer depender só de parcerias com a OpenAI. Ela quer ter seu próprio cérebro artificial, e está disposta a gastar bilhões para isso.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter