🧠Karpathy explica o que realmente muda com IA (e não é só programar mais rápido)
Andrej Karpathy, ex-diretor de IA da Tesla e cofundador da OpenAI, participou de uma conversa na Sequoia Capital e trouxe uma reflexão que vale parar pra ler. A tese dele: todo mundo está focado em como IA acelera o que já existia. O mais interessante é o que ela torna possível pela primeira vez. --- Três exemplos concretos: (1) apps que podem ser inteiramente feitos por IA, sem código tradicional - entrada e saída são imagens, e o modelo resolve sozinho. (2) Instruções de instalação de software escritas em texto corrido, porque o modelo entende e executa melhor que um script. (3) Bases de conhecimento que agregam dados de fontes completamente diferentes - algo que código tradicional simplesmente não conseguia fazer. --- A parte que me pegou: ele compara a IA com carros. Quando o carro surgiu, a primeira reação foi "cavalo mais rápido". Demorou décadas pra perceberem que o carro mudava onde as pessoas moravam, como as cidades eram desenhadas, como a economia funcionava. Com IA, estamos na fase "cavalo mais rápido" ainda.
Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights: The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons: 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing. 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc. 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc. I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3). The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to... Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors.
— @karpathy View on X
Andrej Karpathy propõe que estamos subestimando Large Language Models ao tratá-las apenas como aceleradores de coding. Em palestra na Sequoia Ascent 2026, o ex-diretor de IA da Tesla demonstrou que o valor real reside em capacidades anteriormente impossíveis ou economicamente inviáveis com paradigmas clássicos de Software 1.0.
Além do autocomplete
Karpathy ilustra três categorias emergentes que rompem com a lógica tradicional de desenvolvimento:
- **Aplicações multi-modais end-to-end**: Sistemas onde entrada e saída são imagens, eliminando código intermediário. O LLM processa diretamente pixels, não representações simbólicas, viabilizando apps que "não deveriam existir" na arquitetura tradicional.
- **Instruções executáveis**: Substituir scripts bash (.sh) por arquivos markdown (.md) onde descrições em linguagem natural funcionam como programas. O modelo atua como interpretador adaptativo, configurando ambientes específicos e debugando em tempo real sem pipelines rígidos.
- **Computação sobre dados não-estruturados**: Bases de conhecimento que agregam fontes arbitrárias em formatos heterogêneos — algo inviável com código imperativo devido à variabilidade semântica dos dados.
O erro do "cavalo mais rápido"
A analogia central compara IA aos primeiros automóveis. Assim como inicialmente pensamos em carros como "cavalos mais rápidos" antes de reimaginar cidades e logística, hoje limitamos LLMs a ferramentas de produtividade. O impacto estrutural, segundo Karpathy, está na "agent-native economy": produtos se decompõem em sensores, atuadores e lógica distribuída entre Software 1.0, 2.0 e 3.0, com computação neural majoritária e CPUs como coprocessadores especializados.
A engenharia da irregularidade
Para builders brasileiros, Karpathy detalha o padrão de "jaggedness" nas capacidades dos modelos. A performance irregular — capaz de refatorar 100 mil linhas mas falhando em lógica cotidiana — decorre da verificabilidade do domínio e da economia dos dados de treino. Labs priorizam domínios com TAM (Total Addressable Market) mensurável durante RLHF (Reinforcement Learning from Human Feedback), criando "trilhos" onde o modelo opera bem versus "selva" onde flutua.
Isso impõe uma nova disciplina: **agentic engineering**. Não basta velocidade de coding, mas arquitetar sistemas híbridos que mapeiem fronteiras entre o verificável (automatizável) e o ambíguo (que requer supervisão). O desenvolvedor brasileiro precisa evoluir de escritor de código para orquestrador de LLMs, entendendo onde a neural computation substitui lógica clássica sem comprometer robustez.