🛠️16 mil testes bugados, arrumados de madrugada

A Gumroad contou que usou agentes para estabilizar uma suíte com 16 mil testes que vinha atrapalhando o ritmo do time fazia anos. Não é um anúncio glamouroso, mas talvez seja um dos sinais mais úteis do dia: IA não serve só para inventar produto novo. Ela também pode atacar o entulho que trava empresa por dentro. --- Esse tipo de caso é ouro porque fala de dinheiro de verdade. Menos teste quebrando à toa significa menos atraso, menos retrabalho e menos energia mental jogada fora. O futuro da IA corporativa talvez seja bem menos cinematográfico do que os demos sugerem - e muito mais rentável.

Gumroad’s test suite of 16,000 tests has been flaky for years. This slowed down shipping tremendously. This week, Gianfranco used @karpathy’s autoresearch and @steipete’s OpenClaw to stabilize our test suite overnight. And his code is open source, so you can (have your agent) do it too. (And our code is open source too so you can see every single fix on GitHub.)
— @shl View on X

A Gumroad eliminou uma dívida técnica de anos em poucas horas usando agentes de inteligência artificial. A plataforma de e-commerce estabilizou uma suíte de 16 mil testes automatizados que há tempo gerava falhas intermitentes — os chamados *flaky tests* — impedindo deploys contínuos e desacelerando o time de engenharia.

O custo real da instabilidade em CI/CD

Testes flaky são aqueles que falham aleatoriamente sem indicar bugs reais no código.

testesflakygumroadeliminoudívidatécnicaanospoucashorasusando

Mais da mesma edição

@Hesamation

💸O app idiota perfeito fez US$ 5 mil em 3 dias

No meio de tanta conversa sobre AGI, apareceu um lembrete quase ofensivo de mercado: um app que usa o acelerômetro do Mac para gemer quando você dá um tapa no notebook teria feito US$ 5 mil em três dias. Sim, parece piada. Sim, talvez seja exatamente por isso que funcionou. --- A moral não é 'faça qualquer bobagem'. É que distribuição e timing continuam mandando mais do que sofisticação. Enquanto muita gente tenta construir a catedral definitiva com 19 integrações e manifesto no Notion, alguém lança uma maluquice entendível em cinco segundos e converte atenção em dinheiro. O software continua cruel com quem complica demais.

@noahzweben

🏠Treinar IA em casa virou plano sério

Teve mais um empurrão forte na tese dos modelos abertos rodando dentro das empresas. Depois de nomes como Pinterest, Airbnb, Notion e Cursor, agora a Intercom apareceu publicamente dizendo que, para várias tarefas, está valendo mais a pena usar e treinar modelos abertos por conta própria do que depender de API paga para tudo. --- Traduzindo para a linguagem do caixa: se o custo cair e a performance ficar boa o bastante, muita empresa vai preferir controlar a própria cozinha. Isso mexe com margem, privacidade, customização e também com o poder de barganha dos grandes provedores de modelo.

@aakashgupta

🧪O rover de Marte humilha muito software moderno

Curiosity está há 13 anos sozinho em Marte, operando com 256 MB de RAM, processador de 200 MHz, atraso de 14 minutos na comunicação e rodas mastigadas por pedra marciana. Mesmo assim continua produzindo ciência. É o tipo de história que faz qualquer dashboard SaaS que cai com pico de login parecer uma piada cara. --- A parte mais bonita aqui não é nostalgia espacial - é engenharia com restrição real. Um equipamento pensado para dois anos virou um laboratório ambulante em sua quinta extensão de missão. Em tempos de software descartável, o rover lembra que robustez ainda é uma forma de inteligência.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter