News16 JunhoIA resolve 7 de 10 problemas difíceis de matemática e a Nature reclama
Edição #125·16 de junho de 2026·2 min

🧮IA resolve 7 de 10 problemas difíceis de matemática e a Nature reclama

A revista Nature, uma das mais respeitadas do mundo, publicou um estudo testando IAs com problemas matemáticos inéditos e complexos. A manchete dizia que a IA "não esteve à altura da tarefa". O detalhe: ela acertou 7 de 10. Ethan Mollick, professor da Wharton e um dos pesquisadores mais acompanhados na área, apontou a contradição com um tom claro de incredulidade. Quinze meses atrás, modelos de linguagem mal conseguiam fazer contas básicas. --- O estudo em si é valioso porque mapeia onde a IA tropeça em raciocínio matemático: os erros não são aleatórios, seguem padrões que revelam limitações reais no modo como esses modelos "pensam". Mas a manchete pessimista esconde uma evolução impressionante. --- A lição aqui vale para qualquer um acompanhando IA: preste mais atenção na velocidade da melhoria do que no placar de um único teste. Acertar 70% de problemas que seriam dignos de olimpíada de matemática, em questão de meses, é um salto que merece mais respeito do que a manchete sugere.

IA resolve 7 de 10 problemas difíceis de matemática e a Nature reclama

IA acerta 70% em problemas matemáticos inéditos e a Nature critica o desempenho

Em testes com problemas matemáticos inéditos e de alta complexidade, modelos de linguagem acertaram 7 de 10 questões. A revista Nature, porém, publicou a manchete de que a IA "não esteve à altura da tarefa". A contradição foi destacada por Ethan Mollick, professor da Wharton e pesquisador referência em IA: resolver 70% de problemas dignos de olimpíada matemática representa um salto expressivo, especialmente considerando que, há 15 meses, esses mesmos modelos mal conseguiam fazer operações básicas.

O que o estudo revela

O estudo da Nature tem mérito real: mapeou onde a IA falha em raciocínio matemático. Os erros não são aleatórios — seguem padrões que expõem limitações estruturais no modo como modelos de linguagem processam raciocínio lógico-matemático. Essa análise é valiosa para pesquisadores que buscam entender as fronteiras da tecnologia.

Porém, a manchete pessimista obscurece uma evolução que, em termos absolutos, é impressionante. O progresso de "não saber fazer conta" para resolver problemas avançados em menos de dois anos representa uma taxa de melhoria que não tem paralelo na história da computação.

O que isso significa para builders e devs brasileiros

Para quem desenvolve produtos com IA no Brasil, o caso oferece lições práticas:

  • **Velocidade de melhoria supera qualquer placar estático** — testar modelos em um momento específico captura uma foto desatualizada. A cada mês, capacidades que pareciam limitadas se tornam triviais.
  • **Limitações são mapeáveis e evitáveis** — os padrões de erro identificados no estudo permitem criar fallbacks e validações específicas em aplicações que dependem de raciocínio matemático.
  • **Comunicação técnica importa** — a forma como resultados são comunicados molda a percepção pública. Para quem constrói produtos, comunicar capacidades com precisão é tão importante quanto a tecnologia em si.

O contexto que a manchete omitiu

O avanço de modelos de linguagem em matemática não é linear nem uniforme. Ainda há tasks em que a IA falha de forma previsível — especialmente quando requer múltiplas etapas de raciocínio encadeado ou verificação explícita. Mas a direção é clara: problemas que exigiam inteligência humana avançada estão gradualmente migrando para o domínio da IA.

A lição para quem acompanha o setor: o placar de um único teste importa menos que a trajetória. Em quinze meses, a IA passou de incapaz de operar aritmética básica para resolver 70% de problemas originais de alta dificuldade. O ritmo de evolução sugere que as próximas iterations vão reduzir — ou eliminar — essa lacuna.

problemasmodelosnãoraciocínionaturelinguagemmancheteresolverestudosão

Mais da mesma edição

@eoghan

💰Salesforce compra Fin AI por US$ 3,6 bilhões

A Salesforce, gigante americana de software empresarial, anunciou a compra da Fin AI por cerca de US$ 3,6 bilhões. Se o nome Fin AI não soa familiar, talvez Intercom soe: é a mesma empresa, que mudou de nome semanas atrás para refletir sua nova identidade focada em inteligência artificial. A Intercom nasceu há 15 anos como ferramenta de chat para atendimento ao cliente e, quase quatro anos atrás, apostou pesado em modelos de linguagem para criar agentes automáticos de suporte. --- Eoghan McCabe, cofundador e CEO, chamou Marc Benioff, fundador da Salesforce, de "chefe final dos CEOs fundadores de tech". McCabe e o cofundador Des Traynor continuam no comando após o fechamento do negócio, previsto para o quarto trimestre fiscal de 2027 da Salesforce. É um sinal claro de que o mercado de agentes de IA para atendimento ao cliente virou coisa séria: séria o bastante para justificar um cheque de bilhões. --- Para quem usa Intercom no dia a dia, a promessa é de que pouca coisa muda na prática, só que agora com o caixa e a rede de distribuição da Salesforce por trás. O time de produto promete lançamentos já nas próximas semanas.

@Hesamation

⚖️Anthropic é processada por limites vagos no plano de US$ 200

A Anthropic, criadora do Claude, está sendo processada nos EUA por supostamente não entregar o que prometeu nos planos mais caros. O caso gira em torno dos planos Max, que custam até US$ 200 por mês. Segundo o processo, o plano Max 5x (que deveria dar cinco vezes mais uso que o Pro) na prática entrega cerca de 3,5 vezes. O Max 20x, que deveria ser vinte vezes maior, entregaria só seis vezes o plano básico. --- O ponto central da queixa é que a Anthropic nunca explicou com clareza como calcula esses limites de uso. O cliente paga caro esperando uma experiência proporcional ao preço e, segundo o processo, recebe bem menos do que o anunciado. É o tipo de briga que pode virar referência para todo o setor: à medida que planos de IA ficam mais caros, a transparência sobre o que exatamente você está comprando vira uma obrigação, não um luxo. --- A Anthropic ainda não se pronunciou publicamente sobre o caso. Mas o recado do mercado é nítido: cobrar caro sem deixar o consumidor saber exatamente pelo que está pagando tem consequências.

@chetaslua

🎬ByteDance joga o preço de vídeo por IA lá embaixo

A ByteDance, dona do TikTok, lançou o Seedance 2.0 Mini, um modelo de geração de vídeo por IA com um preço que chama atenção: cerca de US$ 0,022 por segundo de vídeo em resolução 720p. Na prática, um clipe de 12 segundos sai por menos de US$ 0,30, ou pouco mais de R$ 1,50. --- Para contextualizar, gerar vídeo com IA ainda era algo relativamente caro e restrito há poucos meses. Esse tipo de precificação agressiva muda o jogo especialmente para pequenos criadores de conteúdo e empresas que precisam de vídeos curtos para anúncios ou redes sociais. A qualidade ainda precisa ser avaliada no dia a dia, mas o preço já fala por si. --- A estratégia é conhecida: a China tem apostado em tornar suas ferramentas de IA absurdamente baratas para ganhar adoção em massa. Resta ver se a qualidade acompanha o preço de pechincha.

Receba no seu email

Todo dia, grátis pra sempre.

Assinar newsletter