Os ingredientes ocultos por trás da criatividade da IA

A versão original desta história apareceu na revista Quanta. Uma vez, foram prometidos carros autônomos e empregadas de robôs. Em vez disso, vimos a ascensão de sistemas de inteligência artificial que podem nos vencer no xadrez, analisar enormes resmas de texto e compor sonetos. This has been one of the great surprises of the modern era: physical tasks that are easy for humans turn out to be very difficult for robots, while algorithms are increasingly able to mimic our intellect.Another surprise that has long perplexed researchers is those algorithms’ knack for their own, strange kind of creativity.Diffusion models, the backbone of image-generating tools such as DALL·E, Imagen, and Stable Diffusion, são projetados para gerar cópias de carbono das imagens nas quais foram treinadas. Na prática, no entanto, eles parecem improvisar, misturando elementos dentro das imagens para criar algo novo – não apenas bolhas de cor, mas imagens coerentes com significado semântico. Este é o “paradoxo” por trás dos modelos de difusão, disse Giulio Biroli, pesquisador e físico da IA ​​da École Normale Supérrieure em Paris: “Se eles funcionassem perfeitamente, deveriam apenas memorizar”, disse ele. “Mas eles não – eles são realmente capazes de produzir novas amostras.” Para gerar imagens, os modelos de difusão usam um processo conhecido como denoising. Eles convertem uma imagem em ruído digital (uma coleção incoerente de pixels) e depois a remonta. É como colocar repetidamente uma pintura através de um triturador até que tudo o que você tenha deixado é uma pilha de poeira fina e remendando as peças novamente. Durante anos, os pesquisadores se perguntam: se os modelos estão apenas remontando, como a novidade entra em cena? É como remontar sua pintura ralada em uma obra de arte completamente nova. Agora, dois físicos fizeram uma afirmação surpreendente: são as imperfeições técnicas no próprio processo de denoising que leva à criatividade dos modelos de difusão. Em um artigo apresentado na Conferência Internacional sobre Aprendizagem de Machines 2025, a dupla desenvolveu um modelo matemático de modelos de difusão treinados para mostrar que sua chamada criatividade é de fato um processo determinístico-uma conseqüência direta e inevitável de sua arquitetura. Por acumular a caixa de modelos de difusão. “A verdadeira força do artigo é que ele faz previsões muito precisas de algo muito não trivial”, disse Luca Ambrogioni, cientista da computação da Universidade de Radboud, na Holanda. Os seres humanos e outros animais são através do que é conhecido como um padrão de Turing, nomeado após o matemático do século XX Alan Turing. Os padrões de Turing explicam como os grupos de células podem se organizar em órgãos e membros distintos. Fundamentalmente, tudo essa coordenação ocorre em nível local. Não há CEO supervisionando os trilhões de células para garantir que todos eles se conformem a um plano final do corpo. As células individuais, em outras palavras, não têm algum plano acabado de um corpo no qual basear seu trabalho. Eles estão apenas agindo e fazendo correções em resposta a sinais de seus vizinhos. Esse sistema de baixo para cima geralmente funciona sem problemas, mas de vez em quando dá errado-produzindo mãos com dedos extras, por exemplo.

Fonte

Você pode ter perdido