La creatividad de la IA surge de su arquitectura, según estudio
La creatividad en los modelos de difusión es un subproducto determinista de su arquitectura. Un estudio revela que las imperfecciones técnicas en el proceso de eliminación de ruido generan la capacidad de crear imágenes novedosas.
Mecanismos de la creatividad artificial
Los modelos de difusión, base de herramientas como DALL·E e Imagen, están diseñados para copiar sus datos de entrenamiento. Sin embargo, improvisan y combinan elementos para crear imágenes coherentes. La investigación de Mason Kamb y Surya Ganguli demuestra que esta aparente creatividad surge de dos características técnicas: localidad y equivariancia traslacional.
El experimento clave
Kamb y Ganguli crearon la máquina ELS, un sistema de ecuaciones que predice la composición de imágenes basándose únicamente en esos dos principios. Los resultados mostraron un 90% de precisión al replicar los resultados de modelos de difusión entrenados, confirmando que la creatividad emerge automáticamente de estas restricciones arquitectónicas.
Antecedentes: El enigma de la originalidad
Los investigadores llevaban años preguntándose cómo estos modelos, que simplemente reensamblan imágenes desde el ruido, podían generar contenido nuevo y con significado, en lugar de simples copias memorizadas.
Implicaciones y límites del hallazgo
El estudio ilumina la caja negra de los modelos de difusión y sugiere que la creatividad humana y artificial podrían compartir bases similares de ensamblaje a partir de experiencias previas. Sin embargo, expertos advierten que este mecanismo no explica la creatividad en otros sistemas de IA, como los modelos de lenguaje.