Lanzan RSL, nuevo protocolo para licenciar datos de IA
Reddit, Quora y Yahoo respaldan el sistema Real Simple Licensing (RSL), que permite a editores web establecer términos de licencia para el uso de sus contenidos en entrenamiento de inteligencia artificial.
Una respuesta técnica y legal al problema de los datos
El protocolo RSL permite a los editores incluir términos de licencia específicos en sus archivos «robots.txt», haciendo que los acuerdos sean legibles por máquinas. Paralelamente, se ha creado la RSL Collective, una organización de licencias colectivas que negocia términos y recauda regalías, siguiendo el modelo de ASCAP para músicos.
Desafíos en la implementación
Un obstáculo importante es determinar cuándo se deben regalías por un dato de entrenamiento concreto, ya que puede ser casi imposible confirmar si un documento fue ingerido por un modelo de lenguaje grande (LLM). Los creadores de RSL creen que las empresas de IA podrán gestionar esta dificultad, pues algunos acuerdos ya requieren informar sobre ello.
El apoyo de la industria editorial
Varias grandes editoras web se han unido al colectivo, incluyendo a Yahoo, Medium y The Daily Beast. Otras, como Fastly y Quora, apoyan el estándar sin unirse formalmente. Reddit, que ya tiene un acuerdo de licencia con Google, también forma parte de la iniciativa.
Antecedentes inmediatos
El lanzamiento se produce tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic. Existen hasta 40 casos pendientes que buscan indemnizaciones por el uso de datos sin licencia, lo que podría desencadenar una avalancha de demandas contra la industria de la IA.
Implicaciones para el sector
El éxito del sistema RSL depende ahora de que las principales empresas de inteligencia artificial, acostumbradas a obtener datos web de forma gratuita, adopten este protocolo de licencias. Sus creadores se basan en declaraciones públicas de líderes del sector, como Sundar Pichai, que han pedido la creación de un sistema similar.