Lanzan RSL, nuevo protocolo para licenciar datos de entrenamiento de IA
Reddit, Quora y Yahoo respaldan ya el sistema RSL, que permite a editores web establecer términos de licencia para su contenido a través de archivos «robots.txt». Surge tras el acuerdo de copyright de 1.500 millones de Anthropic.
Una respuesta técnica y legal a la crisis de copyright
El protocolo Real Simple Licensing (RSL) ofrece un sistema escalable para acuerdos de licencia legibles por máquina. Su objetivo es evitar una avalancha de demandas por derechos de autor, con hasta 40 casos pendientes contra empresas de IA por datos sin licencia.
Así funciona el sistema RSL
Incluye una infraestructura técnica y otra legal. La técnica permite a los editores establecer términos en su «robots.txt». La legal se articula a través de la RSL Collective, una organización que negocia regalías, similar a ASCAP para músicos.
Grandes editores se suman a la iniciativa
Se han unido al colectivo Yahoo, Reddit, Medium y The Daily Beast, entre otros. Algunos, como Fastly o Quora, apoyan el estándar sin unirse. Reddit ya tiene un acuerdo con Google por 60 millones anuales por sus datos.
El desafío de la trazabilidad y la adopción
Un reto clave es rastrear qué datos específicos se usan en el entrenamiento de un modelo, crucial si se paga por inferencia. El éxito final depende de que los grandes laboratorios de IA adopten voluntariamente el sistema y paguen por datos que antes obtenían gratis.
Antecedentes inmediatos
El sistema RSL surge tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic y ante la existencia de numerosas demandas pendientes por el uso de datos sin licencia para entrenar modelos de inteligencia artificial.
Implicaciones del nuevo modelo
La iniciativa busca establecer un marco sostenible para la compensación por el uso de datos, transformando la web de una fuente de información gratuita a un recurso con derechos licenciados para el desarrollo de IA.