Lanzan RSL, nuevo protocolo para licenciar datos de IA
Reddit, Quora y Yahoo respaldan ya el sistema Real Simple Licensing (RSL), creado para establecer acuerdos de licencia de datos de entrenamiento para inteligencia artificial de forma masiva. Surge tras el acuerdo por derechos de autor de 1.500 millones de Anthropic.
Una respuesta a la crisis legal
El sector de la IA enfrenta numerosas demandas por usar datos sin licencia. RSL ofrece una infraestructura técnica y legal para que los editores web establezcan términos de uso para su contenido y las empresas de IA negocien licencias.
Funcionamiento técnico y legal
Los sitios web incluyen los términos de licencia en su archivo robots.txt. Legalmente, la RSL Collective actúa como organización para negociar y recaudar regalías, similar a ASCAP en la música.
El desafío de la trazabilidad
Un obstáculo clave es rastrear qué datos específicos se usan en el entrenamiento de un modelo. Los creadores de RSL confían en que las empresas pueden desarrollar sistemas de reporte suficientemente buenos para que funcione.
Antecedentes inmediatos
El protocolo se desarrolla tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic y con hasta 40 casos pendientes que buscan indemnizaciones por datos sin licencia, incluido uno contra Midjourney por imágenes de Superman.
Implicaciones para el sector
La adopción de RSL por parte de los grandes laboratorios de IA es incierta. El sistema pretende convertir la web, tradicionalmente una fuente de datos baratos, en un espacio con licencias pagadas, lo que podría evitar una avalancha de demandas.