Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios
El sistema RSL permite acuerdos de licencia legibles por máquinas. Busca solucionar el problema de los datos de entrenamiento sin licencia. Grandes editores web como Reddit y Yahoo ya lo respaldan.
Una solución para un problema creciente
Tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic, la industria de la IA se enfrenta a su problema con los datos de entrenamiento. Existen hasta 40 casos pendientes que buscan indemnizaciones por datos sin licencia. Sin un sistema de licencias, las empresas de IA podrían enfrentar una avalancha de demandas por derechos de autor.
El funcionamiento técnico y legal
Llamado Real Simple Licensing (RSL), el sistema fue creado por tecnólogos y editores web. Su cofundador, Eckart Walther, también cocreador del estándar RSS, declaró: «Necesitamos tener acuerdos de licencia legibles por máquinas para internet». El protocolo RSL establece términos de licencia específicos que los editores pueden configurar para su contenido a través de su archivo «robots.txt».
Un colectivo para negociar
En el aspecto legal, el equipo RSL ha establecido una organización de licencias colectivas, el RSL Collective. Esta puede negociar términos y recaudar regalías, de forma similar a ASCAP para músicos. Grandes editores web como Yahoo, Reddit, Medium y The Daily Beast ya se han unido al colectivo.
Antecedentes: Un terreno legal minado
La industria de la IA ha operado tradicionalmente utilizando datos web de bajo coste y sin licencia, como los del Common Crawl. Grupos como el Dataset Providers Alliance ya habían estado presionando para obtener prácticas de recopilación más claras. El reciente acuerdo de Anthropic y las numerosas demandas pendientes evidencian la creciente presión legal sobre este modelo.
El reto de la implementación
La eficacia de RSL depende ahora de que las principales empresas de IA adopten el sistema. Aunque los laboratorios han dicho que «algo así necesita existir», el desafío será hacer que paguen por datos a los que estaban acostumbrados a acceder gratuitamente. El éxito de RSL reside en lograr que esta voluntad declarada se traduzca en acuerdos concretos.