Lanzan nuevo protocolo para licenciar datos de IA tras acuerdo de Anthropic
RSL permite acuerdos de licencia legibles por máquina a escala web. La iniciativa surge tras el acuerdo por derechos de autor de 1.500 millones de dólares. Grandes editores web como Reddit y Yahoo ya respaldan el sistema.
Una solución para un problema en expansión
Tras el acuerdo de 1.500 millones de dólares de Anthropic, la industria de la IA se enfrenta a hasta 40 casos pendientes por daños por datos sin licencia. Sin un sistema de licencias, las empresas podrían afrontar una avalancha de demandas por derechos de autor. Un grupo de tecnólogos y editores web ha lanzado un sistema para permitir el licenciamiento de datos a gran escala.
El mecanismo técnico y legal
El Protocolo RSL establece términos de licencia específicos que un editor puede establecer para su contenido. Los sitios web participantes incluirán los términos como parte de su archivo «robots.txt» en un formato preestablecido. Legalmente, el equipo RSL ha establecido una organización de licencias colectivas, el RSL Collective, que puede negociar términos y recaudar regalías.
El respaldo de la industria
Una gran cantidad de editores web se han unido al colectivo, incluyendo Yahoo, Reddit, Medium y The Daily Beast. Otros, como Fastly y Quora, apoyan el estándar sin unirse al colectivo. El RSL Collective incluye a editores que ya tienen acuerdos de licencia, como Reddit, que recibe unos 60 millones de dólares al año de Google.
Un contexto de litigios y necesidad de claridad
La industria de la IA está lidiando con el problema de los datos de entrenamiento sin licencia, ejemplificado por el reciente y costoso acuerdo de Anthropic y las numerosas demandas pendientes. Durante años, grupos como el Dataset Providers Alliance han presionado por prácticas de recolección más claras, pero RSL es el primer intento de una infraestructura técnica y legal que podría hacerlo funcionar en la práctica.
El futuro del licenciamiento de datos
La eficacia del sistema depende de que las empresas de IA lo adopten, despite el desafío de cambiar la percepción de la web como una fuente de datos baratos. Los creadores de RSL confían en que es posible y planean responsabilizar a los líderes de IA por sus declaraciones públicas pidiendo un sistema de este tipo. Ahora pueden tener uno.