Lanzan protocolo RSL para licenciar datos de IA y evitar demandas
Reddit, Quora y Yahoo respaldan el sistema Real Simple Licensing (RSL), que permite a editores web establecer términos de licencia para sus contenidos. Surge tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor.
Una solución técnica y legal para un problema de escala
El protocolo RSL permite a los editores incluir términos de licencia en sus archivos robots.txt en un formato preestablecido. El sistema es legible por máquina, lo que facilita identificar qué datos se pueden usar y bajo qué condiciones.
Negociación colectiva de regalías
El RSL Collective actúa como una organización única para negociar términos y recaudar regalías, similar a ASCAP en música. Editores como Yahoo, Medium, WebMD y The Daily Beast ya se han unido. Otros, como Fastly y Quora, apoyan el estándar.
El desafío de la trazabilidad del dato
Determinar cuándo se usó un dato específico para el entrenamiento de un modelo de IA es complejo. Es más sencillo en productos que mantienen atribución estricta, pero puede ser casi imposible si el entrenamiento no se registra.
Antecedentes: un sector bajo presión legal
La industria de la IA se enfrenta a hasta 40 demandas pendientes por el uso de datos sin licencia, tras el acuerdo multimillonario de Anthropic por derechos de autor. Sin un sistema de licencias, las compañías podrían sufrir una avalancha de litigios.
La adopción por parte de los laboratorios de IA, clave
El éxito del RSL depende de que los grandes laboratorios de IA adopten el sistema y paguen por datos que tradicionalmente han obtenido gratis. Sus creadores confían en que es técnicamente posible y citan declaraciones de líderes del sector pidiendo una solución así.