Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios
RSL permitirá a editores web establecer términos de licencia para su contenido. La iniciativa surge tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor. Grandes editores como Reddit y Yahoo ya respaldan el sistema.
Una solución escalable para un problema creciente
El sistema Real Simple Licensing (RSL) fue creado por tecnólogos y editores web para establecer acuerdos de licencia legibles por máquinas. Su cofundador, Eckart Walther, también creador del estándar RSS, declaró: «Necesitamos tener acuerdos de licencia legibles por máquina para internet». El protocolo permite a los editores establecer términos específicos en sus archivos «robots.txt».
Infraestructura técnica y legal
El RSL Protocol define los términos de licencia que un editor puede establecer para su contenido. Paralelamente, el RSL Collective funciona como organización de licencias colectivas, negociando términos y recaudando regalías, similar a ASCAP para músicos.
Grandes editores se suman a la iniciativa
Importantes editores web ya se han unido al colectivo, incluyendo Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis, Internet Brands, People Inc. y The Daily Beast. Otros como Fastly, Quora y Adweek apoyan el estándar sin unirse al colectivo. Reddit, que ya tiene acuerdos de licencia existentes, recibe unos 60 millones de dólares anuales de Google por sus datos de entrenamiento.
Desafíos técnicos y adopción por parte de las empresas de IA
Determinar cuándo se deben regalías por datos de entrenamiento específicos plantea desafíos únicos para los modelos de IA. Doug Leeds, cofundador de RSL, afirma que aunque no necesita ser perfecto, «solo tiene que ser lo suficientemente bueno para que la gente reciba pagos». La pregunta clave es si las empresas de IA adoptarán un sistema para datos que tradicionalmente obtenían gratuitamente.
Un contexto de litigios y acuerdos millonarios
La industria de IA enfrenta hasta 40 casos pendientes por daños por datos no licenciados, incluido uno contra Midjourney por crear imágenes de Superman. El reciente acuerdo de copyright de Anthropic por 1.500 millones de dólares evidenció la necesidad de sistemas de licencia claros para evitar una avalancha de demandas.
El futuro de los datos de entrenamiento
La eficacia de RSL dependerá de que las principales empresas de IA adopten el sistema, despite los desafíos técnicos en el rastreo de datos utilizados. Los creadores confían en que las declaraciones públicas de líderes de IA respaldando la necesidad de tal sistema se traduzcan en acción concreta.