Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios
El sistema RSL permite acuerdos de licencia legibles por máquina para contenidos web. Busca evitar demandas por uso no autorizado de datos de entrenamiento para IA. Lo respaldan grandes editores como Reddit, Quora y Yahoo.
Una solución para un problema creciente
Tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic, la industria de la IA se enfrenta a su problema con los datos de entrenamiento. Existen hasta 40 casos pendientes que buscan indemnizaciones por datos sin licencia. Sin un sistema de licencias, las empresas de IA podrían enfrentar una avalancha de demandas por derechos de autor.
El funcionamiento técnico y legal
El Protocolo RSL establece términos de licencia específicos que un editor puede establecer para su contenido. Los sitios web participantes incluirán los términos como parte de su archivo «robots.txt». Paralelamente, el equipo RSL ha establecido una organización de licencias colectivas, el RSL Collective, que puede negociar términos y recaudar regalías.
Editores que ya se han unido
Varios editores web ya se han unido al colectivo, incluyendo Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis e Internet Brands. Otros, como Fastly, Quora y Adweek, apoyan el estándar sin unirse al colectivo. El RSL Collective incluye a algunos editores que ya tienen acuerdos de licencia.
El desafío de un nuevo ecosistema
Mientras que es fácil determinar cuándo se ha reproducido una canción, los modelos de IA plantean desafíos únicos a la hora de calcular cuándo se deben regalías por un dato de entrenamiento específico. El problema es más simple para un producto como los Abstractos de Búsqueda de IA de Google, que obtienen datos de la web en tiempo real.
Un camino por recorrer
La industria de la IA tradicionalmente ha visto la web como una fuente de datos baratos y de baja calidad. Puede ser un desafío extraer regalías de algo que los laboratorios están acostumbrados a obtener gratis. El éxito del sistema dependerá de que las principales empresas de IA se sumen a la iniciativa, tras haber pedido abiertamente que exista un protocolo de este tipo.
Hacia un internet con reglas claras para la IA
La eficacia del protocolo RSL dependerá de su adopción por parte de las empresas desarrolladoras de IA en un contexto de creciente presión legal. Su impacto real en la resolución del problema de los datos de entrenamiento se podrá evaluar una vez que se implemente a gran escala.