Lanzan RSL, nuevo protocolo para licenciar datos de entrenamiento de IA
Anthropic pagó 1.500 millones por derechos de autor. La industria de la IA busca solucionar el problema de los datos de entrenamiento sin licencia, con 40 casos pendientes.
Un sistema para licencias masivas
El sistema Real Simple Licensing (RSL) permite a editores web establecer términos de licencia para su contenido. Incluye un componente técnico, mediante archivos «robots.txt», y uno legal, a través de una organización colectiva que negocia y recauda regalías.
Respaldo editorial y desafíos técnicos
Grandes editores como Reddit, Yahoo y Quora respaldan la iniciativa. Sin embargo, existe el desafío técnico de rastrear qué datos específicos se usan en el entrenamiento de un modelo de IA, especialmente si no se registra.
La incógnita: la adopción por parte de las tecnológicas
La pregunta clave es si las grandes compañías de IA adoptarán RSL, acostumbradas a obtener datos web de forma gratuita. Sus creadores, como el exCEO de IAC Publishing Doug Leeds, argumentan que los líderes del sector han pedido un sistema así.
Antecedentes
El lanzamiento se produce tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor y con numerosas demandas pendientes, como una contra Midjourney por imágenes de Superman.
Implicaciones
El protocolo RSL pretende establecer un marco legal y técnico escalable para el licenciamiento de datos, buscando evitar una avalancha de demandas por derechos de autor que podría frenar el desarrollo de la industria de la IA.