Nuevo protocolo RSL para licenciar datos de IA tras acuerdos millonarios

Se lanza el sistema Real Simple Licensing para acuerdos legibles por máquina de contenios web, respaldado por grandes editores como Reddit y Yahoo.
TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch

Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite acuerdos de licencia legibles por máquina para contenidos web. Surge tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor. Grandes editores web como Reddit y Yahoo ya lo respaldan.

Una solución para un problema en expansión

Un grupo de tecnólogos y editores web ha lanzado el sistema Real Simple Licensing (RSL) para permitir el licenciamiento de datos a gran escala. Esto se produce en un contexto donde la industria de la IA se enfrenta a hasta 40 casos pendientes por daños por datos no licenciados, lo que podría desencadenar una avalancha de demandas por derechos de autor.

El mecanismo técnico y legal

El Protocolo RSL establece términos de licencia específicos que un editor puede establecer para su contenido. Los sitios web participantes incluirán estos términos en su archivo «robots.txt» en un formato preestablecido. Paralelamente, se ha creado una organización de licencias colectivas, el RSL Collective, que puede negociar términos y recaudar regalías, actuando como un punto único de contacto.

El respaldo de la industria

Una serie de grandes editores web se han unido al colectivo, incluyendo a Yahoo, Reddit, Medium y The Daily Beast. Otros, como Quora y Fastly, apoyan el estándar sin unirse formalmente. Reddit, que ya tiene acuerdos de licencia por unos 60 millones de dólares anuales con Google, forma parte de la iniciativa.

Un terreno minado por desafíos técnicos

Uno de los mayores obstáculos es determinar cuándo se deben pagar regalías por una pieza específica de datos de entrenamiento. Esto es más simple para productos que mantienen una atribución estricta, pero puede ser casi imposible de confirmar si el entrenamiento no se registra cuando ocurre, especialmente si los editores piden ser pagados por inferencia.

El camino por delante

El éxito del sistema RSL depende ahora de que las principales compañías de IA lo adopten. Aunque estas han pagado por datos de alta calidad, la web se ha visto tradicionalmente como una fuente de datos baratos. El equipo de RSL se apoya en declaraciones públicas de líderes de IA que pedían un sistema como este, y planea responsabilizarlos por ello.

Un cierre con la pelota en el tejado de la IA

La eficacia de RSL se medirá por la voluntad de los laboratorios de IA de pagar por datos que antes obtenían gratuitamente. La iniciativa representa el primer intento serio de crear una infraestructura técnica y legal para licenciar datos de entrenamiento a escala de internet, un problema que la industria debe resolver para su futuro crecimiento.

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.