Lanzan protocolo RSL para licenciar datos de IA

Nuevo sistema Real Simple Licensing permite acuerdos legibles por máquina para el uso de datos en entrenamiento de IA, respaldado por grandes editores web.
TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch

Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite acuerdos de licencia legibles por máquina para toda la web. Surge tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic. Grandes editores web como Reddit y Yahoo ya lo respaldan.

Una solución para un problema creciente

Un grupo de tecnólogos y editores web ha lanzado el sistema Real Simple Licensing (RSL) para permitir el licenciamiento de datos a gran escala. El cofundador Eckart Walther, quien también co-creó el estándar RSS, declaró: «Necesitamos tener acuerdos de licencia legibles por máquina para internet». Esto responde a las más de 40 demandas pendientes por daños por datos no licenciados que enfrenta la industria de la IA.

El funcionamiento técnico y legal

El Protocolo RSL establece términos de licencia específicos que un editor puede establecer para su contenido. Los sitios web participantes incluirán los términos como parte de su archivo «robots.txt». Paralelamente, se ha establecido una organización de licencias colectivas, el RSL Collective, que puede negociar términos y recaudar regalías, similar a ASCAP para músicos.

Un respaldo significativo

Una gran cantidad de editores web ya se han unido al colectivo, incluyendo Yahoo, Reddit, Medium y The Daily Beast. Otros, como Fastly y Quora, están apoyando el estándar sin unirse al colectivo. Reddit, que ya tiene acuerdos de licencia, recibe un estimado de 60 millones de dólares al año de Google por el uso de sus datos de entrenamiento.

El desafío de los royalties en la IA

Los modelos de IA plantean desafíos únicos para determinar cuándo se deben regalías por una pieza específica de datos de entrenamiento. Si el entrenamiento no se registra cuando ocurre, puede ser casi imposible confirmar que un documento fue ingerido. Doug Leeds, cofundador de RSL, afirma: «No tiene que ser perfecto. Solo tiene que ser lo suficientemente bueno para que la gente cobre».

Un panorama de disputas por datos

La industria de la IA se enfrenta a una avalancha de demandas por derechos de autor tras el acuerdo de Anthropic. Sin un sistema de licencias, estas disputas legales podrían retrasar permanentemente el desarrollo de la industria, lo que ha creado una necesidad urgente de soluciones estandarizadas.

La pelota está en el tejado de las empresas de IA

La eficacia del sistema RSL depende ahora de que las principales compañías de IA lo adopten. Aunque los laboratorios han pedido públicamente un sistema de este tipo, queda por verse si estarán dispuestos a pagar por datos que tradicionalmente han obtenido de forma gratuita. El éxito de RSL podría definir el futuro del suministro de datos para el entrenamiento de inteligencia artificial.

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.