Nuevo protocolo RSL para licenciar datos de entrenamiento de IA

Grandes editores como Reddit, Yahoo y Quora respaldan el protocolo RSL para establecer acuerdos de licencia legibles por máquina y evitar demandas por uso no autorizado de datos.
TechCrunch
Imagen conceptual de inteligencia artificial fatido / Getty Images / TechCrunch
Imagen conceptual de inteligencia artificial fatido / Getty Images / TechCrunch

Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite acuerdos de licencia legibles por máquina para contenidos web. Busca evitar demandas por uso no autorizado de datos de entrenamiento para IA. Lo respaldan grandes editores como Reddit, Quora y Yahoo.

Una solución para un problema creciente

Tras el acuerdo de copyright de 1.500 millones de dólares de Anthropic, la industria de la IA se enfrenta a su problema con los datos de entrenamiento. Existen hasta 40 casos pendientes que buscan indemnizaciones por datos sin licencia. Sin un sistema de licencias, las empresas de IA podrían enfrentar una avalancha de demandas por derechos de autor.

El funcionamiento técnico y legal

El Protocolo RSL establece términos de licencia específicos que un editor puede establecer para su contenido. Los sitios web participantes incluirán los términos como parte de su archivo «robots.txt». Paralelamente, el equipo RSL ha establecido una organización de licencias colectivas, el RSL Collective, que puede negociar términos y recaudar regalías.

Editores que ya se han unido

Varios editores web ya se han unido al colectivo, incluyendo Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis e Internet Brands. Otros, como Fastly, Quora y Adweek, apoyan el estándar sin unirse al colectivo. El RSL Collective incluye a algunos editores que ya tienen acuerdos de licencia.

El desafío de un nuevo ecosistema

Mientras que es fácil determinar cuándo se ha reproducido una canción, los modelos de IA plantean desafíos únicos a la hora de calcular cuándo se deben regalías por un dato de entrenamiento específico. El problema es más simple para un producto como los Abstractos de Búsqueda de IA de Google, que obtienen datos de la web en tiempo real.

Un camino por recorrer

La industria de la IA tradicionalmente ha visto la web como una fuente de datos baratos y de baja calidad. Puede ser un desafío extraer regalías de algo que los laboratorios están acostumbrados a obtener gratis. El éxito del sistema dependerá de que las principales empresas de IA se sumen a la iniciativa, tras haber pedido abiertamente que exista un protocolo de este tipo.

Hacia un internet con reglas claras para la IA

La eficacia del protocolo RSL dependerá de su adopción por parte de las empresas desarrolladoras de IA en un contexto de creciente presión legal. Su impacto real en la resolución del problema de los datos de entrenamiento se podrá evaluar una vez que se implemente a gran escala.

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.