Protocolo RSL: licenciar datos IA para evitar demandas por copyright

Reddit, Quora y Yahoo respaldan el protocolo RSL para licenciar datos de entrenamiento de IA mediante robots.txt, creando un marco legal tras el acuerdo de 1.500 millones de Anthropic.
TechCrunch
Concepto de inteligencia artificial y protección de datos fatido / Getty Images / TechCrunch
Concepto de inteligencia artificial y protección de datos fatido / Getty Images / TechCrunch

Lanzan protocolo RSL para licenciar datos de IA y evitar demandas

Reddit, Quora y Yahoo respaldan el sistema Real Simple Licensing (RSL), que permite a editores web establecer términos de licencia para sus contenidos mediante archivos «robots.txt». Surge tras el acuerdo de copyright de 1.500 millones de Anthropic.

Una solución técnica y legal para el contenido web

El protocolo RSL permite a los editores establecer condiciones de licencia para su contenido, ya sea mediante acuerdos personalizados o usando licencias Creative Commons. La información se incluye en el archivo «robots.txt» en un formato preestablecido, lo que facilita la identificación de los términos aplicables a cada dato.

Negociación colectiva de derechos

El RSL Collective actúa como organización de gestión de derechos, similar a ASCAP en música. Negocia términos y recauda regalías, ofreciendo un punto único de contacto tanto para las empresas de IA como para los titulares de derechos. Editores como Yahoo, Medium y The Daily Beast ya se han unido.

Desafíos en la implementación

Determinar cuándo se deben regalías por un dato de entrenamiento concreto es complejo. Es sencillo en productos con atribución estricta, como los Abstracts de Búsqueda IA de Google, pero casi imposible si el entrenamiento no se registra. Los creadores de RSL confían en que las empresas puedan reportarlo.

La industria se enfrenta a un problema de datos

Existen más de 40 demandas pendientes por el uso de datos sin licencia, incluyendo una contra Midjourney por generar imágenes de Superman. Sin un sistema de licencias, las empresas de IA podrían enfrentar una avalancha de pleitos por derechos de autor.

La adopción por parte de los laboratorios de IA, en duda

La gran incógnita es si las empresas de IA adoptarán RSL. Están acostumbradas a obtener datos web de forma gratuita, como el Common Crawl. Sus creadores, sin embargo, se aferran a declaraciones públicas de líderes del sector, como Sundar Pichai, pidiendo un sistema así.

Antecedentes inmediatos

El lanzamiento se produce tras el acuerdo de copyright de 1.500 millones de dólares alcanzado por Anthropic, un hecho que ha obligado a la industria de la IA a reconocer su problema con los datos de entrenamiento.

Implicaciones para el sector

La implementación exitosa del protocolo RSL podría establecer un marco legal y técnico escalable para el licenciamiento de datos, potencialmente reduciendo la litigiosidad futura y creando un nuevo flujo de ingresos para los editores de contenidos web.

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.