Protocolo RSL: licenciar datos IA para evitar demandas por copyright

Reddit, Quora y Yahoo respaldan el protocolo RSL para licenciar datos de entrenamiento de IA mediante robots.txt, creando un marco legal tras el acuerdo de 1.500 millones de Anthropic.
TechCrunch
Concepto de inteligencia artificial y protección de datos fatido / Getty Images / TechCrunch
Concepto de inteligencia artificial y protección de datos fatido / Getty Images / TechCrunch

Lanzan protocolo RSL para licenciar datos de IA y evitar demandas

Reddit, Quora y Yahoo respaldan el sistema Real Simple Licensing (RSL), que permite a editores web establecer términos de licencia para sus contenidos mediante archivos «robots.txt». Surge tras el acuerdo de copyright de 1.500 millones de Anthropic.

Una solución técnica y legal para el contenido web

El protocolo RSL permite a los editores establecer condiciones de licencia para su contenido, ya sea mediante acuerdos personalizados o usando licencias Creative Commons. La información se incluye en el archivo «robots.txt» en un formato preestablecido, lo que facilita la identificación de los términos aplicables a cada dato.

Negociación colectiva de derechos

El RSL Collective actúa como organización de gestión de derechos, similar a ASCAP en música. Negocia términos y recauda regalías, ofreciendo un punto único de contacto tanto para las empresas de IA como para los titulares de derechos. Editores como Yahoo, Medium y The Daily Beast ya se han unido.

Desafíos en la implementación

Determinar cuándo se deben regalías por un dato de entrenamiento concreto es complejo. Es sencillo en productos con atribución estricta, como los Abstracts de Búsqueda IA de Google, pero casi imposible si el entrenamiento no se registra. Los creadores de RSL confían en que las empresas puedan reportarlo.

La industria se enfrenta a un problema de datos

Existen más de 40 demandas pendientes por el uso de datos sin licencia, incluyendo una contra Midjourney por generar imágenes de Superman. Sin un sistema de licencias, las empresas de IA podrían enfrentar una avalancha de pleitos por derechos de autor.

La adopción por parte de los laboratorios de IA, en duda

La gran incógnita es si las empresas de IA adoptarán RSL. Están acostumbradas a obtener datos web de forma gratuita, como el Common Crawl. Sus creadores, sin embargo, se aferran a declaraciones públicas de líderes del sector, como Sundar Pichai, pidiendo un sistema así.

Antecedentes inmediatos

El lanzamiento se produce tras el acuerdo de copyright de 1.500 millones de dólares alcanzado por Anthropic, un hecho que ha obligado a la industria de la IA a reconocer su problema con los datos de entrenamiento.

Implicaciones para el sector

La implementación exitosa del protocolo RSL podría establecer un marco legal y técnico escalable para el licenciamiento de datos, potencialmente reduciendo la litigiosidad futura y creando un nuevo flujo de ingresos para los editores de contenidos web.

Ley SB 53 California: transparencia empresas IA grandes aprobada Senado

El Senado de California aprobó la ley SB 53 que exige transparencia en seguridad a
Senador Scott Wiener, autor del proyecto de ley SB 53 sobre seguridad de IA Jerod Harris/Getty Images for Vox Media / TechCrunch

xAI despide 500 empleados en reorientación estratégica de anotación de datos

La startup de Elon Musk, xAI, ha despedido a 500 trabajadores de su equipo de
Imagen genérica de representación de inteligencia artificial Klaudia Radecka/NurPhoto / Getty Images / TechCrunch

Karen Hao analiza poder de OpenAI como imperio de inteligencia artificial

Análisis de Karen Hao sobre cómo OpenAI ha consolidado un poder superior al de muchos
Karen Hao, periodista y autora de 'Empire of AI' Karen Hao AI / TechCrunch

Bret Taylor advierte sobre burbuja económica en inteligencia artificial

El presidente de OpenAI alerta sobre especulación en el sector de IA, comparándola con la
Bret Taylor, presidente de OpenAI y CEO de Sierra Thibault Camus / AP Photo / TechCrunch

Penske Media demanda a Google por resúmenes IA que reducen tráfico web

Penske Media Corporation demanda a Google por utilizar sus contenidos en resúmenes de IA que
Imagen representativa de inteligencia artificial y medios digitales Klaudia Radecka/NurPhoto / Getty Images / TechCrunch

Modelos de IA como commodity: startups ganan ventaja frente a gigantes

Las startups de IA priorizan el ajuste fino y diseño de interfaz, tratando los modelos
Ilustración conceptual sobre modelos de IA y desarrollo de software Eshma / Getty Images / TechCrunch

Chatbots espirituales: IA como guía religiosa con 30 millones de descargas

Las aplicaciones religiosas con inteligencia artificial como Bible Chat y Hallow ganan popularidad como guía
Persona interactuando con chatbot en dispositivo móvil Malorny / Getty Images / TechCrunch

Desarrolladores senior dedican 40% tiempo corregir código IA

Estudio revela que programadores senior destinan hasta 40% de su tiempo a verificar y reparar
Ilustración conceptual de programación con inteligencia artificial Malte Mueller / Getty Images / TechCrunch

Oboe app: cursos personalizados con IA creados por fundadores de Anchor

Los creadores de Anchor lanzan Oboe, una aplicación que genera cursos personalizados con inteligencia artificial
Interfaz de la aplicación Oboe mostrando diferentes formatos de cursos educativos Oboe / TechCrunch

Born recauda 15 millones para desarrollar compañeros sociales de IA

La startup berlinesa Born ha levantado 15 millones de dólares en una ronda Serie A
Imagen sin título Información de autor no disponible / TechCrunch

Voz IA en TechCrunch Disrupt 2025: Mati Staniszewski analiza réplica vocal

El CEO de ElevenLabs participará en TechCrunch Disrupt 2025 para analizar los avances y desafíos
Mati Staniszewski en evento TechCrunch Jeff Spicer/Getty Images for SXSW London Startups / TechCrunch Events

RSL: nuevo protocolo para licenciar datos de entrenamiento de IA

Reddit, Quora y Yahoo respaldan el sistema Real Simple Licensing (RSL) que permite a editores
Imagen conceptual de inteligencia artificial y licencias de datos fatido / Getty Images / TechCrunch