Nuevo protocolo RSL para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite a editores web establecer términos de licencia legibles por máquinas para sus contenidos, respondiendo a la creciente demanda por regulación en el uso de datos para entrenamiento de IA.
TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch

Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite a editores web establecer términos de licencia para sus contenidos. La iniciativa surge tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor. Grandes editores como Reddit y Yahoo ya se han adherido.

Una solución a un problema creciente

El sector de la IA se enfrenta a más de 40 casos pendientes por el uso de datos sin licencia, incluyendo una demanda a Midjourney por crear imágenes de Superman. Sin un sistema de licencias, las empresas de IA podrían sufrir «una avalancha de demandas por derechos de autor» que frene la industria.

El funcionamiento técnico y legal

El protocolo RSL, co-creado por Eckart Walther (también creador de RSS), establece términos de licencia legibles por máquinas que los editores incluyen en sus archivos «robots.txt». Paralelamente, la RSL Collective actúa como organización de gestión para negociar y cobrar regalías, similar a ASCAP para músicos.

El apoyo editorial y los desafíos

Grandes editores como Yahoo, Reddit, Medium y The Daily Beast ya se han unido. Sin embargo, persisten desafíos técnicos para rastrear qué datos específicos se usan en cada inferencia de un modelo de IA, especialmente si el entrenamiento no se registra. Doug Leeds, cofundador de RSL, afirma que «no tiene que ser perfecto, solo lo suficientemente bueno para pagar a la gente».

Antecedentes: Un mercado en busca de reglas

La industria de la IA ha utilizado tradicionalmente datos web de bajo coste o gratuitos, como los del Common Crawl. Grupos como la Dataset Providers Alliance llevan años abogando por prácticas de recolección más claras. El reciente acuerdo de Reddit con Google, por 60 millones de dólares anuales por sus datos, evidenció el valor de este contenido.

La pelota está en el tejado de las grandes tecnológicas

La eficacia del sistema RSL dependerá de que los principales laboratorios de IA, acostumbrados a obtener datos de forma gratuita, adopten este protocolo de licencias. Sus creadores confían en que lo harán, citando declaraciones previas de líderes como Sundar Pichai reconociendo la necesidad de que «exista un sistema como este».

Exfundadores de Anchor lanzan Oboe, app de aprendizaje con IA

Nir Zicherman y Michael Mignano presentan Oboe, aplicación que genera cursos personalizados en segundos mediante
Imagen sin título Información de autor no disponible / TechCrunch

Startup Born recauda 15M para combatir soledad con IA

La startup alemana Born ha levantado 15 millones de dólares para desarrollar compañeros de IA
Imagen sin título Información de autor no disponible / TechCrunch

CEO de ElevenLabs hablará sobre voz IA en TechCrunch Disrupt 2025

Mati Staniszewski, CEO de ElevenLabs, explorará los desafíos técnicos y éticos de la replicación del
Imagen sin título Información de autor no disponible / TechCrunch

Nuevo protocolo RSL para licenciar datos de IA tras acuerdos millonarios

Lanzan sistema Real Simple Licensing para establecer acuerdos legibles por máquina entre editores web y
Imagen generada por IA sobre licencias de datos fatido / Getty Images / TechCrunch

California aprueba ley para regular chatbots de IA con fines de compañía

Nueva legislación exige protocolos de seguridad para proteger menores y usuarios vulnerables en chatbots de
Imagen sin título Información de autor no disponible / TechCrunch

Apple retrasa traducción en vivo de AirPods en la UE por DMA

Apple pospone la función de traducción en tiempo real de AirPods en la UE debido
Apple (screenshot) Información de autor no disponible / TechCrunch

Box lanza sistema de agentes de IA para automatizar flujos de trabajo

Box presenta Box Automate, un sistema operativo para agentes de IA que permite automatizar procesos
Aaron Levie, CEO de Box, durante una presentación anterior Steve Jennings / Getty Images / TechCrunch

FTC investiga a tecnológicas por chatbots de IA para menores

La Comisión Federal de Comercio investiga a siete empresas tecnológicas por la seguridad y monetización
Imagen sin título Carol Yepes / Getty Images / TechCrunch

TechCrunch Disrupt 2025: IA y robótica en San Francisco

El evento reunirá a más de 10.000 líderes de startups y capital riesgo para debatir
Imagen sin título Información de autor no disponible / TechCrunch

OpenAI se convertirá en corporación de beneficio público con Microsoft

OpenAI anuncia acuerdo con Microsoft para transformarse en Corporación de Beneficio Público, manteniendo el control
Imagen sin título Justin Sullivan / Getty Images / TechCrunch

CEO de People acusa a Google de robar contenido para IA

Neil Vogel denuncia que Google usa el mismo crawler para búsquedas y entrenar sus modelos
Imagen sin título Información de autor no disponible / TechCrunch

TechCrunch cierra hoy solicitudes para eventos en Disrupt 2025

El plazo para presentar propuestas de eventos laterales en TechCrunch Disrupt 2025 finaliza hoy a
Imagen sin título Slava Blazer Photography / TechCrunch