Nuevo protocolo RSL para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite a editores web establecer términos de licencia legibles por máquinas para sus contenidos, respondiendo a la creciente demanda por regulación en el uso de datos para entrenamiento de IA.
TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch
Imagen sin título fatido / Getty Images / TechCrunch

Lanzan nuevo protocolo para licenciar datos de IA tras acuerdos millonarios

El sistema RSL permite a editores web establecer términos de licencia para sus contenidos. La iniciativa surge tras el acuerdo de 1.500 millones de dólares de Anthropic por derechos de autor. Grandes editores como Reddit y Yahoo ya se han adherido.

Una solución a un problema creciente

El sector de la IA se enfrenta a más de 40 casos pendientes por el uso de datos sin licencia, incluyendo una demanda a Midjourney por crear imágenes de Superman. Sin un sistema de licencias, las empresas de IA podrían sufrir «una avalancha de demandas por derechos de autor» que frene la industria.

El funcionamiento técnico y legal

El protocolo RSL, co-creado por Eckart Walther (también creador de RSS), establece términos de licencia legibles por máquinas que los editores incluyen en sus archivos «robots.txt». Paralelamente, la RSL Collective actúa como organización de gestión para negociar y cobrar regalías, similar a ASCAP para músicos.

El apoyo editorial y los desafíos

Grandes editores como Yahoo, Reddit, Medium y The Daily Beast ya se han unido. Sin embargo, persisten desafíos técnicos para rastrear qué datos específicos se usan en cada inferencia de un modelo de IA, especialmente si el entrenamiento no se registra. Doug Leeds, cofundador de RSL, afirma que «no tiene que ser perfecto, solo lo suficientemente bueno para pagar a la gente».

Antecedentes: Un mercado en busca de reglas

La industria de la IA ha utilizado tradicionalmente datos web de bajo coste o gratuitos, como los del Common Crawl. Grupos como la Dataset Providers Alliance llevan años abogando por prácticas de recolección más claras. El reciente acuerdo de Reddit con Google, por 60 millones de dólares anuales por sus datos, evidenció el valor de este contenido.

La pelota está en el tejado de las grandes tecnológicas

La eficacia del sistema RSL dependerá de que los principales laboratorios de IA, acostumbrados a obtener datos de forma gratuita, adopten este protocolo de licencias. Sus creadores confían en que lo harán, citando declaraciones previas de líderes como Sundar Pichai reconociendo la necesidad de que «exista un sistema como este».

Box lanza Automate para integrar agentes de IA en empresas

Box presenta Automate, un sistema operativo para agentes de IA que automatiza el procesamiento de
Aaron Levie, CEO de Box, durante una presentación Steve Jennings / Getty Images / TechCrunch

Boring Company suspende túnel de Musk en Las Vegas tras accidente

La empresa de Elon Musk paraliza las obras del túnel hacia el aeropuerto tras un
Imagen sin título Información de autor no disponible / TechCrunch

FTC investiga a siete tecnológicas por chatbots de IA para menores

La Comisión Federal de Comercio examina la seguridad y monetización de chatbots de inteligencia artificial
Imagen sin título Carol Yepes / Getty Images / TechCrunch

TechCrunch Disrupt 2025: Futuro del hardware de IA en San Francisco

El evento reunirá a líderes de startups y capital riesgo para analizar avances en robótica,
Imagen sin título Información de autor no disponible / TechCrunch Events

OpenAI se convertirá en corporación de beneficio público con Microsoft

OpenAI anuncia acuerdo con Microsoft para transformarse en Corporación de Beneficio Público, manteniendo el control
Imagen sin título Justin Sullivan / Getty Images / TechCrunch

CEO de People acusa a Google de robar contenido para IA

Neil Vogel, CEO de People, denuncia que Google utiliza el mismo rastreador para indexar contenido
Imagen sin título Información de autor no disponible / TechCrunch

Micro1 recauda 35 millones en ronda Serie A para datos IA

La startup de gestión de datos para entrenamiento de IA alcanza una valoración de 500
Imagen sin título yucelyilmaz / Getty Images / TechCrunch

Inversión en startups robóticas alcanza 6000 millones en 2025

El capital riesgo en robótica supera los niveles de 2024 con una inversión de 6000
Imagen sin título Yuichiro Chino / Getty Images / TechCrunch

Mercor busca financiación con valoración de 10.000 millones

La startup de IA Mercor negocia ronda de Serie C con valoración de 10.000 millones
Imagen sin título Información de autor no disponible / TechCrunch

Exfundadores de Anchor lanzan Oboe, app educativa con IA

Nir Zicherman y Michael Mignano presentan Oboe, aplicación que genera cursos personalizados mediante IA en
Imagen sin título Información de autor no disponible / TechCrunch

Born recauda 15M para compañeros AI sociales contra la soledad

La startup berlinesa Born ha levantado 15 millones de dólares en Serie A para desarrollar
Imagen sin título Información de autor no disponible / TechCrunch

CEO de ElevenLabs hablará sobre voz IA humana en TechCrunch 2025

Mati Staniszewski explorará la replicación realista del habla natural con IA en TechCrunch Disrupt 2025,
Imagen sin título Información de autor no disponible / TechCrunch