Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene obras protegidas, para entrenar su modelo de IA SlimLM sin la autorización de los autores, como la demandante Elizabeth Lyon.
TechCrunch
Imagen sin título
Imagen sin título / Jaque Silva/SOPA Images/LightRocket / Getty Images / TechCrunch

Demanda colectiva acusa a Adobe de usar libros pirateados para entrenar su IA

La demanda alega que Adobe usó el conjunto de datos Books3, con obras protegidas, para entrenar su modelo SlimLM. La denuncia, presentada en nombre de la autora Elizabeth Lyon, señala que la empresa utilizó material sin la autorización de los titulares de los derechos.

Los detalles de la acusación contra la tecnológica

La demanda colectiva propuesta afirma que Adobe empleó versiones pirateadas de numerosos libros para el entrenamiento de su programa SlimLM. Este modelo lingüístico está optimizado para tareas de asistencia con documentos en dispositivos móviles. Según la denuncia, el entrenamiento partió del conjunto de datos SlimPajama-627B, publicado por Cerebras.

El origen del conjunto de datos cuestionado

La autora Elizabeth Lyon sostiene que sus obras están incluidas en un subconjunto procesado de Books3. La demanda explica que SlimPajama se creó copiando y manipulando el conjunto de datos RedPajama, que a su vez contiene Books3. Por lo tanto, SlimPajama incluiría las obras con derechos de autor de la demandante y otros miembros de la clase.

Un precedente legal en expansión

El caso se enmarca en una serie de litigios similares contra grandes tecnológicas. Books3 y RedPajama han sido citados en múltiples demandas. En septiembre, una acción legal contra Apple y otra en octubre contra Salesforce presentaron acusaciones equivalentes por el uso de material con derechos de autor para entrenar sus modelos de IA.

La repercusión en la industria tecnológica

Estas demandas se han vuelto frecuentes para el sector. Los algoritmos de IA se entrenan con conjuntos de datos masivos que, en ocasiones, supuestamente incluyen material pirateado. Un acuerdo relevante ocurrió en septiembre, cuando Anthropic aceptó pagar 1.500 millones de dólares a un grupo de autores por un caso similar relacionado con su chatbot Claude.

Antecedentes: El conjunto de datos Books3 en el punto de mira

Books3 es una colección de 191.000 libros que se ha utilizado para entrenar sistemas de IA generativa. Ha sido una fuente constante de problemas legales para la comunidad tecnológica, apareciendo en numerosos litigios por el uso de material protegido sin consentimiento, crédito o compensación.

Cierre: Implicaciones para el entrenamiento de IA

La demanda contra Adobe representa un caso más en las batallas legales sobre el uso de material con derechos de autor para el entrenamiento de modelos de inteligencia artificial. El resultado de estos litigios podría definir los límites legales de la recopilación de datos para el desarrollo de IA.

Peripheral Labs usa sensores de coches autónomos para revolucionar la retransmisión deportiva

La startup Peripheral Labs aplica tecnología de percepción robótica de vehículos autónomos para crear reconstrucciones
Imagen sin título

Amazon añade IA conversacional a timbres Ring para gestionar visitas

Amazon añade IA conversacional a los timbres Ring con Alexa+. La función «Greetings» gestiona entregas
Imagen sin título

Luma AI lanza Ray3 Modify, un modelo para modificar vídeos con IA manteniendo la actuación original

Luma AI lanza Ray3 Modify, un modelo de inteligencia artificial que permite modificar metraje de
Imagen sin título

Lovable triplica su valoración y recauda 330 millones de dólares

La startup sueca Lovable, especializada en IA para programación, ha recaudado 330 millones de dólares
Imagen sin título

Director crea deepfake de Sam Altman tras fracasar en obtener entrevista

El director Adam Bhala Lough creó un deepfake de Sam Altman para su documental tras
Fotograma del documental 'Deepfaking Sam Altman'

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título