Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene obras protegidas, para entrenar su modelo de IA SlimLM sin la autorización de los autores, como la demandante Elizabeth Lyon.
TechCrunch
Imagen sin título
Imagen sin título / Jaque Silva/SOPA Images/LightRocket / Getty Images / TechCrunch

Demanda colectiva acusa a Adobe de usar libros pirateados para entrenar su IA

La demanda alega que Adobe usó el conjunto de datos Books3, con obras protegidas, para entrenar su modelo SlimLM. La denuncia, presentada en nombre de la autora Elizabeth Lyon, señala que la empresa utilizó material sin la autorización de los titulares de los derechos.

Los detalles de la acusación contra la tecnológica

La demanda colectiva propuesta afirma que Adobe empleó versiones pirateadas de numerosos libros para el entrenamiento de su programa SlimLM. Este modelo lingüístico está optimizado para tareas de asistencia con documentos en dispositivos móviles. Según la denuncia, el entrenamiento partió del conjunto de datos SlimPajama-627B, publicado por Cerebras.

El origen del conjunto de datos cuestionado

La autora Elizabeth Lyon sostiene que sus obras están incluidas en un subconjunto procesado de Books3. La demanda explica que SlimPajama se creó copiando y manipulando el conjunto de datos RedPajama, que a su vez contiene Books3. Por lo tanto, SlimPajama incluiría las obras con derechos de autor de la demandante y otros miembros de la clase.

Un precedente legal en expansión

El caso se enmarca en una serie de litigios similares contra grandes tecnológicas. Books3 y RedPajama han sido citados en múltiples demandas. En septiembre, una acción legal contra Apple y otra en octubre contra Salesforce presentaron acusaciones equivalentes por el uso de material con derechos de autor para entrenar sus modelos de IA.

La repercusión en la industria tecnológica

Estas demandas se han vuelto frecuentes para el sector. Los algoritmos de IA se entrenan con conjuntos de datos masivos que, en ocasiones, supuestamente incluyen material pirateado. Un acuerdo relevante ocurrió en septiembre, cuando Anthropic aceptó pagar 1.500 millones de dólares a un grupo de autores por un caso similar relacionado con su chatbot Claude.

Antecedentes: El conjunto de datos Books3 en el punto de mira

Books3 es una colección de 191.000 libros que se ha utilizado para entrenar sistemas de IA generativa. Ha sido una fuente constante de problemas legales para la comunidad tecnológica, apareciendo en numerosos litigios por el uso de material protegido sin consentimiento, crédito o compensación.

Cierre: Implicaciones para el entrenamiento de IA

La demanda contra Adobe representa un caso más en las batallas legales sobre el uso de material con derechos de autor para el entrenamiento de modelos de inteligencia artificial. El resultado de estos litigios podría definir los límites legales de la recopilación de datos para el desarrollo de IA.

Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene
Imagen sin título

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.