Adobe enfrenta demanda colectiva por usar libros pirateados en entrenamiento de IA

Una demanda colectiva acusa a Adobe de utilizar el conjunto de datos Books3, que contiene obras protegidas, para entrenar su modelo de IA SlimLM sin la autorización de los autores, como la demandante Elizabeth Lyon.
TechCrunch
Imagen sin título
Imagen sin título / Jaque Silva/SOPA Images/LightRocket / Getty Images / TechCrunch

Demanda colectiva acusa a Adobe de usar libros pirateados para entrenar su IA

La demanda alega que Adobe usó el conjunto de datos Books3, con obras protegidas, para entrenar su modelo SlimLM. La denuncia, presentada en nombre de la autora Elizabeth Lyon, señala que la empresa utilizó material sin la autorización de los titulares de los derechos.

Los detalles de la acusación contra la tecnológica

La demanda colectiva propuesta afirma que Adobe empleó versiones pirateadas de numerosos libros para el entrenamiento de su programa SlimLM. Este modelo lingüístico está optimizado para tareas de asistencia con documentos en dispositivos móviles. Según la denuncia, el entrenamiento partió del conjunto de datos SlimPajama-627B, publicado por Cerebras.

El origen del conjunto de datos cuestionado

La autora Elizabeth Lyon sostiene que sus obras están incluidas en un subconjunto procesado de Books3. La demanda explica que SlimPajama se creó copiando y manipulando el conjunto de datos RedPajama, que a su vez contiene Books3. Por lo tanto, SlimPajama incluiría las obras con derechos de autor de la demandante y otros miembros de la clase.

Un precedente legal en expansión

El caso se enmarca en una serie de litigios similares contra grandes tecnológicas. Books3 y RedPajama han sido citados en múltiples demandas. En septiembre, una acción legal contra Apple y otra en octubre contra Salesforce presentaron acusaciones equivalentes por el uso de material con derechos de autor para entrenar sus modelos de IA.

La repercusión en la industria tecnológica

Estas demandas se han vuelto frecuentes para el sector. Los algoritmos de IA se entrenan con conjuntos de datos masivos que, en ocasiones, supuestamente incluyen material pirateado. Un acuerdo relevante ocurrió en septiembre, cuando Anthropic aceptó pagar 1.500 millones de dólares a un grupo de autores por un caso similar relacionado con su chatbot Claude.

Antecedentes: El conjunto de datos Books3 en el punto de mira

Books3 es una colección de 191.000 libros que se ha utilizado para entrenar sistemas de IA generativa. Ha sido una fuente constante de problemas legales para la comunidad tecnológica, apareciendo en numerosos litigios por el uso de material protegido sin consentimiento, crédito o compensación.

Cierre: Implicaciones para el entrenamiento de IA

La demanda contra Adobe representa un caso más en las batallas legales sobre el uso de material con derechos de autor para el entrenamiento de modelos de inteligencia artificial. El resultado de estos litigios podría definir los límites legales de la recopilación de datos para el desarrollo de IA.

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los principales asistentes de IA ofrecieron respuestas contradictorias sobre la noticia de la invasión estadounidense
Partidarios de Nicolás Maduro y Hugo Chávez tras explosiones en Caracas.

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

Mientras la promesa de productividad laboral con IA se desinfla, el nicho de los chatbots
Imagen sin título

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Ser un ‘college dropout’ se ha convertido en una credencial destacada en el ecosistema emprendedor,
Un fundador joven presenta su startup en un evento de demostración.

Inversores predicen que la IA impactará significativamente en el empleo en 2026

Capitalistas de riesgo anticipan que la IA impactará significativamente en la fuerza laboral en 2026,
Imagen sin título

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

La industria de las citas online combina herramientas de IA con un fuerte impulso hacia
Ilustración sobre el futuro de las citas y la interacción humana.

Jon Callaghan predice el fin del teléfono inteligente en una década

Jon Callaghan, cofundador de True Ventures, afirma que en diez años no usaremos iPhones. La
Anillo Stream de Sandbar.

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Las aplicaciones de dictado por IA en 2025 han mejorado significativamente gracias a modelos de
Imagen sin título

Empresas concentrarán su gasto en IA en 2026, según inversores

El 94% de capitalistas de riesgo prevé un aumento del presupuesto empresarial en IA para
Imagen sin título

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

Meta Platforms ha adquirido la startup singapurense de inteligencia artificial Manus por 2.000 millones de
Logotipo de Meta en una pantalla.

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Tras inversiones récord que superaron el billón de dólares, la industria de la inteligencia artificial
Imagen sin título

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

Plaud ha enviado más de un millón de unidades de su grabador de IA, el
El Plaud Note Pro junto a una tarjeta de crédito para comparar su grosor.

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

OpenAI permite conectar cuentas de servicios como Spotify, Uber o Booking.com directamente en ChatGPT. Los
Ilustración de la interfaz de ChatGPT con logotipos de aplicaciones