OpenAI identifica causa de alucinaciones en IA por incentivos erróneos

Un estudio de OpenAI revela que las alucinaciones en modelos de lenguaje se deben a sistemas de evaluación que premian conjeturas en lugar de incertidumbre bien fundamentada.
TechCrunch
Ilustración conceptual de inteligencia artificial y lenguaje Silas Stein / picture alliance / Getty Images / TechCrunch
Ilustración conceptual de inteligencia artificial y lenguaje Silas Stein / picture alliance / Getty Images / TechCrunch

OpenAI identifica incentivos erróneos como causa de las alucinaciones en IA

Un nuevo artículo de investigación atribuye el problema a los sistemas de evaluación actuales. Los modelos de lenguaje como GPT-5 generan a veces afirmaciones falsas pero plausibles. La compañía sugiere cambiar los métodos de puntuación para desincentivar las conjeturas.

El problema de la confianza errónea

OpenAI define las alucinaciones como “afirmaciones plausibles pero falsas generadas por los modelos de lenguaje”. A pesar de las mejoras, reconoce que estas “siguen siendo un desafío fundamental para todos los grandes modelos de lenguaje” y que nunca se eliminarán por completo. Para ilustrarlo, los investigadores preguntaron a un chatbot sobre la disertación de Ph.D. de Adam Tauman Kalai y obtuvieron tres respuestas diferentes, todas incorrectas.

Origen durante el pretraining

El estudio sugiere que las alucinaciones surgen, en parte, de un proceso de pretraining que se centra en predecir la siguiente palabra correcta, sin etiquetas de veracidad. “El modelo solo ve ejemplos positivos de lenguaje fluido y debe aproximar la distribución general”. Hechos arbitrarios de baja frecuencia, como el cumpleaños de una mascota, no se pueden predecir solo con patrones.

Recompensar la incertidumbre, no la suerte

La solución propuesta se centra en cómo se evalúan los modelos. El documento argumenta que las evaluaciones actuales “establecen los incentivos erróneos”. Se comparan con exámenes de opción múltiple donde adivinar puede dar suerte, mientras que dejar la respuesta en blanco garantiza un cero. Así, “cuando los modelos se califican solo por precisión, se les anima a adivinar”.

Un nuevo sistema de puntuación

La propuesta es similar a tests como el SAT, que incluyen “puntuación negativa por respuestas erróneas o crédito parcial por dejar preguntas en blanco para disuadir las conjeturas”. Las evaluaciones deben penalizar más los errores confiados que la incertidumbre y dar crédito parcial por expresar duda apropiadamente. No basta con introducir algunas pruebas nuevas; los sistemas de evaluación ampliamente usados deben actualizarse.

Un desafío inherente a la tecnología

Las alucinaciones son un problema reconocido y persistente en el desarrollo de la Inteligencia Artificial. El proceso de pretraining, aunque eficaz para generar lenguaje fluido, no discrimina intrínsecamente entre lo verdadero y lo falso para hechos específicos y poco comunes. Esto establece una limitación estructural en la tecnología actual.

El camino a seguir: incentivos más inteligentes

La eficacia futura de los modelos de lenguaje dependerá de la implementación de sistemas de evaluación que recompensen la honestidad sobre la precisión a toda costa. Si las puntuaciones principales siguen premiando las conjeturas afortunadas, los modelos seguirán aprendiendo a adivinar, perpetuando el problema de las alucinaciones.

OpenAI identifica causa de alucinaciones en IA por incentivos erróneos

Un estudio de OpenAI revela que las alucinaciones en modelos de lenguaje se deben a
Ilustración conceptual de inteligencia artificial y lenguaje Silas Stein / picture alliance / Getty Images / TechCrunch

Koah recauda 5M para publicidad en aplicaciones de IA

Startup Koah anuncia ronda semilla de 5 millones de dólares para monetizar chats de inteligencia
Logotipo o interfaz de publicidad contextual de Koah en chats de IA Anastasia Usenko / Getty Images / TechCrunch

Supernal de Hyundai paraliza su programa de taxi aéreo

La startup de movilidad aérea urbana de Hyundai detiene el desarrollo de su taxi aéreo
Imagen sin título Información de autor no disponible / TechCrunch

Microsoft Azure sufre latencia por corte de cables en Mar Rojo

Clientes de Azure experimentaron problemas de conectividad debido al corte de múltiples cables submarinos en
Imagen de cables submarinos (ilustrativa) Deb Cohn-Orbach / UCG / Universal Images Group / Getty Images / TechCrunch

Persuasión psicológica logra que IA infrinja sus normas

Estudio revela que técnicas de persuasión humana aumentan hasta el 76,5% el cumplimiento de peticiones
Ilustración que representa técnicas de persuasión aplicadas a IA Gett Images / Ars Technica

IA recreará metraje perdido de The Magnificent Ambersons

Startup Fable utilizará inteligencia artificial para reconstruir 43 minutos eliminados de la película clásica de
Fotografía de archivo de Orson Welles Hulton Archive / Getty Images / TechCrunch

UE multa a Google con 2.950 millones por prácticas anticompetitivas

La Comisión Europea impone su segunda mayor sanción antimonopolio a Google por favorecer sus servicios
Ilustración de logos de Google y símbolos de publicidad digital NurPhoto / Getty Images / TechCrunch

EEUU y Reino Unido implementan verificación de edad online

23 estados de EEUU y Reino Unido exigen verificación de identidad para acceder a ciertos
Imagen sin título Información de autor no disponible / TechCrunch

Tesla propone paquete de pago de $1 billón para Elon Musk

El Consejo de Tesla propone un plan de compensación de $1 billón para Musk, sujeto
Prototipo de Tesla Cybercab en una tienda de San José, California David Paul Morris/Bloomberg / TechCrunch

OpenAI reorganiza equipo de personalidad de ChatGPT

OpenAI integra su equipo de Comportamiento del Modelo en el grupo de Post Entrenamiento para
Imagen representativa de inteligencia artificial Jakub Porzycki/NurPhoto / Getty Images / TechCrunch

Anthropic pagará 1500 millones a escritores por piratear libros

La empresa de IA Anthropic acuerda pagar 1500 millones de dólares a medio millón de
Imagen genérica de inteligencia artificial y derechos de autor Westend61 / Getty Images / TechCrunch

Tesla reduce gasto publicitario en X a mínimos en 2025

Tesla gastó solo 10.000 dólares en publicidad en X durante los dos primeros meses de
Imagen de transporte de Tesla (créditos: David Paul Morris) David Paul Morris / Bloomberg / Getty Images