| Deep Learning | Ética y Sociedad |

La IA progresa de forma desigual debido al aprendizaje por refuerzo

TechCrunch

The Reinforcement Gap — or why some AI skills improve faster than others | TechCrunch
Russell Brandom
TechCrunch
inglés
Estados Unidos
en-us
1759676400000
1759680072720
2025-10-05T16:01:12.720000Z
2025-10-05T15:00:00Z
https://techcrunch.com/2025/10/05/the-reinforcement-gap-or-why-some-ai-skills-improve-faster-than-others

El Aprendizaje por Refuerzo impulsa rápidos avances en IA para tareas fácilmente medibles, como la codificación, mientras habilidades más subjetivas, como la redacción, progresan lentamente, creando una divergencia con profundas implicaciones económicas.

La brecha de refuerzo ralentiza el progreso desigual de la inteligencia artificial

El Aprendizaje por Refuerzo (RL) está impulsando avances rápidos en habilidades de IA fáciles de medir, como la codificación, mientras otras, como la redacción, progresan lentamente. Esta divergencia, conocida como «brecha de refuerzo», se debe a la capacidad de realizar pruebas automatizadas a gran escala.

El motor de la brecha

El Aprendizaje por Refuerzo es actualmente el principal motor de progreso en IA. Esta técnica funciona mejor con métricas claras de aprobado o suspendido, permitiendo repetir pruebas miles de millones de veces. Habilidades como la corrección de errores en código se benefician de esta automatización, ya que existen miles de millones de tests medibles preexistentes para validar el trabajo.

Progreso rápido frente a lento

Las herramientas de codificación con IA, impulsadas por modelos como GPT-5 y Sonnet 2.4, avanzan rápidamente. En cambio, habilidades más subjetivas, como escribir correos electrónicos o generar respuestas en chatbots, muestran una mejora incremental. La falta de sistemas de prueba automatizados para estas tareas explica esta disparidad.

La prueba lo es todo

La capacidad de prueba de un proceso es el factor decisivo. Procesos con kits de prueba definidos, como el desarrollo de software, son ideales para el RL. Para otros, como los informes financieros, una startup podría desarrollar sistemas de medición desde cero para permitir la automatización.

Una sorpresa en video

La generación de video, como el demostrado por OpenAI’s Sora 2, resultó ser más testeable de lo esperado. El modelo muestra avances en coherencia física y de formas, lo que sugiere la existencia de sólidos sistemas de RL trabajando en segundo plano para lograr este realismo.

Implicaciones económicas y laborales

La brecha de refuerzo tiene implicaciones profundas para la economía y el empleo. Los procesos que caen en el lado «fácil de probar» de la brecha tienen un alto potencial de automatización. Esto podría afectar a sectores como los servicios sanitarios, determinando qué trabajos pueden ser realizados por IA en el futuro.

Post Views: 61

| Leonardo Penuela Bernal / Getty Images AI | Publicación del artículo sobre la brecha de refuerzo en IA | Russell Brandom |

| Aplicaciones |

octubre 20, 2025

Adobe lanza Adobe AI Foundry para crear modelos de IA generativa personalizados

Adobe lanza AI Foundry, un servicio que permite a las empresas crear modelos de IA

| Compañías |

octubre 20, 2025

Anthropic lanza Claude Code en la web para suscriptores de pago

Anthropic lanza Claude Code en la web para suscriptores Pro y Max. La herramienta, que

| Compañías |

octubre 20, 2025

Anthropic y EE.UU. desarrollan un filtro para impedir que su IA ayude a crear armas nucleares

Anthropic, en colaboración con el Departamento de Energía de EEUU, ha desarrollado un clasificador para

| Compañías |

octubre 20, 2025

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

El evento TechCrunch Disrupt 2025 inicia el 27 de octubre en San Francisco, reuniendo a

| Ética y Sociedad |

octubre 20, 2025

La FTC elimina publicaciones de la era Lina Khan sobre riesgos de la IA

La FTC retira tres publicaciones de su blog que alertaban sobre los peligros de la

| Compañías |

octubre 20, 2025

Google cierra oficinas en Nueva York por infestación de chinches

Google ha cerrado temporalmente su campus de Chelsea en Nueva York tras detectarse una infestación

| Compañías |

octubre 20, 2025

TechCrunch Disrupt 2025 inicia su cuenta atrás con oferta de última hora

TechCrunch Disrupt 2025 ofrece un 60% de descuento en una segunda entrada hasta el inicio

| Aplicaciones |

octubre 20, 2025

Meta AI duplica usuarios diarios tras el lanzamiento de su feed de vídeos Vibes

Meta AI alcanza 2,7 millones de usuarios diarios tras lanzar Vibes, su feed de vídeos

| Privacidad |

octubre 20, 2025

Satélites Filtran Comunicaciones Militares y Corporativas a Nivel Global

Investigadores interceptaron comunicaciones de satélites con equipos de bajo coste, recogiendo datos sensibles de infraestructuras

| Compañías |

octubre 20, 2025

OpenEvidence recauda 200 millones de dólares con una valoración de 6.000 millones

La startup de IA médica OpenEvidence ha recaudado 200 millones de dólares, alcanzando una valoración

| Ética y Sociedad |

octubre 20, 2025

Bill Atkinson, pionero de Apple, fue defensor secreto de la «molécula de Dios»

Bill Atkinson, pionero de Apple, defendió el uso de dosis reducidas de 5-MeO-DMT bajo el

| Ética y Sociedad |

octubre 20, 2025

La FTC elimina publicaciones sobre IA de la era de Lina Khan

La FTC de EE.UU. ha eliminado varias entradas de blog sobre inteligencia artificial publicadas durante