La IA progresa de forma desigual debido al aprendizaje por refuerzo

El Aprendizaje por Refuerzo impulsa rápidos avances en IA para tareas fácilmente medibles, como la codificación, mientras habilidades más subjetivas, como la redacción, progresan lentamente, creando una divergencia con profundas implicaciones económicas.
TechCrunch
Imagen sin título
Imagen sin título / Leonardo Penuela Bernal / Getty Images AI / TechCrunch

La brecha de refuerzo ralentiza el progreso desigual de la inteligencia artificial

El Aprendizaje por Refuerzo (RL) está impulsando avances rápidos en habilidades de IA fáciles de medir, como la codificación, mientras otras, como la redacción, progresan lentamente. Esta divergencia, conocida como «brecha de refuerzo», se debe a la capacidad de realizar pruebas automatizadas a gran escala.

El motor de la brecha

El Aprendizaje por Refuerzo es actualmente el principal motor de progreso en IA. Esta técnica funciona mejor con métricas claras de aprobado o suspendido, permitiendo repetir pruebas miles de millones de veces. Habilidades como la corrección de errores en código se benefician de esta automatización, ya que existen miles de millones de tests medibles preexistentes para validar el trabajo.

Progreso rápido frente a lento

Las herramientas de codificación con IA, impulsadas por modelos como GPT-5 y Sonnet 2.4, avanzan rápidamente. En cambio, habilidades más subjetivas, como escribir correos electrónicos o generar respuestas en chatbots, muestran una mejora incremental. La falta de sistemas de prueba automatizados para estas tareas explica esta disparidad.

La prueba lo es todo

La capacidad de prueba de un proceso es el factor decisivo. Procesos con kits de prueba definidos, como el desarrollo de software, son ideales para el RL. Para otros, como los informes financieros, una startup podría desarrollar sistemas de medición desde cero para permitir la automatización.

Una sorpresa en video

La generación de video, como el demostrado por OpenAI’s Sora 2, resultó ser más testeable de lo esperado. El modelo muestra avances en coherencia física y de formas, lo que sugiere la existencia de sólidos sistemas de RL trabajando en segundo plano para lograr este realismo.

Implicaciones económicas y laborales

La brecha de refuerzo tiene implicaciones profundas para la economía y el empleo. Los procesos que caen en el lado «fácil de probar» de la brecha tienen un alto potencial de automatización. Esto podría afectar a sectores como los servicios sanitarios, determinando qué trabajos pueden ser realizados por IA en el futuro.

Adobe lanza Adobe AI Foundry para crear modelos de IA generativa personalizados

Adobe lanza AI Foundry, un servicio que permite a las empresas crear modelos de IA
Imagen sin título

Anthropic lanza Claude Code en la web para suscriptores de pago

Anthropic lanza Claude Code en la web para suscriptores Pro y Max. La herramienta, que
Imagen sin título

Anthropic y EE.UU. desarrollan un filtro para impedir que su IA ayude a crear armas nucleares

Anthropic, en colaboración con el Departamento de Energía de EEUU, ha desarrollado un clasificador para
Ilustración sobre inteligencia artificial y seguridad nuclear.

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

El evento TechCrunch Disrupt 2025 inicia el 27 de octubre en San Francisco, reuniendo a
Asistentes a una edición anterior del evento TechCrunch Disrupt.

La FTC elimina publicaciones de la era Lina Khan sobre riesgos de la IA

La FTC retira tres publicaciones de su blog que alertaban sobre los peligros de la
Imagen sin título

Google cierra oficinas en Nueva York por infestación de chinches

Google ha cerrado temporalmente su campus de Chelsea en Nueva York tras detectarse una infestación
Oficina de Google en el bajo Manhattan

TechCrunch Disrupt 2025 inicia su cuenta atrás con oferta de última hora

TechCrunch Disrupt 2025 ofrece un 60% de descuento en una segunda entrada hasta el inicio
Asistentes en una edición anterior de TechCrunch Disrupt

Meta AI duplica usuarios diarios tras el lanzamiento de su feed de vídeos Vibes

Meta AI alcanza 2,7 millones de usuarios diarios tras lanzar Vibes, su feed de vídeos
Gráfico de usuarios diarios de Meta AI proporcionado por Similarweb

Satélites Filtran Comunicaciones Militares y Corporativas a Nivel Global

Investigadores interceptaron comunicaciones de satélites con equipos de bajo coste, recogiendo datos sensibles de infraestructuras
Ilustración de satélites orbitando la Tierra

OpenEvidence recauda 200 millones de dólares con una valoración de 6.000 millones

La startup de IA médica OpenEvidence ha recaudado 200 millones de dólares, alcanzando una valoración
Logotipo de OpenEvidence

Bill Atkinson, pionero de Apple, fue defensor secreto de la «molécula de Dios»

Bill Atkinson, pionero de Apple, defendió el uso de dosis reducidas de 5-MeO-DMT bajo el
Bill Atkinson, pionero de Apple y defensor del 5-MeO-DMT

La FTC elimina publicaciones sobre IA de la era de Lina Khan

La FTC de EE.UU. ha eliminado varias entradas de blog sobre inteligencia artificial publicadas durante
Lina Khan, expresidenta de la FTC, testificando ante el Congreso en 2024.