| Compañías | Investigación |

Noticia sin título

TechCrunch

Silicon Valley bets big on 'environments' to train AI agents | TechCrunch
Maxwell Zeff
TechCrunch
inglés
Estados Unidos
en-us
1758053558
1758053558
2025-09-16T20:12:38Z
2025-09-16T19:00:48Z
2025-09-16T19:45:10Z
https://techcrunch.com/2025/09/16/silicon-valley-bets-big-on-environments-to-train-ai-agents

Los laboratorios de IA impulsan entornos de aprendizaje por refuerzo para desarrollar agentes autónomos más robustos, atrayendo grandes inversiones y nuevas startups especializadas.

Silicon Valley apuesta por entornos de simulación para entrenar agentes de IA

Los grandes laboratorios de IA demandan entornos de aprendizaje por refuerzo (RL) para desarrollar agentes más robustos. Esta técnica, clave para el progreso de los asistentes autónomos, está impulsando una nueva generación de startups especializadas.

La nueva frontera del entrenamiento de IA

Los entornos de RL son espacios de entrenamiento simulados donde los agentes de IA practican tareas multitarea, como comprar en Amazon. Se califica su rendimiento y reciben una señal de recompensa al tener éxito. Su construcción es más compleja que un conjunto de datos estático.

Actores clave y estrategias

Empresas de etiquetado de datos como Surge y Mercor se reconvierten para crear estos entornos. Mechanize Work, una nueva startup, se centra en entornos robustos para agentes de codificación y ofrece salarios muy altos a sus ingenieros. Prime Intellect apuesta por hacerlos accesibles para desarrolladores más pequeños.

Inversión y escepticismo

El sector atrae grandes inversiones. Anthropic habría considerado destinar más de 1000 millones de dólares a esta tecnología en un año. Sin embargo, existe escepticismo sobre su escalabilidad y su propensión al «reward hacking», donde los modelos hacen trampa para obtener una recompensa.

Antecedentes de la técnica

El uso de entornos de RL tiene precedentes. OpenAI creó sus «RL Gyms» en 2016 y Google DeepMind usó técnicas similares para AlphaGo. Lo único ahora es que se aplican a modelos de transformadores para crear agentes con capacidades generales.

Implicaciones para el sector

El desarrollo de entornos de RL representa un cambio estratégico en la industria de la IA. Su éxito o fracaso determinará la velocidad a la que se puedan crear agentes autónomos realmente capaces de interactuar con software de forma fiable, un objetivo clave para los grandes laboratorios.

Post Views: 2

| Compañías |

septiembre 16, 2025

Noticia sin título

D-ID completa la adquisición de la startup alemana Simpleshow, fusionando sus plataformas y sumando más

| Compañías |

septiembre 16, 2025

Noticia sin título

Figure Robotics cierra ronda Serie C de 1.000 millones con participación de Nvidia e Intel,

| Aplicaciones |

septiembre 16, 2025

Noticia sin título

La aplicación Gemini de Google alcanza el primer puesto en App Store tras lanzar su

| Compañías |

septiembre 16, 2025

Noticia sin título

Google presenta el protocolo AP2 para transacciones automatizadas con respaldo de 60 empresas financieras y

| Compañías |

septiembre 16, 2025

Noticia sin título

OpenAI implementa nuevas restricciones para usuarios menores de 18 años tras demanda por muerte injusta,

| Compañías |

septiembre 16, 2025

Noticia sin título

Salesforce anuncia Missionforce, nueva unidad de inteligencia artificial especializada en defensa y seguridad nacional, dirigida

| Compañías |

septiembre 16, 2025

Noticia sin título

Los laboratorios de IA demandan simulaciones complejas para entrenar agentes autónomos mediante aprendizaje por refuerzo,

| Compañías |

septiembre 16, 2025

Noticia sin título

La NHTSA investiga nueve denuncias de manillas bloqueadas en Tesla Model Y que impiden abrir

| Compañías |

septiembre 16, 2025

Noticia sin título

Startup MicroFactory crea sistema automatizado compacto con dos brazos robóticos para fabricación de precisión, valorada

| Compañías |

septiembre 16, 2025

Noticia sin título

La co-CEO de Waymo analizará en TechCrunch Disrupt el despliegue real de la conducción autónoma,

| Compañías |

septiembre 16, 2025

Noticia sin título

Startup fundada por ingenieros nigerianos desarrolla agente de IA para automatizar tareas de cumplimiento normativo

| Compañías |

septiembre 16, 2025

Noticia sin título

YouTube presenta nuevas herramientas de IA generativa para Shorts, incluyendo Veo 3 Fast, animación de