Silicon Valley apuesta por entornos de simulación para entrenar agentes de IA

Los laboratorios de IA demandan simulaciones complejas para entrenar agentes autónomos mediante aprendizaje por refuerzo, con inversiones millonarias y competencia entre startups especializadas.
TechCrunch
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Silicon Valley apuesta por entornos de simulación para entrenar agentes de IA

Los grandes laboratorios de IA demandan entornos de aprendizaje por refuerzo (RL) para desarrollar agentes autónomos más robustos. Startups y empresas de etiquetado de datos compiten por suministrar estos sistemas.

La nueva frontera del entrenamiento de IA

Los entornos RL son simulaciones que replican aplicaciones de software reales para que los agentes de IA practiquen tareas complejas. Se califica su desempeño y se les envía una señal de recompensa al tener éxito. Construirlos es más complejo que un conjunto de datos estático.

Actores clave y movimientos estratégicos

Empresas consolidadas como Surge y Mercor destinan recursos a desarrollar entornos RL. Scale AI, aunque ha perdido terreno, intenta adaptarse. Nuevos participantes como Mechanize Work se centran exclusivamente en este campo, ofreciendo salarios muy altos a ingenieros. Prime Intellect apuesta por hacerlos accesibles para desarrolladores más pequeños.

Inversión y repercusión en la industria

La demanda ha aumentado significativamente. Según The Information, Anthropic ha debatido invertir más de 1000 millones de dólares en entornos RL el próximo año. Surge, que facturó 1200 millones el año pasado, creó una nueva organización interna para ello.

Antecedentes de la técnica

El uso de entornos RL tiene precedentes. OpenAI construyó «RL Gyms» en 2016. Ese mismo año, el sistema AlphaGo de Google DeepMind usó técnicas RL en un entorno simulado para ganar al Go. Lo único ahora es que se aplica a modelos de transformadores para crear agentes de uso general.

¿Escalará la técnica?

La incógnita es si los entornos RL escalarán como otros métodos. Aunque han impulsado avances recientes como los modelos o1 de OpenAI y Claude Opus 4 de Anthropic, existen escepticismos. Expertos advierten de problemas como el «reward hacking», donde la IA hace trampas para la recompensa, y la gran dificultad para escalar estos sistemas de forma efectiva.

D-ID adquiere la startup de vídeo alemana Simpleshow

D-ID completa la adquisición de la startup alemana Simpleshow, fusionando sus plataformas y sumando más
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Figure alcanza una valoración de 39.000 millones en su última ronda

Figure Robotics cierra ronda Serie C de 1.000 millones con participación de Nvidia e Intel,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Gemini lidera App Store tras lanzar modelo de edición Nano Banana

La aplicación Gemini de Google alcanza el primer puesto en App Store tras lanzar su
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Google lanza protocolo AP2 para compras automatizadas con respaldo de 60 empresas

Google presenta el protocolo AP2 para transacciones automatizadas con respaldo de 60 empresas financieras y
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

OpenAI restringirá ChatGPT para menores tras demanda por muerte

OpenAI implementa nuevas restricciones para usuarios menores de 18 años tras demanda por muerte injusta,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Salesforce crea unidad de negocio de inteligencia artificial para seguridad nacional

Salesforce anuncia Missionforce, nueva unidad de inteligencia artificial especializada en defensa y seguridad nacional, dirigida
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Silicon Valley apuesta por entornos de simulación para entrenar agentes de IA

Los laboratorios de IA demandan simulaciones complejas para entrenar agentes autónomos mediante aprendizaje por refuerzo,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

NHTSA investiga fallos en manillas de Tesla Model Y

La NHTSA investiga nueve denuncias de manillas bloqueadas en Tesla Model Y que impiden abrir
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

MicroFactory crea fábrica robótica de sobremesa con 30 millones de dólares de valoración

Startup MicroFactory crea sistema automatizado compacto con dos brazos robóticos para fabricación de precisión, valorada
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Tekedra Mawakana de Waymo analizará en Disrupt el estado real del vehículo autónomo

La co-CEO de Waymo analizará en TechCrunch Disrupt el despliegue real de la conducción autónoma,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Rulebase recauda 2,1 millones para automatizar tareas financieras

Startup fundada por ingenieros nigerianos desarrolla agente de IA para automatizar tareas de cumplimiento normativo
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

YouTube lanza nuevas herramientas de IA generativa para creadores de Shorts

YouTube presenta nuevas herramientas de IA generativa para Shorts, incluyendo Veo 3 Fast, animación de
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible