Noticia sin título

Los laboratorios de IA impulsan entornos de aprendizaje por refuerzo para desarrollar agentes autónomos más robustos, atrayendo grandes inversiones y nuevas startups especializadas.
TechCrunch
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Silicon Valley apuesta por entornos de simulación para entrenar agentes de IA

Los grandes laboratorios de IA demandan entornos de aprendizaje por refuerzo (RL) para desarrollar agentes más robustos. Esta técnica, clave para el progreso de los asistentes autónomos, está impulsando una nueva generación de startups especializadas.

La nueva frontera del entrenamiento de IA

Los entornos de RL son espacios de entrenamiento simulados donde los agentes de IA practican tareas multitarea, como comprar en Amazon. Se califica su rendimiento y reciben una señal de recompensa al tener éxito. Su construcción es más compleja que un conjunto de datos estático.

Actores clave y estrategias

Empresas de etiquetado de datos como Surge y Mercor se reconvierten para crear estos entornos. Mechanize Work, una nueva startup, se centra en entornos robustos para agentes de codificación y ofrece salarios muy altos a sus ingenieros. Prime Intellect apuesta por hacerlos accesibles para desarrolladores más pequeños.

Inversión y escepticismo

El sector atrae grandes inversiones. Anthropic habría considerado destinar más de 1000 millones de dólares a esta tecnología en un año. Sin embargo, existe escepticismo sobre su escalabilidad y su propensión al «reward hacking», donde los modelos hacen trampa para obtener una recompensa.

Antecedentes de la técnica

El uso de entornos de RL tiene precedentes. OpenAI creó sus «RL Gyms» en 2016 y Google DeepMind usó técnicas similares para AlphaGo. Lo único ahora es que se aplican a modelos de transformadores para crear agentes con capacidades generales.

Implicaciones para el sector

El desarrollo de entornos de RL representa un cambio estratégico en la industria de la IA. Su éxito o fracaso determinará la velocidad a la que se puedan crear agentes autónomos realmente capaces de interactuar con software de forma fiable, un objetivo clave para los grandes laboratorios.

Noticia sin título

D-ID completa la adquisición de la startup alemana Simpleshow, fusionando sus plataformas y sumando más
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Figure Robotics cierra ronda Serie C de 1.000 millones con participación de Nvidia e Intel,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

La aplicación Gemini de Google alcanza el primer puesto en App Store tras lanzar su
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Google presenta el protocolo AP2 para transacciones automatizadas con respaldo de 60 empresas financieras y
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

OpenAI implementa nuevas restricciones para usuarios menores de 18 años tras demanda por muerte injusta,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Salesforce anuncia Missionforce, nueva unidad de inteligencia artificial especializada en defensa y seguridad nacional, dirigida
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Los laboratorios de IA demandan simulaciones complejas para entrenar agentes autónomos mediante aprendizaje por refuerzo,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

La NHTSA investiga nueve denuncias de manillas bloqueadas en Tesla Model Y que impiden abrir
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Startup MicroFactory crea sistema automatizado compacto con dos brazos robóticos para fabricación de precisión, valorada
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

La co-CEO de Waymo analizará en TechCrunch Disrupt el despliegue real de la conducción autónoma,
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

Startup fundada por ingenieros nigerianos desarrolla agente de IA para automatizar tareas de cumplimiento normativo
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible

Noticia sin título

YouTube presenta nuevas herramientas de IA generativa para Shorts, incluyendo Veo 3 Fast, animación de
Imagen sin título / Información de autor no disponible / Información de la fuente de la imagen no disponible