OpenAI prueba sus modelos gpt-oss en sistemas militares de EE. UU.
El Pentágono evalúa los modelos de inteligencia artificial de código abierto de OpenAI para operaciones seguras. La empresa Lilt ya los prueba para análisis de inteligencia extranjera en servidores gubernamentales aislados de internet.
Pruebas en Entornos Críticos
La compañía Lilt integra los modelos gpt-oss-120b y gpt-oss-20b en sistemas del gobierno. Estos modelos funcionan sin conexión a internet, un requisito para manejar información clasificada. Hasta ahora, los resultados muestran que las herramientas de OpenAI están por detrás de las de la competencia en algunos aspectos.
Capacidades y Limitaciones Iniciales
Los modelos de OpenAI solo procesan texto, mientras que las necesidades militares incluyen imágenes y audio. También presentan un rendimiento inferior en algunos idiomas y con potencia de computación limitada. A pesar de esto, los contratistas valoran tener más opciones.
Cambio de Normativa y Nuevos Acuerdos
OpenAI revocó el año pasado su prohibición sobre uso militar. El Pentágono cerró acuerdos por 200 millones de dólares con OpenAI, xAI, Anthropic y Google. El objetivo es automatizar herramientas de combate y funciones administrativas.
Ventajas de los Modelos Abiertos
Los modelos de código abierto ofrecen control, personalización y privacidad que los modelos cerrados no permiten. Son valiosos para drones o satélites donde la conectividad es un problema. La plataforma Ask Sage da acceso al Pentágono a unos 125 modelos de código abierto.
Debate sobre la Eficacia
Algunos expertos, como Nicolas Chaillan, advierten de que los modelos abiertos pueden alucinar más y su coste de infraestructura puede ser alto. Otros, como Pete Warden, defienden la independencia de los grandes proveedores tecnológicos.
Próximas Fases de Prueba
El Ejército y la Fuerza Aérea de EE. UU. comenzarán a probar este mes un modelo modificado de gpt-oss. La empresa EdgeRunner AI lo ha adaptado con documentos militares. Hasta ahora, ningún proyecto con estos modelos ha superado la fase de demostración.