Mistral lanza Voxtral, su primer modelo de IA de audio open source

Mistral presenta Voxtral, un modelo de IA de audio open source que transcribe y entiende audio en varios idiomas, incluyendo español, con tres versiones para diferentes necesidades empresariales.
TechCrunch

Mistral lanza Voxtral, su primer modelo de IA de audio open source

La startup francesa desafía a los sistemas corporativos cerrados con alternativas accesibles. El modelo permite transcribir y entender audio en varios idiomas, incluyendo español. Se ofrece en tres versiones adaptadas a diferentes necesidades empresariales.

«Inteligencia de voz usable y asequible»

Mistral presentó este martes Voxtral, su primer modelo de audio open source para empresas. Combina transcripción (30 minutos) y comprensión (40 minutos) gracias a su base LLM Mistral Small 3.1. Según la compañía, es «menos de la mitad de precio» que soluciones similares de ElevenLabs, OpenAI o Google.

Multilingüe y escalable

Voxtral funciona en 8 idiomas, entre ellos inglés, español y francés. Ofrece tres variantes: Voxtral Small (24B parámetros) para producción, Voxtral Mini (3B) para dispositivos locales y una API económica optimizada para transcripción. Los desarrolladores pueden probarlo gratis en Hugging Face o Le Chat.

Contexto: La apuesta europea por IA abierta

Mistral, una de las principales firmas europeas de IA, defiende modelos open source frente a los sistemas cerrados de grandes tecnológicas. El lanzamiento sigue a Magistral (sus modelos de razonamiento) y coincide con negociaciones para recaudar 1.000 millones de dólares, según TechCrunch.

Una opción para integrar voz en aplicaciones

Voxtral permite desde resumir audios hasta ejecutar acciones mediante comandos de voz. Su API cuesta desde 0,001$ por minuto, lo que podría democratizar el uso de IA de audio en pymes y proyectos con presupuesto limitado.