CEO de ElevenLabs prevé que los modelos de audio con IA se convertirán en commoditie
Los modelos de IA de audio se convertirán en un producto básico en un par de años, según declaró Mati Staniszewski, consejero delegado y cofundador de ElevenLabs, durante su intervención en la conferencia TechCrunch Disrupt 2025.
Visión a Corto y Largo Plazo
Staniszewski explicó que, a corto plazo, el desarrollo de modelos propios sigue siendo la «mayor ventaja y el mayor cambio» para la empresa. Señaló que resolver los problemas de calidad del audio actualmente solo es posible construyendo los modelos internamente.
El Futuro Multimodal
El directivo anticipó que los modelos evolucionarán hacia enfoques multimodales en el próximo año o dos. «Crearás audio y vídeo al mismo tiempo, o audio y LLM en un entorno conversacional», afirmó, citando a Google Veo 3 como ejemplo de esta fusión.
Estrategia de la Empresa
Para crear valor a largo plazo, ElevenLabs combinará el desarrollo de modelos con aplicaciones prácticas. La compañía planea establecer alianzas y utilizar tecnologías de código abierto para integrar su experiencia en audio con la de otros modelos especializados.
Un Cambio Inevitable en el Sector
El CEO de ElevenLabs, Mati Staniszewski, declaró en TechCrunch Disrupt 2025 que, aunque actualmente existen diferencias entre modelos de voces e idiomas, estas se reducirán, llevando a la commoditización de la tecnología de audio con IA en los próximos años.
Implicaciones para la Industria
Esta previsión de commoditización sugiere un futuro donde el acceso a la tecnología de audio por IA será más generalizado, impulsando la innovación en aplicaciones multimodales y obligando a las empresas a buscar ventajas competitivas más allá del modelo base.