Sesame y su «viral» Asistente Virtual Maya: La IA que Habla como un Humano

Sesame lanza Maya, un asistente virtual avanzado que utiliza el modelo CSM-1B, capaz de replicar el habla humana de manera natural.
TechCrunch
Sesame AI Maya
Sesame AI Maya

La inteligencia artificial avanza a pasos agigantados, y una de las áreas donde más se siente su impacto es en los asistentes virtuales. La startup Sesame ha decidido dar un paso adelante con Maya, un asistente impulsado por IA que busca hacer que las interacciones con la tecnología sean más humanas que nunca.

Lo que hace especial a Maya el el tono, ritmo y fluidez en la conversación, que han sido diseñados para que suene casi indistinguible de una persona real.

El secreto detrás de este avance es CSM-1B, el modelo de inteligencia artificial que da vida a Maya, que con mil millones de parámetros y una técnica avanzada de procesamiento de audio, representa una apuesta ambiciosa en el mundo de la IA conversacional.

CSM-1B y RVQ: La Tecnología que Permite una Conversación Natural

Para entender cómo funciona Maya, primero hay que conocer la base de su tecnología. CSM-1B es un modelo de IA que procesa y genera voz con una precisión impresionante. Su innovación clave radica en el uso de una técnica llamada «residual vector quantization» (RVQ).

¿Qué es RVQ y por qué es tan importante?

RVQ es una forma avanzada de codificación de audio, que permite a la IA interpretar y generar sonido en pequeños fragmentos discretos. En otras palabras, convierte la voz en datos manejables que luego pueden ser reconstruidos con gran fidelidad.

Este sistema no es completamente nuevo, ya que compañías como Google y Meta también han trabajado en modelos de inteligencia artificial de audio. Sin embargo, el enfoque de Sesame permite un nivel de detalle y naturalidad en el habla que antes no era posible.

Esto significa que Maya no solo suena más natural, sino que también incorpora pausas, disfluencias y matices propios del lenguaje humano, lo que la hace mucho más convincente en una conversación real.

Los Riesgos de una IA con Voz Humana

Si bien el avance tecnológico es impresionante, también plantea riesgos significativos.

Sesame ha dejado claro que CSM-1B no tiene restricciones incorporadas para evitar usos malintencionados. Esto significa que el modelo podría ser utilizado para crear voces falsas o contenido engañoso, algo que ha sido motivo de preocupación en el ámbito de la ciberseguridad y la ética en la IA.

Organizaciones como Consumer Reports han advertido sobre el peligro de las herramientas de clonación de voz, que pueden facilitar fraudes o desinformación. Con tecnologías como la de Sesame, la necesidad de regulaciones y medidas de seguridad se vuelve más urgente que nunca.

Por ello, la empresa ha pedido a los desarrolladores que usen el modelo de manera responsable, evitando cualquier aplicación que imite voces sin consentimiento o que pueda inducir a error a otras personas.

El Futuro de Sesame: Más que un Asistente Virtual

Sesame no solo busca mejorar la forma en que hablamos con la tecnología, sino que ya está pensando en el siguiente paso.

La compañía, cofundada por Brendan Iribe (quien previamente trabajó en Oculus), ha recibido inversiones de grandes firmas como Andreessen Horowitz, Spark Capital y Matrix Partners. Este respaldo financiero les ha permitido explorar nuevas aplicaciones de la inteligencia artificial más allá de los asistentes de voz.

Uno de los proyectos más ambiciosos en los que trabajan actualmente es un par de gafas de inteligencia artificial, diseñadas para usarse durante todo el día e integradas con modelos personalizados de IA.

¿Cómo Cambiará la Industria de los Asistentes Virtuales?

El lanzamiento de Maya y la tecnología detrás de ella abre un mundo de posibilidades para la interacción humano-máquina.

Mayor naturalidad en asistentes virtuales, lo que hará que su uso sea más intuitivo y cómodo.
Nuevas aplicaciones en accesibilidad, ayudando a personas con dificultades de comunicación o limitaciones visuales a interactuar con la tecnología de manera más eficiente.
Mayor personalización, ya que los asistentes podrán adaptarse mejor a los usuarios según su tono de voz y estilo conversacional.

Sin embargo, también plantea desafíos importantes en términos de seguridad, regulación y confianza del usuario. La capacidad de una IA para hablar como un humano plantea preguntas éticas difíciles, especialmente en un mundo donde la desinformación es un problema creciente.

Conclusión

Sesame está marcando un nuevo estándar en asistentes virtuales, llevando la conversación entre humanos y máquinas a un nivel nunca antes visto.

Su tecnología ofrece una experiencia conversacional más natural y fluida, pero también trae consigo retos en seguridad y regulación.

El verdadero impacto de Maya y de CSM-1B dependerá de cómo se utilice esta tecnología en el futuro. Si se maneja de manera ética y responsable, podría representar una de las innovaciones más importantes en la forma en que interactuamos con la inteligencia artificial. De lo contrario, nos enfrentaremos a un mundo donde será cada vez más difícil distinguir entre la voz de un humano y la de una máquina.

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los principales asistentes de IA ofrecieron respuestas contradictorias sobre la noticia de la invasión estadounidense
Partidarios de Nicolás Maduro y Hugo Chávez tras explosiones en Caracas.

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

Mientras la promesa de productividad laboral con IA se desinfla, el nicho de los chatbots
Imagen sin título

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Ser un ‘college dropout’ se ha convertido en una credencial destacada en el ecosistema emprendedor,
Un fundador joven presenta su startup en un evento de demostración.

Inversores predicen que la IA impactará significativamente en el empleo en 2026

Capitalistas de riesgo anticipan que la IA impactará significativamente en la fuerza laboral en 2026,
Imagen sin título

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

La industria de las citas online combina herramientas de IA con un fuerte impulso hacia
Ilustración sobre el futuro de las citas y la interacción humana.

Jon Callaghan predice el fin del teléfono inteligente en una década

Jon Callaghan, cofundador de True Ventures, afirma que en diez años no usaremos iPhones. La
Anillo Stream de Sandbar.

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Las aplicaciones de dictado por IA en 2025 han mejorado significativamente gracias a modelos de
Imagen sin título

Empresas concentrarán su gasto en IA en 2026, según inversores

El 94% de capitalistas de riesgo prevé un aumento del presupuesto empresarial en IA para
Imagen sin título

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

Meta Platforms ha adquirido la startup singapurense de inteligencia artificial Manus por 2.000 millones de
Logotipo de Meta en una pantalla.

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Tras inversiones récord que superaron el billón de dólares, la industria de la inteligencia artificial
Imagen sin título

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

Plaud ha enviado más de un millón de unidades de su grabador de IA, el
El Plaud Note Pro junto a una tarjeta de crédito para comparar su grosor.

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

OpenAI permite conectar cuentas de servicios como Spotify, Uber o Booking.com directamente en ChatGPT. Los
Ilustración de la interfaz de ChatGPT con logotipos de aplicaciones