Sesame y su «viral» Asistente Virtual Maya: La IA que Habla como un Humano

Sesame lanza Maya, un asistente virtual avanzado que utiliza el modelo CSM-1B, capaz de replicar el habla humana de manera natural.
TechCrunch
Sesame AI Maya
Sesame AI Maya

La inteligencia artificial avanza a pasos agigantados, y una de las áreas donde más se siente su impacto es en los asistentes virtuales. La startup Sesame ha decidido dar un paso adelante con Maya, un asistente impulsado por IA que busca hacer que las interacciones con la tecnología sean más humanas que nunca.

Lo que hace especial a Maya el el tono, ritmo y fluidez en la conversación, que han sido diseñados para que suene casi indistinguible de una persona real.

El secreto detrás de este avance es CSM-1B, el modelo de inteligencia artificial que da vida a Maya, que con mil millones de parámetros y una técnica avanzada de procesamiento de audio, representa una apuesta ambiciosa en el mundo de la IA conversacional.

CSM-1B y RVQ: La Tecnología que Permite una Conversación Natural

Para entender cómo funciona Maya, primero hay que conocer la base de su tecnología. CSM-1B es un modelo de IA que procesa y genera voz con una precisión impresionante. Su innovación clave radica en el uso de una técnica llamada «residual vector quantization» (RVQ).

¿Qué es RVQ y por qué es tan importante?

RVQ es una forma avanzada de codificación de audio, que permite a la IA interpretar y generar sonido en pequeños fragmentos discretos. En otras palabras, convierte la voz en datos manejables que luego pueden ser reconstruidos con gran fidelidad.

Este sistema no es completamente nuevo, ya que compañías como Google y Meta también han trabajado en modelos de inteligencia artificial de audio. Sin embargo, el enfoque de Sesame permite un nivel de detalle y naturalidad en el habla que antes no era posible.

Esto significa que Maya no solo suena más natural, sino que también incorpora pausas, disfluencias y matices propios del lenguaje humano, lo que la hace mucho más convincente en una conversación real.

Los Riesgos de una IA con Voz Humana

Si bien el avance tecnológico es impresionante, también plantea riesgos significativos.

Sesame ha dejado claro que CSM-1B no tiene restricciones incorporadas para evitar usos malintencionados. Esto significa que el modelo podría ser utilizado para crear voces falsas o contenido engañoso, algo que ha sido motivo de preocupación en el ámbito de la ciberseguridad y la ética en la IA.

Organizaciones como Consumer Reports han advertido sobre el peligro de las herramientas de clonación de voz, que pueden facilitar fraudes o desinformación. Con tecnologías como la de Sesame, la necesidad de regulaciones y medidas de seguridad se vuelve más urgente que nunca.

Por ello, la empresa ha pedido a los desarrolladores que usen el modelo de manera responsable, evitando cualquier aplicación que imite voces sin consentimiento o que pueda inducir a error a otras personas.

El Futuro de Sesame: Más que un Asistente Virtual

Sesame no solo busca mejorar la forma en que hablamos con la tecnología, sino que ya está pensando en el siguiente paso.

La compañía, cofundada por Brendan Iribe (quien previamente trabajó en Oculus), ha recibido inversiones de grandes firmas como Andreessen Horowitz, Spark Capital y Matrix Partners. Este respaldo financiero les ha permitido explorar nuevas aplicaciones de la inteligencia artificial más allá de los asistentes de voz.

Uno de los proyectos más ambiciosos en los que trabajan actualmente es un par de gafas de inteligencia artificial, diseñadas para usarse durante todo el día e integradas con modelos personalizados de IA.

¿Cómo Cambiará la Industria de los Asistentes Virtuales?

El lanzamiento de Maya y la tecnología detrás de ella abre un mundo de posibilidades para la interacción humano-máquina.

Mayor naturalidad en asistentes virtuales, lo que hará que su uso sea más intuitivo y cómodo.
Nuevas aplicaciones en accesibilidad, ayudando a personas con dificultades de comunicación o limitaciones visuales a interactuar con la tecnología de manera más eficiente.
Mayor personalización, ya que los asistentes podrán adaptarse mejor a los usuarios según su tono de voz y estilo conversacional.

Sin embargo, también plantea desafíos importantes en términos de seguridad, regulación y confianza del usuario. La capacidad de una IA para hablar como un humano plantea preguntas éticas difíciles, especialmente en un mundo donde la desinformación es un problema creciente.

Conclusión

Sesame está marcando un nuevo estándar en asistentes virtuales, llevando la conversación entre humanos y máquinas a un nivel nunca antes visto.

Su tecnología ofrece una experiencia conversacional más natural y fluida, pero también trae consigo retos en seguridad y regulación.

El verdadero impacto de Maya y de CSM-1B dependerá de cómo se utilice esta tecnología en el futuro. Si se maneja de manera ética y responsable, podría representar una de las innovaciones más importantes en la forma en que interactuamos con la inteligencia artificial. De lo contrario, nos enfrentaremos a un mundo donde será cada vez más difícil distinguir entre la voz de un humano y la de una máquina.

OpenAI e Instacart lanzan la compra de comestibles dentro de ChatGPT

OpenAI e Instacart han lanzado una función que permite a los usuarios planificar comidas, crear
Imagen sin título

Hinge lanza «Convo Starters», una función de IA para iniciar conversaciones en citas

Hinge lanza ‘Convo Starters’, una función de IA que genera sugerencias personalizadas para romper el
Interfaz de la función Convo Starters de Hinge mostrando sugerencias de conversación.

OpenAI anuncia fuerte crecimiento en uso empresarial de sus herramientas de IA

OpenAI anuncia que el volumen de mensajes en ChatGPT Enterprise se ha multiplicado por ocho
Imagen sin título

OpenAI desactiva sugerencias similares a anuncios en ChatGPT tras críticas

OpenAI ha desactivado las sugerencias de aplicaciones en ChatGPT Plus tras quejas de suscriptores, que
Imagen sin título

Pat Gelsinger apuesta por xLight con un acuerdo de 150 millones del Gobierno de EE.UU.

La startup de semiconductores xLight, presidida por Pat Gelsinger, ha logrado un acuerdo preliminar de
Imagen sin título

Yoodli triplica su valoración superando los 300 millones de dólares

La startup Yoodli alcanza una valoración de más de 300 millones de dólares tras una
Varun Puri y Esha Joshi, cofundadores de Yoodli.

Aaru, startup de investigación con IA, logra valoración de 1000 millones en ronda Serie A

La startup de investigación con IA Aaru ha levantado una ronda Serie A liderada por
Imagen sin título

El polémico videojuego ‘Horses’ es prohibido en varias plataformas tras su lanzamiento

El videojuego ‘Horses’, del estudio Santa Ragione, fue retirado de Steam y Epic Games Store
Fotograma del videojuego 'Horses'.

Meta adquiere la startup de hardware de IA Limitless

Meta ha adquirido la startup de IA Limitless, que dejará de vender su colgante para
Imagen sin título

SpaceX negocia venta secundaria de acciones con valoración de 800.000 millones

SpaceX negociaría una venta secundaria de acciones que la valoraría en 800.000 millones de dólares,
Imagen sin título

Netflix adquiere Warner Bros. Discovery por 83.000 millones de dólares

Netflix anunció la compra de Warner Bros. por 83.000 millones de dólares, incluyendo el catálogo
Logotipos de Netflix y Warner Bros.

ChatGPT ralentiza su crecimiento mientras Gemini acelera su adopcion

El crecimiento de usuarios activos de ChatGPT se desacelera al 6%, mientras que Gemini aumenta
Grafico comparativo de usuarios activos mensuales de ChatGPT y Gemini.