Sesame y su «viral» Asistente Virtual Maya: La IA que Habla como un Humano

Sesame lanza Maya, un asistente virtual avanzado que utiliza el modelo CSM-1B, capaz de replicar el habla humana de manera natural.
TechCrunch
Sesame AI Maya
Sesame AI Maya

La inteligencia artificial avanza a pasos agigantados, y una de las áreas donde más se siente su impacto es en los asistentes virtuales. La startup Sesame ha decidido dar un paso adelante con Maya, un asistente impulsado por IA que busca hacer que las interacciones con la tecnología sean más humanas que nunca.

Lo que hace especial a Maya el el tono, ritmo y fluidez en la conversación, que han sido diseñados para que suene casi indistinguible de una persona real.

El secreto detrás de este avance es CSM-1B, el modelo de inteligencia artificial que da vida a Maya, que con mil millones de parámetros y una técnica avanzada de procesamiento de audio, representa una apuesta ambiciosa en el mundo de la IA conversacional.

CSM-1B y RVQ: La Tecnología que Permite una Conversación Natural

Para entender cómo funciona Maya, primero hay que conocer la base de su tecnología. CSM-1B es un modelo de IA que procesa y genera voz con una precisión impresionante. Su innovación clave radica en el uso de una técnica llamada «residual vector quantization» (RVQ).

¿Qué es RVQ y por qué es tan importante?

RVQ es una forma avanzada de codificación de audio, que permite a la IA interpretar y generar sonido en pequeños fragmentos discretos. En otras palabras, convierte la voz en datos manejables que luego pueden ser reconstruidos con gran fidelidad.

Este sistema no es completamente nuevo, ya que compañías como Google y Meta también han trabajado en modelos de inteligencia artificial de audio. Sin embargo, el enfoque de Sesame permite un nivel de detalle y naturalidad en el habla que antes no era posible.

Esto significa que Maya no solo suena más natural, sino que también incorpora pausas, disfluencias y matices propios del lenguaje humano, lo que la hace mucho más convincente en una conversación real.

Los Riesgos de una IA con Voz Humana

Si bien el avance tecnológico es impresionante, también plantea riesgos significativos.

Sesame ha dejado claro que CSM-1B no tiene restricciones incorporadas para evitar usos malintencionados. Esto significa que el modelo podría ser utilizado para crear voces falsas o contenido engañoso, algo que ha sido motivo de preocupación en el ámbito de la ciberseguridad y la ética en la IA.

Organizaciones como Consumer Reports han advertido sobre el peligro de las herramientas de clonación de voz, que pueden facilitar fraudes o desinformación. Con tecnologías como la de Sesame, la necesidad de regulaciones y medidas de seguridad se vuelve más urgente que nunca.

Por ello, la empresa ha pedido a los desarrolladores que usen el modelo de manera responsable, evitando cualquier aplicación que imite voces sin consentimiento o que pueda inducir a error a otras personas.

El Futuro de Sesame: Más que un Asistente Virtual

Sesame no solo busca mejorar la forma en que hablamos con la tecnología, sino que ya está pensando en el siguiente paso.

La compañía, cofundada por Brendan Iribe (quien previamente trabajó en Oculus), ha recibido inversiones de grandes firmas como Andreessen Horowitz, Spark Capital y Matrix Partners. Este respaldo financiero les ha permitido explorar nuevas aplicaciones de la inteligencia artificial más allá de los asistentes de voz.

Uno de los proyectos más ambiciosos en los que trabajan actualmente es un par de gafas de inteligencia artificial, diseñadas para usarse durante todo el día e integradas con modelos personalizados de IA.

¿Cómo Cambiará la Industria de los Asistentes Virtuales?

El lanzamiento de Maya y la tecnología detrás de ella abre un mundo de posibilidades para la interacción humano-máquina.

Mayor naturalidad en asistentes virtuales, lo que hará que su uso sea más intuitivo y cómodo.
Nuevas aplicaciones en accesibilidad, ayudando a personas con dificultades de comunicación o limitaciones visuales a interactuar con la tecnología de manera más eficiente.
Mayor personalización, ya que los asistentes podrán adaptarse mejor a los usuarios según su tono de voz y estilo conversacional.

Sin embargo, también plantea desafíos importantes en términos de seguridad, regulación y confianza del usuario. La capacidad de una IA para hablar como un humano plantea preguntas éticas difíciles, especialmente en un mundo donde la desinformación es un problema creciente.

Conclusión

Sesame está marcando un nuevo estándar en asistentes virtuales, llevando la conversación entre humanos y máquinas a un nivel nunca antes visto.

Su tecnología ofrece una experiencia conversacional más natural y fluida, pero también trae consigo retos en seguridad y regulación.

El verdadero impacto de Maya y de CSM-1B dependerá de cómo se utilice esta tecnología en el futuro. Si se maneja de manera ética y responsable, podría representar una de las innovaciones más importantes en la forma en que interactuamos con la inteligencia artificial. De lo contrario, nos enfrentaremos a un mundo donde será cada vez más difícil distinguir entre la voz de un humano y la de una máquina.

Adobe lanza Adobe AI Foundry para crear modelos de IA generativa personalizados

Adobe lanza AI Foundry, un servicio que permite a las empresas crear modelos de IA
Imagen sin título

Anthropic lanza Claude Code en la web para suscriptores de pago

Anthropic lanza Claude Code en la web para suscriptores Pro y Max. La herramienta, que
Imagen sin título

Anthropic y EE.UU. desarrollan un filtro para impedir que su IA ayude a crear armas nucleares

Anthropic, en colaboración con el Departamento de Energía de EEUU, ha desarrollado un clasificador para
Ilustración sobre inteligencia artificial y seguridad nuclear.

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

El evento TechCrunch Disrupt 2025 inicia el 27 de octubre en San Francisco, reuniendo a
Asistentes a una edición anterior del evento TechCrunch Disrupt.

La FTC elimina publicaciones de la era Lina Khan sobre riesgos de la IA

La FTC retira tres publicaciones de su blog que alertaban sobre los peligros de la
Imagen sin título

Google cierra oficinas en Nueva York por infestación de chinches

Google ha cerrado temporalmente su campus de Chelsea en Nueva York tras detectarse una infestación
Oficina de Google en el bajo Manhattan

TechCrunch Disrupt 2025 inicia su cuenta atrás con oferta de última hora

TechCrunch Disrupt 2025 ofrece un 60% de descuento en una segunda entrada hasta el inicio
Asistentes en una edición anterior de TechCrunch Disrupt

Meta AI duplica usuarios diarios tras el lanzamiento de su feed de vídeos Vibes

Meta AI alcanza 2,7 millones de usuarios diarios tras lanzar Vibes, su feed de vídeos
Gráfico de usuarios diarios de Meta AI proporcionado por Similarweb

Satélites Filtran Comunicaciones Militares y Corporativas a Nivel Global

Investigadores interceptaron comunicaciones de satélites con equipos de bajo coste, recogiendo datos sensibles de infraestructuras
Ilustración de satélites orbitando la Tierra

OpenEvidence recauda 200 millones de dólares con una valoración de 6.000 millones

La startup de IA médica OpenEvidence ha recaudado 200 millones de dólares, alcanzando una valoración
Logotipo de OpenEvidence

Bill Atkinson, pionero de Apple, fue defensor secreto de la «molécula de Dios»

Bill Atkinson, pionero de Apple, defendió el uso de dosis reducidas de 5-MeO-DMT bajo el
Bill Atkinson, pionero de Apple y defensor del 5-MeO-DMT

La FTC elimina publicaciones sobre IA de la era de Lina Khan

La FTC de EE.UU. ha eliminado varias entradas de blog sobre inteligencia artificial publicadas durante
Lina Khan, expresidenta de la FTC, testificando ante el Congreso en 2024.