La IA Ahora Puede Ver, Escuchar y Comprender el Mundo en Tiempo Real

Las nuevas herramientas de inteligencia artificial con capacidades en tiempo real de visión y voz están transformando la manera en que interactuamos con la tecnología. Estas innovaciones permiten una interacción más natural, eficiente y accesible, impulsando la productividad y la innovación en sectores clave como educación, medicina, logística y seguridad.
Lorem Ipsum
Ai-Convolution-Gemini-2.0
Ai-Convolution-Gemini-2.0

Las recientes actualizaciones en los sistemas de inteligencia artificial de Google y OpenAI han introducido capacidades en tiempo real:

Google Gemini 2.0 Flash

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal capaz de procesar y generar texto, imágenes y audio en tiempo real. Su Multimodal Live API permite a los desarrolladores crear aplicaciones con interacciones naturales y comprensión de video en tiempo real. Esta tecnología facilita la creación de agentes autónomos que pueden realizar tareas complejas con mínima intervención humana, como realizar pedidos en línea o programar videollamadas.

OpenAI incorpora video al Modo de Voz Avanzado de ChatGPT

OpenAI ha mejorado ChatGPT con el Modo de Voz Avanzado, permitiendo conversaciones en tiempo real más naturales. Esta función, inicialmente disponible para suscriptores de pago, se ha expandido a usuarios gratuitos, ofreciendo una experiencia de conversación más fluida y humana. Además, se han introducido capacidades de video y uso compartido de pantalla, ampliando las posibilidades de interacción.

¿Por qué es importante?

Estas nuevas herramientas de inteligencia artificial, con capacidades en tiempo real de visión y voz, son importantes porque permiten una interacción más natural y eficiente, facilitando la retroalimentación instantánea y mejorando la productividad en tareas complejas. Su capacidad para combinar visión y voz amplía la accesibilidad, mejora el entendimiento del contexto visual y abre nuevas aplicaciones en sectores como educación, medicina, logística y seguridad. Además, impulsan la innovación al ofrecer soluciones que democratizan el uso de la tecnología y transforman la manera en que colaboramos con sistemas inteligentes.

Sunday Robotics presenta a Memo, un robot doméstico autónomo

Sunday Robotics lanzará en 2026 el robot doméstico Memo, capaz de preparar café y cargar
El robot Memo de Sunday Robotics en una cocina

Prime Video introduce resúmenes de temporada generados por IA

Amazon introduce recapitulaciones de vídeo generadas por IA en Prime Video. En fase beta para
Interfaz de Prime Video mostrando la función de resúmenes

Poly relanza su servicio como almacenamiento en la nube con búsqueda por IA

La startup Poly reinventa su servicio como plataforma de almacenamiento en la nube con búsqueda
Interfaz de la aplicación Poly

Adobe adquiere Semrush por 1900 millones de dólares

Adobe ha adquirido la plataforma de marketing Semrush por 1.900 millones de dólares, pagando casi
Logotipos de Adobe y Semrush

Kaaj recauda 3,8 millones para automatizar el riesgo crediticio

La startup Kaaj ha recaudado 3,8 millones de dólares en una ronda semilla. Su plataforma
Imagen sin título

Onepot AI recauda 13 millones para acelerar el descubrimiento de fármacos

La start-up Onepot AI ha recaudado 13 millones de dólares. Su tecnología, que combina el
Imagen sin título

Larry Summers renuncia a la junta de OpenAI tras revelarse sus emails con Epstein

Larry Summers renuncia a la junta de OpenAI tras la publicación de correos con Jeffrey
Larry Summers, exsecretario del Tesoro de Estados Unidos

Guardio recibe 80 millones de dólares para seguridad en código generado por IA

La startup de ciberseguridad Guardio ha obtenido 80 millones de dólares en una ronda de
Logotipo de la empresa de ciberseguridad Guardio

Spotify lanza nuevas funciones para explorar los creadores detrás de la música

Spotify presenta herramientas para explorar productores, ingenieros y sampleos. SongDNA y «About the Song» ofrecerán
Imagen sin título

Estados Unidos prioriza visas para aficionados con entradas del Mundial 2026

Estados Unidos prioriza las citas para visados de aficionados con entradas oficiales del Mundial 2026.
Gianni Infantino, presidente de la FIFA, en la Casa Blanca.

Target lanza una app con ChatGPT para compras e integra IA en su empresa

Target lanza una aplicación beta en ChatGPT que permite buscar ideas, navegar productos y realizar
Imagen sin título

Meta notifica a adolescentes australianos el cierre inminente de sus cuentas

Meta notifica el cierre de cuentas a menores de 16 años en Australia. La prohibición
Imagen sin título