La IA Ahora Puede Ver, Escuchar y Comprender el Mundo en Tiempo Real

Las nuevas herramientas de inteligencia artificial con capacidades en tiempo real de visión y voz están transformando la manera en que interactuamos con la tecnología. Estas innovaciones permiten una interacción más natural, eficiente y accesible, impulsando la productividad y la innovación en sectores clave como educación, medicina, logística y seguridad.
Lorem Ipsum
Ai-Convolution-Gemini-2.0
Ai-Convolution-Gemini-2.0

Las recientes actualizaciones en los sistemas de inteligencia artificial de Google y OpenAI han introducido capacidades en tiempo real:

Google Gemini 2.0 Flash

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal capaz de procesar y generar texto, imágenes y audio en tiempo real. Su Multimodal Live API permite a los desarrolladores crear aplicaciones con interacciones naturales y comprensión de video en tiempo real. Esta tecnología facilita la creación de agentes autónomos que pueden realizar tareas complejas con mínima intervención humana, como realizar pedidos en línea o programar videollamadas.

OpenAI incorpora video al Modo de Voz Avanzado de ChatGPT

OpenAI ha mejorado ChatGPT con el Modo de Voz Avanzado, permitiendo conversaciones en tiempo real más naturales. Esta función, inicialmente disponible para suscriptores de pago, se ha expandido a usuarios gratuitos, ofreciendo una experiencia de conversación más fluida y humana. Además, se han introducido capacidades de video y uso compartido de pantalla, ampliando las posibilidades de interacción.

¿Por qué es importante?

Estas nuevas herramientas de inteligencia artificial, con capacidades en tiempo real de visión y voz, son importantes porque permiten una interacción más natural y eficiente, facilitando la retroalimentación instantánea y mejorando la productividad en tareas complejas. Su capacidad para combinar visión y voz amplía la accesibilidad, mejora el entendimiento del contexto visual y abre nuevas aplicaciones en sectores como educación, medicina, logística y seguridad. Además, impulsan la innovación al ofrecer soluciones que democratizan el uso de la tecnología y transforman la manera en que colaboramos con sistemas inteligentes.

DeepMind ficha al ex CTO de Boston Dynamics para impulsar su división de robótica

Google DeepMind contrata a Aaron Saunders, ex director de tecnología de Boston Dynamics, para liderar
Demis Hassabis, CEO de Google DeepMind

Huang de Nvidia descarta burbuja de IA mientras inversores dudan

Nvidia reporta 57.000 millones en ventas y 32.000 millones en beneficios. La compañía proyecta 65.000
Jensen Huang, CEO de Nvidia, habla con los medios en Tainan, Taiwán, el 7 de noviembre de 2025.

Ramp alcanza una valoración de 32.000 millones de dólares en nueva ronda

La fintech Ramp ha alcanzado una valoración de 32.000 millones de dólares tras una ronda
Imagen sin título

Nvidia anuncia récord de ingresos y pronóstico alcista en tercer trimestre

Nvidia anuncia un récord de 57.000 millones de dólares en ingresos trimestrales, con un beneficio
Jensen Huang, fundador y CEO de Nvidia

Trump prepara orden ejecutiva para impugnar leyes estatales sobre IA

Un borrador de orden ejecutiva de Trump instruye al Departamento de Justicia a demandar a
Donald Trump durante un acto público

NestAI recauda 100 millones de euros para IA física con Nokia y Tesi

La startup finlandesa NestAI ha obtenido 100 millones de euros en una ronda de financiación
Imagen sin título

Jennifer Neundorfer analiza la fatiga de la IA y el futuro del mercado

La inversora Jennifer Neundorfer prevé una corrección en el mercado de inteligencia artificial debido a
Jennifer Neundorfer en TechCrunch Disrupt 2025

Function Health recauda 298 millones de dólares en una ronda Serie B

Function Health ha levantado 298 millones de dólares en una ronda Serie B liderada por
Imagen sin título

Grandes tecnológicas debaten directrices para chatbots compañeros en taller de Stanford

Principales empresas de IA, como Anthropic, Google y OpenAI, debatieron en Stanford directrices para chatbots
Representación de una conversación entre un humano y un chatbot

Experto financiero alerta sobre el riesgo de la deuda «fantasma» del ‘pago aplazado’

El 25% de los usuarios de BNPL en EE.UU. utiliza estos servicios para comprar comida,
Nigel Morris hablando en el Web Summit de Lisboa.

Expertos advierten que EE.UU. se queda atrás en IA open source frente a China

Expertos advierten que EE.UU. pierde ventaja en IA al priorizar modelos cerrados. China, con DeepSeek,
Ilustración sobre inteligencia artificial y competencia tecnológica.

Warner Music y Udio sellan acuerdo para plataforma de música con IA

Warner Music Group y Udio resuelven su demanda y acuerdan lanzar una plataforma de creación
Imagen sin título