La IA Ahora Puede Ver, Escuchar y Comprender el Mundo en Tiempo Real

Las nuevas herramientas de inteligencia artificial con capacidades en tiempo real de visión y voz están transformando la manera en que interactuamos con la tecnología. Estas innovaciones permiten una interacción más natural, eficiente y accesible, impulsando la productividad y la innovación en sectores clave como educación, medicina, logística y seguridad.
Lorem Ipsum
Ai-Convolution-Gemini-2.0
Ai-Convolution-Gemini-2.0

Las recientes actualizaciones en los sistemas de inteligencia artificial de Google y OpenAI han introducido capacidades en tiempo real:

Google Gemini 2.0 Flash

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal capaz de procesar y generar texto, imágenes y audio en tiempo real. Su Multimodal Live API permite a los desarrolladores crear aplicaciones con interacciones naturales y comprensión de video en tiempo real. Esta tecnología facilita la creación de agentes autónomos que pueden realizar tareas complejas con mínima intervención humana, como realizar pedidos en línea o programar videollamadas.

OpenAI incorpora video al Modo de Voz Avanzado de ChatGPT

OpenAI ha mejorado ChatGPT con el Modo de Voz Avanzado, permitiendo conversaciones en tiempo real más naturales. Esta función, inicialmente disponible para suscriptores de pago, se ha expandido a usuarios gratuitos, ofreciendo una experiencia de conversación más fluida y humana. Además, se han introducido capacidades de video y uso compartido de pantalla, ampliando las posibilidades de interacción.

¿Por qué es importante?

Estas nuevas herramientas de inteligencia artificial, con capacidades en tiempo real de visión y voz, son importantes porque permiten una interacción más natural y eficiente, facilitando la retroalimentación instantánea y mejorando la productividad en tareas complejas. Su capacidad para combinar visión y voz amplía la accesibilidad, mejora el entendimiento del contexto visual y abre nuevas aplicaciones en sectores como educación, medicina, logística y seguridad. Además, impulsan la innovación al ofrecer soluciones que democratizan el uso de la tecnología y transforman la manera en que colaboramos con sistemas inteligentes.

Konwinski alerta de que EEUU pierde dominio en IA frente a China

Andy Konwinski, cofundador de Databricks, alerta que China genera el doble de ideas relevantes en
Andy Konwinski hablando en una conferencia

OpenAI pagó 865 millones a Microsoft en los primeros nueve meses de 2025

OpenAI pagó 865,8 millones de dólares a Microsoft en los primeros nueve meses de 2025,
Sam Altman, director ejecutivo de OpenAI, en una conferencia.

Cadenas de bebidas chinas se expanden en EE.UU. desafiando a Starbucks

Las cadenas chinas Luckin Coffee, Chagee y HeyTea se expanden en Nueva York y California.
Una tienda de Luckin Coffee en Manhattan, donde los clientes realizan pedidos online.

Bradley Tusk lanza protocolo para impulsar el voto por móvil en EE.UU.

El consultor Bradley Tusk presenta VoteSecure, un protocolo criptográfico de código abierto para votar desde
Foto-Ilustración del personal de WIRED

OpenAI soluciona el problema del guion largo en ChatGPT tras criticas

OpenAI ha corregido la incidencia que asociaba el guion largo con textos de IA. Los
Imagen sin título

Spotify introduce nuevos planes Premium en cinco mercados

Spotify introduce nuevos planes de suscripción en cinco mercados, incluido un nivel Platinum con audio
Imagen sin título

Las grandes tecnológicas negocian el futuro de la compra automatizada con IA

Las compras navideñas realizadas por agentes de IA experimentan retrasos debido a complejas negociaciones entre
Ilustración conceptual de un agente de IA realizando compras online.

Inversores de capital riesgo cambian sus reglas para financiar startups de IA

Los fondos de capital riesgo modifican sus estrategias de inversión en inteligencia artificial ante startups
Imagen sin título

OpenAI prueba chats grupales en ChatGPT en Asia y Oceanía

OpenAI inicia una prueba piloto de chats grupales para ChatGPT en cuatro países asiáticos. La
Imagen sin título

Harvey, la startup legal de IA, alcanza una valoración de 8000 millones de dólares

La startup legal Harvey ha alcanzado una valoración de 8000 millones de dólares en octubre
Imagen sin título

Apple exige transparencia en apps que comparten datos con IA de terceros

Apple actualiza sus normas exigiendo que las aplicaciones revelen y obtengan consentimiento explícito antes de
Imagen sin título

Jack Dorsey financia diVine, una nueva app que recupera el archivo de Vine

Jack Dorsey respalda diVine, una nueva aplicación que recupera más de 100.000 vídeos del archivo
Captura de pantalla de la aplicación diVine