La IA Ahora Puede Ver, Escuchar y Comprender el Mundo en Tiempo Real

Las nuevas herramientas de inteligencia artificial con capacidades en tiempo real de visión y voz están transformando la manera en que interactuamos con la tecnología. Estas innovaciones permiten una interacción más natural, eficiente y accesible, impulsando la productividad y la innovación en sectores clave como educación, medicina, logística y seguridad.
Lorem Ipsum
Ai-Convolution-Gemini-2.0
Ai-Convolution-Gemini-2.0

Las recientes actualizaciones en los sistemas de inteligencia artificial de Google y OpenAI han introducido capacidades en tiempo real:

Google Gemini 2.0 Flash

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal capaz de procesar y generar texto, imágenes y audio en tiempo real. Su Multimodal Live API permite a los desarrolladores crear aplicaciones con interacciones naturales y comprensión de video en tiempo real. Esta tecnología facilita la creación de agentes autónomos que pueden realizar tareas complejas con mínima intervención humana, como realizar pedidos en línea o programar videollamadas.

OpenAI incorpora video al Modo de Voz Avanzado de ChatGPT

OpenAI ha mejorado ChatGPT con el Modo de Voz Avanzado, permitiendo conversaciones en tiempo real más naturales. Esta función, inicialmente disponible para suscriptores de pago, se ha expandido a usuarios gratuitos, ofreciendo una experiencia de conversación más fluida y humana. Además, se han introducido capacidades de video y uso compartido de pantalla, ampliando las posibilidades de interacción.

¿Por qué es importante?

Estas nuevas herramientas de inteligencia artificial, con capacidades en tiempo real de visión y voz, son importantes porque permiten una interacción más natural y eficiente, facilitando la retroalimentación instantánea y mejorando la productividad en tareas complejas. Su capacidad para combinar visión y voz amplía la accesibilidad, mejora el entendimiento del contexto visual y abre nuevas aplicaciones en sectores como educación, medicina, logística y seguridad. Además, impulsan la innovación al ofrecer soluciones que democratizan el uso de la tecnología y transforman la manera en que colaboramos con sistemas inteligentes.

Juez de Florida archiva demanda contra Deel por sanciones rusas

Un juez de Florida desestimó la demanda que acusaba a la empresa de nóminas Deel
Imagen sin título Vaughn Ridley / Sportsfile for Collision / Getty Images / TechCrunch

Google anuncia evento Made by Google para el 20 de agosto

Google presentará su evento Made by Google este miércoles 20 de agosto a las 10:00
Imagen de hardware de Google (créditos: David Paul Morris/Bloomberg / Getty Images) David Paul Morris / TechCrunch

Tribunal paraliza acciones de NLRB contra SpaceX por inconstitucionalidad

Un tribunal federal de apelaciones paralizó las acciones de la NLRB contra SpaceX al considerar
Imagen sin título Alisha Jucevic/Bloomberg / Getty Images / TechCrunch

Databricks recauda 1000M para bases de datos de IA

La empresa de análisis de datos cierra una ronda de financiación de 1000 millones de
Imagen sin título Información de autor no disponible / TechCrunch

TechCrunch Disrupt 2025 analiza herramientas IA para startups

El evento reunirá a fundadores y expertos en San Francisco para debatir cómo las herramientas
Imagen sin título Kimberly White / Getty Images / TechCrunch

Google pagará 30 millones por demanda de datos de niños en YouTube

Google desembolsará 30 millones de dólares para resolver una demanda colectiva por presunta recogida ilegal
Imagen sin título Información de autor no disponible / TechCrunch

Meta reorganiza su división de IA en cuatro nuevos grupos

Meta crea los Meta Superintelligence Labs para impulsar su desarrollo en inteligencia artificial, reorganizando sus
Imagen sin título Getty Images / TechCrunch

Meta lanza traducciones con IA para creadores en redes sociales

Meta implementa traducciones automáticas con IA que mantienen la voz y tono original del creador
Interfaz de la función de traducción de voz de Meta AI Meta / TechCrunch

TechCrunch Disrupt 2025 reúne 10.000 líderes en San Francisco

El evento tecnológico más importante del año se celebrará del 27 al 29 de octubre
Vista del expositor de Google Cloud en TechCrunch Disrupt 2024 Slava Brazer Photography / TechCrunch Events

India propone prohibición total de juegos de dinero real online

El gobierno indio presenta un borrador de ley que prohibiría todas las apuestas con dinero
Imagen representativa de juegos de azar online triloks / Getty Images / TechCrunch

OpenAI busca valoración récord de 500.000 millones de dólares

La startup de inteligencia artificial podría convertirse en la empresa privada más valiosa del mundo,
Ilustración del artículo sobre la valoración de OpenAI WIRED Staff; Getty Images / WIRED

Aalo Atomics recauda 100M para microreactor nuclear

La startup anuncia financiación de 100 millones de dólares para construir su primer microreactor nuclear
Imagen sin título Información de autor no disponible / TechCrunch