Google actualiza Gemini con modelo de imagen IA más preciso

Google lanza Gemini 2.5 Flash Image, un modelo de IA que permite editar fotos mediante lenguaje natural con mayor precisión y coherencia en detalles.
TechCrunch
El editor nativo de imágenes fusiona fotos de un perro y una persona manteniendo su parecido Google / TechCrunch
El editor nativo de imágenes fusiona fotos de un perro y una persona manteniendo su parecido Google / TechCrunch

Google actualiza su modelo de imagen IA de Gemini con mayor precisión

La herramienta permite editar fotos mediante solicitudes de lenguaje natural. El modelo, presentado el 26 de agosto de 2025, busca competir con herramientas de OpenAI. Está diseñado para realizar cambios manteniendo la coherencia de detalles como rostros.

Un editor con control creativo

Google actualiza su chatbot Gemini con un nuevo modelo de imagen IA llamado Gemini 2.5 Flash Image. El modelo está diseñado para realizar ediciones más precisas en imágenes basándose en solicitudes de lenguaje natural de los usuarios, mientras preserva la coherencia de rostros, animales y otros detalles. Nicole Brichtova, líder de producto en Google DeepMind, afirmó: «Estamos impulsando la calidad visual hacia adelante, así como la capacidad del modelo para seguir instrucciones».

Lanzamiento y capacidades técnicas

La actualización se implementa a partir del martes para todos los usuarios en la aplicación Gemini, y para desarrolladores a través de la API de Gemini, Google AI Studio y las plataformas Vertex AI. El modelo también tiene un mejor «conocimiento del mundo» y puede combinar múltiples referencias en una sola solicitud.

Un mercado en feroz competencia

Los modelos de imagen IA se han convertido en un campo de batalla crítico para Big Tech. Cuando OpenAI lanzó el generador de imágenes nativo de GPT-4o en marzo, impulsó el uso de ChatGPT. Para mantenerse al día, Meta anunció la semana pasada que licenciaría modelos de imagen IA de la startup Midjourney. Google espera que su nueva herramienta ayude a reducir la brecha de usuarios con OpenAI, ya que ChatGPT registra más de 700 millones de usuarios semanales, mientras que Gemini tiene 450 millones de usuarios mensuales.

La carrera por la supremacía de la IA

El contexto es la intensa competencia en el campo de la inteligencia artificial entre gigantes tecnológicos. OpenAI, con su GPT-4o, impulsó masivamente el uso de su chatbot ChatGPT. Meta respondió licenciando tecnología de Midjourney, y la startup Black Forest Labs continúa dominando benchmarks. Google, con su modelo Gemini, busca recuperar terreno en este mercado estratégico y creciente.

Creatividad dentro de los límites

Google ha implementado salvaguardias que limitan lo que los usuarios pueden crear, como la prohibición de generar «imágenes íntimas no consensuadas». Para abordar el auge de las imágenes deepfake, la compañía aplica marcas de agua visuales a las imágenes generadas por IA, así como identificadores en sus metadatos. El equilibrio entre el control creativo y la seguridad define el despliegue de esta nueva tecnología.

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

TechCrunch Disrupt 2025 se celebra en San Francisco del 27 al 29 de octubre. Los
Imagen sin título

California aprueba ley pionera para regular chatbots IA de compañía

California aprueba la primera ley de EE.UU. que regula chatbots de IA. La SB 243
Gavin Newsom firma la ley SB 243 sobre inteligencia artificial

TechCrunch Disrupt 2025 se celebra en San Francisco del 27 al 29 de octubre

El TechCrunch Disrupt 2025 se celebra del 27 al 29 de octubre en San Francisco.
Imagen sin título

Últimas mesas disponibles para TechCrunch Disrupt 2025 en San Francisco

Solo quedan 7 mesas disponibles para TechCrunch Disrupt 2025 en San Francisco. La fecha límite
Imagen sin título

Salesforce anuncia Agentforce 360 para competir en el mercado empresarial de IA

Salesforce presenta Agentforce 360, una actualización de su plataforma de agentes de IA que incluye
Logotipo de Salesforce en un evento

Nuevas normas en China obligan a Tesla a rediseñar sus manijas de puerta

China exige pomos mecánicos visibles y operables sin herramientas para 2027. Esta normativa, impulsada por
Imagen sin título

Comediante Freya McGhee combina ciencia y humor para alcanzar millones de visitas

La química Freya McGhee abandona su doctorado y triunfa en la comedia con monólogos sobre
Un escolar durmiendo sobre un libro durante una lección

Influencers conservadoras remodelan el panorama de las citas en EE.UU.

Influencers conservadoras lideran el fenómeno ‘womanosphere’, promoviendo relaciones tradicionales y creando plataformas de citas con
Imagen sin título

Nvidia supera su ritmo de inversión en startups de IA en 2025

Nvidia ha participado en 50 operaciones de capital riesgo en 2025, superando las 48 de
Logotipo de Nvidia en una pantalla

El cofundador de Thinking Machines Lab, Andrew Tulloch, se incorpora a Meta

Andrew Tulloch, cofundador de Thinking Machines Lab, se incorpora a Meta. Su salida se produce
Andrew Tulloch, cofundador de Thinking Machines Lab.

Grandes empresas apuestan por la IA pese a riesgos en su implementación

Zendesk presenta agentes de IA que resolverían el 80% de consultas de servicio al cliente.
Representación gráfica de inteligencia artificial en el entorno empresarial

Apple apuesta por Siri para mantener su dominio en la era de la IA

OpenAI permite ejecutar aplicaciones como Spotify y Booking.com directamente en ChatGPT. Los 800 millones de
Representación de un iPhone mostrando un asistente de IA.