Google actualiza su modelo de imagen IA de Gemini con mayor precisión
La herramienta permite editar fotos mediante solicitudes de lenguaje natural. El modelo, presentado el 26 de agosto de 2025, busca competir con herramientas de OpenAI. Está diseñado para realizar cambios manteniendo la coherencia de detalles como rostros.
Un editor con control creativo
Google actualiza su chatbot Gemini con un nuevo modelo de imagen IA llamado Gemini 2.5 Flash Image. El modelo está diseñado para realizar ediciones más precisas en imágenes basándose en solicitudes de lenguaje natural de los usuarios, mientras preserva la coherencia de rostros, animales y otros detalles. Nicole Brichtova, líder de producto en Google DeepMind, afirmó: «Estamos impulsando la calidad visual hacia adelante, así como la capacidad del modelo para seguir instrucciones».
Lanzamiento y capacidades técnicas
La actualización se implementa a partir del martes para todos los usuarios en la aplicación Gemini, y para desarrolladores a través de la API de Gemini, Google AI Studio y las plataformas Vertex AI. El modelo también tiene un mejor «conocimiento del mundo» y puede combinar múltiples referencias en una sola solicitud.
Un mercado en feroz competencia
Los modelos de imagen IA se han convertido en un campo de batalla crítico para Big Tech. Cuando OpenAI lanzó el generador de imágenes nativo de GPT-4o en marzo, impulsó el uso de ChatGPT. Para mantenerse al día, Meta anunció la semana pasada que licenciaría modelos de imagen IA de la startup Midjourney. Google espera que su nueva herramienta ayude a reducir la brecha de usuarios con OpenAI, ya que ChatGPT registra más de 700 millones de usuarios semanales, mientras que Gemini tiene 450 millones de usuarios mensuales.
La carrera por la supremacía de la IA
El contexto es la intensa competencia en el campo de la inteligencia artificial entre gigantes tecnológicos. OpenAI, con su GPT-4o, impulsó masivamente el uso de su chatbot ChatGPT. Meta respondió licenciando tecnología de Midjourney, y la startup Black Forest Labs continúa dominando benchmarks. Google, con su modelo Gemini, busca recuperar terreno en este mercado estratégico y creciente.
Creatividad dentro de los límites
Google ha implementado salvaguardias que limitan lo que los usuarios pueden crear, como la prohibición de generar «imágenes íntimas no consensuadas». Para abordar el auge de las imágenes deepfake, la compañía aplica marcas de agua visuales a las imágenes generadas por IA, así como identificadores en sus metadatos. El equilibrio entre el control creativo y la seguridad define el despliegue de esta nueva tecnología.