En el mercado podemos encontrar un gran número de opciones a la hora de crear imágenes mediante Inteligencia Artificial. Sin embargo, las más populares son las de OpenAI, con ChatGPT Images y la de Google con Nano Banana.
Si no tienes la necesidad de utilizar la Inteligencia Artificial para generar imágenes, y no sabes cuál es mejor, ya te decimos nosotros y los rankings que analizan su rendimiento y precisión que Nano Banana de Google siempre ha estado muy por delante de ChatGPT Images.
Si bien es cierto que Google llegó tarde a la carrera de la IA, cuando lo hizo, superó a todos sus rivales por la derecha, incluyendo a todos los productos de OpenAI quien la popularizó a finales de 2022 con ChatGPT.
ChatGPT Image 2.0: el santo al razonamiento visual
Desde OpenAI se han dado cuenta que Google está haciendo un muy bien trabajo con su IA en todos los apartados, tanto a la hora de generar texto, como en la creación de imágenes e incluso en la generación de vídeos. Recordemos que la empresa de Sam Altman tiró la toalla con Sora, su IA para generar vídeos hace unas semanas.
Con el lanzamiento de ChatGPT Image 2.0, OpenAI se enfrenta directamente a Nano Banana 2 de Google (también conocido como Gemini 3.1 Flash Image). Esta nueva versión quiere suponer un antes y un después en la creación de imágenes mediante un proceso simple de traducción de texto a imagen (Images 2.0 Instant) y otro más completo que aplica razonamiento profundo (Images 2.0 Thinking).
La característica más llamativa de esta nueva versión de ChatGPT para crear imágenes, es la introducción de un paso de razonamiento previo a la creación. A diferencia de las versiones anteriores que interpretaban el prompt de forma literal y rápida, la versión 2.0 se detiene a «pensar» en la estructura de la imagen.
Según afirman desde OpenAI, este proceso permite que el modelo entienda composiciones complejas. Si, por ejemplo, un usuario solicita un diseño técnico o una interfaz de usuario (UI) con elementos específicos en coordenadas precisas, el sistema ya no se limita a distribuir los elementos por la imagen de forma aleatoria, construye la imagen basándose en una comprensión lógica de la disposición espacial.
Otras características que OpenAI ha introducido en ChatGPT Images 2.0 son:
- Coherencia de personajes. Es capaz de crear cómics o manga manteniendo el mismo diseño de personajes a través de diferentes imágenes.
- Formatos y resoluciones. Permite crear imágenes con hasta resolución 2K y relaciones de aspecto ultra anchas.
- Detalle extremo. En el vídeo de presentación se muestra la imagen de un grano de arroz donde, al hacer zoom, se podía leer perfectamente el texto «GPT Image 2.0»
- Diseño e interacción. En otra demostración que podemos ver en el vídeo de presentación, uno de los colaboradores le pide ChatGPT Image 2.0 que le cree un outfit basado en su foto y que muestra diferentes ángulos permitiendo realizar ajustes.
- Soporta múltiples idiomas. ChatGPT Image 2.0 superado la barrera del alfabeto latino, siendo capaz de para renderizar caracteres en hindi, chino, japonés, bengalí y coreano.
Como hemos comentado al inicio de este artículo, Google había adelantado por la derecha a ChatGPT Images con una excelente capacidad de integrar contexto del mundo real, su estética fotorrealista con iluminación cinematográfica y su capacidad para generar texturas orgánicas. También era capaz de crear imágenes con texto sin alucinar.
ChatGPT Images 2.0 ahora es capaz de generar texto perfectamente legible dentro de las imágenes, poniéndose al mismo nivel que la solución de Google. Donde sí destaca por encima de la solución de Google es por la capacidad de seguir instrucciones para crear imágenes. Además, en el modo Thinking (solo disponible para los usuarios de pago) es capaz de generar hasta 8 imágenes simultáneas, una función ideal para, por ejemplo, crear campañas para redes sociales.
¿Quién hace mejores imágenes?
La competencia entre OpenAI y Google ya no se trata de quién genera la imagen más «bonita y/o realista», sino de quién ofrece un mayor número de opciones para gestionar como se generan. Con el lanzamiento de ChatGPT Images 2.0, OpenAI ha transformado su chatbot en un estudio de diseño que no solo dibuja, sino que comprende las reglas del diseño y la comunicación visual.
