Crear vídeos con Inteligencia Artificial será algo más que habitual en el futuro, aunque ya podemos ver algunos ejemplos en películas de animación y videojuegos y su uso tenga muchos detractores. OpenAI a través de Sora, Google con Veo y Midjourney, son los principales protagonistas de la evolución de la IA en la creación de vídeos.
El último de estos protagonistas que acaba de anunciar una nueva versión es OpenAI con el lanzamiento de Sora 2. Sora, la IA de OpenAI se anunció en febrero de 2024 (aunque no estuvo disponible para el gran público hasta finales de ese mismo año) y marcó el camino de lo que sería el uso de la IA en la creación de vídeos, al igual que cuando lanzó ChatGPT pero para textos.
Sin embargo, esta primera versión, a pesar de los vídeos promocionales cuidadosamente diseñados para mostrar sus posibilidades omitiendo los errores que cometía, tenía problemas a la hora de interpretar las leyes de la física, un aspecto fundamental para dar una sensación de realismo.
Novedades de Sora 2
Con el lanzamiento de Sora 2, OpenAI no quiere que Google con Veo 3 sea la mejor IA disponible actualmente en el mercado para la creación de vídeos y ha introducido mejoras tanto en la interpretación de la física como en el audio, para, como mínimo, estar al mismo nivel que la IA generativa de Google.
OpenAI afirma que Sora 2 comprende la dinámica de la física, a diferencia de la primera versión de Sora que, distorsionada por completo la realidad, especialmente en escenas con movimientos rápidos de objetos.
Ahora es capaz de generar vídeos con movimientos complejos como rutinas de gimnasia rítmica, volteretas hacia atrás de paddleboarding e incluso vídeos completos con ejes triples realizados por personajes creados por la IA todo ello manteniendo sincronizados los diálogos y efectos de sonido.
Relacionado con lo anterior, esta nueva versión de la IA de OpenAI para crear vídeos es la capacidad de añadir elementos reales en vídeos generados por IA. Esto permite a los usuarios subir vídeos suyos o de objetos a la plataforma y modificar el entorno en el que se encuentran para generar cameos.
Otras de las características más importantes a destacar de Sora 2 es ofrecer un mayor control sobre el flujo de trabajo al ser capaz de seguir instrucciones detalladas de múltiples tomas manteniendo la cohesión en las secuencias. Es compatible con efectos visuales lo que permite crear estéticas realistas, cinematográficas o incluso de anime.
¿Cuánto cuesta?
De momento, y como desgraciadamente viene siendo habitual, Sora 2 está disponible inicialmente en Estados Unidos y Canadá a través de una invitación, por lo que en Europa tendremos que esperar a la primavera de 2026 al estar pendiente de las aprobaciones regulatorias para empezar a utilizarlo siempre y cuando tengamos contrato un plan de pago.
Dependiendo del plan, podemos generar 50 vídeos al mes de 20 segundos a resolución 720p o 500 vídeos de 45 segundos a 1080p para ChatGPT Plus y ChatGPT Pro respectivamente.
| Plan | Cuota de Generación | Resolución Máxima | Duración Máxima |
|---|---|---|---|
| ChatGPT Plus | 50 vídeos / mes | 720p | 20 segundos |
| ChatGPT Pro | 500 vídeos / mes | 1080p | 45 segundos |
Según afirma OpenAI, Sora equivale al GPT-1 en vídeo, mientras que Sora 2 equivaldría a GPT-3.5. Con esta comparativa, ya nos podemos ir haciendo una idea de que, todavía tiene mucho camino por recorrer, especialmente en cuanto a la resolución y número de fotogramas por segundo.
