A pesar de no ser algo completamente nuevo para Google (DeepMind), el gigante de las búsquedas siempre ha ido a rebufo con la Inteligencia Artificial, dando la sensación de que le había pillado con el pie cambiado o que realmente no quería presentar su apuesta por la IA sin tener algo sobre lo que apoyarse y que los usuarios pudieran probar, como habitualmente hace OpenAI.
Hace unos días, Google celebró el Google I/O, la conferencia para desarrolladores que, de un tiempo a esta parte se está centrando en los avances del gigante de las búsquedas en Inteligencia Artificial dejando en un segundo plano, las novedades de sus servicios no relacionadas con la IA.
Generar texto, imágenes o música es algo que podemos hacer desde hace mucho tiempo. Sin embargo, cuando hablamos de generar vídeos mediante IA, el reto al que se enfrentan los desarrolladores es muy grande y todavía tiene un largo camino por recorrer. OpenAI fue el primero en apostar por esto con SORA, sin embargo, sigue sin estar accesible al gran público.
Mientas que SORA siguen sin salir de la eterna fase beta en la que se encuentra, la IA de Google para generar vídeos, Veo, ya que se encuentra en su tercera generación. En el pasado Google I/O, Google presentó todas las novedades que llegan a Veo 3 y que, a diferencia de SORA, ya están disponibles para todos los usuarios de pago.
Novedades de la Veo 3
Entrenar una IA para que sea capaz de generar un vídeo en base a una descripción es un proceso largo y laborioso donde se deben controlar todos los parámetros a utilizar para evitar que lo haga de forma libre y no ofrezca resultados creíbles. Como era de esperar, Google ha trabajado para mejorar como Veo 3 entiende la física para reflejar el movimiento de las personas, objetos y animales que genera además de la sincronización al crear personajes que hablan.
NOTA: Si los vídeos se reproducen en español doblado, debemos acceder a las propiedades del vídeo y elegir en Pista de audio Inglés (Estados Unidos) original.
Además, también se ha mejorado tanto la iluminación de las escenas como la profundidad de campo para dar una mayor sensación de realismo y ofrecer resultados profesionales. Pero, lo mejor de todo, es no es la gran calidad de los vídeos que genera, sino que sea capaz de añadir sonido ambiente y, si es necesario efectos de sonido.
Esto supone un clavo más en el ataúd de SORA, quien no acaba de despegar y los avances que periódicamente se muestran sobre su funcionamiento, todavía están muy lejos de lo que es capaz hoy en día de hacer Veo, no solo con la versión actual, sino también con las versiones previas.
Generar vídeos mediante IA supone un elevado consumo de recursos para los servidores de ahí que, de momento, solo se puedan crear vídeos en resolución Full HD de unos pocos segundos, aunque, sobre el papel, la duración máxima es de un minuto. Para evitar que YouTube (con la que entrena esta IA) se siga llenando de vídeos fake, Veo 3 no permite generar vídeos que no tenga sentido en el mundo real ni donde se muestren personas famosas. Viendo como está evolucionando la IA para generar vídeos, no pasará mucho tiempo hasta que algún estudio o incluso un particular, pueda crear películas completas con personas que no existen.