Todos sabemos que Gemini está a la cabeza de las plataformas de IA multimodales, pero ahora, está redoblando su apuesta con Lyria 3: su nuevo modelo de generación de audio. Un estudio al que podemos pedirle que componga canciones con letra, voz y con su propia portada de álbum.
La nueva herramienta de Gemini está directamente integrada en la app, en su versión beta, y se activa de manera automática en ciertas cuentas de prueba. Además, la encontramos en inglés, español y alemán.
Basta con escribir un prompt como «una canción nostálgica de afrobeat para mi padre», o incluso subir una imagen o un vídeo, para que Lyria 3 comience a generar una pista acorde al estilo, el ritmo y el estado de ánimo que le indiquemos. Pero uno de los añadidos más curiosos es que Gemini puede diseñar una portada de disco utilizando el modelo de imágenes Nano Banana. Lo que convierte esta funcionalidad en un paquete creativo total y fácilmente compartible.
Vamos a ver cómo se convierte Gemini en un estudio universal de música virtual y qué repercusiones puede tener para los creadores y la audiencia.
Gemini se convierte en un estudio de música de IA
Google está llevando a su IA Gemini más allá de las respuestas textuales, generación de imágenes o vídeos. Su nueva integración, Lyria 3, es un nuevo modelo de música de Google DeepMind. Un asistente que puede generar canciones de 30 segundos con voz, letra y portada de álbum. Por ahora, todavía se encuentra en versión beta, para usuarios mayores de 18 años y en los idiomas inglés, alemán, español, francés y japonés. Por lo que no hace falta ningún registro aparte.
Los usuarios solo tienen que describir el estilo de la música, el género o el estado de ánimo: «Necesito un ritmo de jazz alegre y rápido para la presentación de un trabajo sobre la música del siglo XX». El sistema entenderá el prompt y generará una pista completa. También tienes la posibilidad de subir una imagen o vídeo para que Lyria 3 pueda deducir el estilo de música, la atmósfera y «componer» música acorde a lo que «ve». De hecho, puede diseñar una portada de un álbum gracias a su integración con el modelo de generación de imágenes de Nano Banana. Lo que aporta un resultado creativo total: título, portada y audio. Fácilmente descargable o para compartir mediante enlace.
En cuanto a la originalidad del contenido, los temas que se generan incluyen una marca de agua invisible (SynthID), para que el contenido de IA se pueda rastrear y se identifique como música que no nace de un ser humano.
| Característica | Gemini (Lyria 3) | Suno AI (v3) |
|---|---|---|
| Duración Máxima | 30 segundos | Hasta 4 minutos |
| Entrada Multimodal | Sí (texto, imagen, vídeo) | No (solo texto) |
| Generación de Portada | Sí (integrado) | No |
| Exportación de Pistas (Stems) | No disponible | Sí (en planes de pago) |
| Modelo de Acceso | Gratuito (en beta) | Freemium (con planes Pro) |
| Integración Ecosistema | Nativa en Gemini y YouTube Shorts | Plataforma independiente |
La repercusión en el futuro de la música
Lyria 3 es el culmen de la evolución de un modelo que Google lleva probando desde el año 2023, primero mediante proyectos como YouTube Dream Track, y luego mediante pruebas a nivel interno. Con respecto a las versiones anteriores, ahora ofrece un mayor realismo, más complejidad musical y más control sobre el estilo, tempo y voces. Con el añadido estrella de ser capaz de generar letras a partir del prompt de los usuarios. La idea de Google no es sustituir a un Michael Jackson o un Freddie Mercury, sino ofrecer una herramienta de expresión creativa rápida para creadores de contenido o cualquier usuario con la curiosidad suficiente.
Esta tecnología también se integra en YouTube, donde los creadores podrán usar la herramienta para producir «bandas sonoras» para sus Shorts. Un aspecto que antes estaba limitado a Estados Unidos, pero que ahora se extiende al resto del globo. Un avance que abre la puerta a nuevas facilidades para crear contenido, pero que plantea dudas sobre copyright, propiedad de la obra y límites de uso en plataformas comerciales.
