Google DeepMind presenta Lyria 3, su modelo más avanzado de IA musical capaz de transformar textos e imágenes en pistas de alta fidelidad con voces y letras.
El gigante tecnológico Google ha dado un paso de gigante en la intersección de la creatividad y la inteligencia artificial con el lanzamiento de Lyria 3, su modelo de generación musical más sofisticado hasta la fecha. Desarrollado por la división especializada Google DeepMind, esta herramienta no solo permite crear composiciones desde cero mediante instrucciones de texto, sino que introduce una función revolucionaria: la capacidad de «leer» una fotografía o un video para componer una banda sonora que capture la atmósfera y el sentimiento de la imagen.
A diferencia de versiones anteriores que se enfocaban principalmente en instrumentales, Lyria 3 ha sido diseñado para ofrecer una experiencia musical completa. El sistema es capaz de generar pistas de hasta 30 segundos que incluyen voces realistas, letras coherentes y una instrumentación compleja. Los usuarios pueden solicitar, por ejemplo, una balada de jazz inspirada en un atardecer o un ritmo electrónico frenético basado en un video de deportes extremos, obteniendo resultados con una calidad de producción profesional de 48 kHz en estéreo.
La ciencia detrás de la melodía
El modelo funciona bajo una arquitectura de autorregresión basada en fragmentos, lo que le permite mantener el sentido del ritmo y la estructura musical (el «groove») a lo largo de la pieza. Según explicó Demis Hassabis, cofundador y CEO de Google DeepMind, la misión de esta tecnología es potenciar la expresión artística: «Desde una simple instrucción de texto, Lyria produce música y voces convincentes, permitiendo que cualquier persona transforme una idea en una canción completa».
Uno de los elementos más destacados de esta actualización es su integración con la aplicación Gemini. Ahora, los usuarios pueden interactuar directamente con la IA para refinar sus creaciones. Si el resultado inicial no convence, es posible ajustar parámetros específicos como el tempo (BPM), la densidad de instrumentos o el estilo vocal. Esta flexibilidad convierte a la herramienta en un colaborador creativo más que en un simple automatismo.

Seguridad y ética en la creación sonora
Conscientes de los desafíos que implica la IA generativa en la industria musical, Google ha implementado medidas de seguridad rigurosas. Todas las pistas generadas por Lyria 3 incluyen SynthID, una tecnología de marca de agua imperceptible integrada directamente en la forma de onda del audio. Esta marca es tan resistente que sobrevive a procesos de edición, compresión en formato MP3 o cambios en la velocidad de reproducción, permitiendo identificar siempre si una pieza fue creada con IA.
Además, la compañía ha trabajado estrechamente con artistas a través de su incubadora de música para establecer límites que protejan la propiedad intelectual y eviten la generación de contenido perjudicial. El objetivo, según la empresa, es que la IA actúe como un «multiplicador de fuerza» para el intelecto y la creatividad humana, facilitando que músicos y aficionados exploren nuevos géneros sin las barreras técnicas tradicionales.
Lyria 3 ya está empezando a desplegarse de manera global. Las pistas generadas no solo se entregan como archivos de audio, sino que vienen acompañadas de un arte de portada personalizado, ideal para ser compartido en plataformas como YouTube Shorts o redes sociales. Los usuarios pueden descargar sus creaciones en formato MP3 a 192 Kbps o como clips de video con la imagen generada.
Con este lanzamiento, Google no solo compite en el mercado de la IA generativa, sino que redefine cómo interactuamos con el sonido, permitiendo que un recuerdo visual se convierta, en cuestión de segundos, en una banda sonora única y personal.
*En la creación de este texto se usaron herramientas de inteligencia artificial.





