top of page
Consulta a Wolfie.gif
Foto del escritorAlba Pelegrin

Google crea una IA que convierte texto en música y nunca saldrá a la luz.

Google ha creado un sistema de inteligencia artificial capaz de producir música de cualquier estilo a partir de la introducción de texto. A pesar de lo innovador de la tecnología, la empresa aún no la ha puesto a disposición del público debido a posibles riesgos. Te contamos todos los detalles aquí abajo.



MusicLM de Google no es el único generador de música basado en IA que existe. Existen muchas otras herramientas de las que ya hemos hablado en artículos anteriores, como Riffusion, que compone música visualizándola, Dance Diffusion de Google, AudioML de Google y Jukebox de OpenAI. Sin embargo, debido a dificultades técnicas y a la falta de datos de entrenamiento, ninguno de ellos ha sido capaz de crear canciones con composiciones complejas o una calidad de sonido excelente. Sin embargo, MusicLM puede ser la primera en lograrlo.


MusicLM se entrenó con un conjunto de datos de 280.000 horas de música para crear canciones a partir de descripciones bastante complejas como "encantadora canción de jazz con un memorable solo de saxofón y un cantante solista" o "tecno berlinés de los 90 con un bajo grave y una base potente". La música generada tiene cierto parecido con la composición de un artista humano, pero no es tan creativa ni musicalmente coherente como la que podría crear una persona,


Lo más destacable: su calidad de audio, a pesar de que no intervienen músicos ni instrumentistas. Incluso cuando se le proporcionan instrucciones relativamente largas y sinuosas, MusicLM es capaz de captar detalles sutiles como licks instrumentales, melodías y sentimientos.


Las capacidades de IA de MusicLM no se limitan a producir fragmentos de música. Los investigadores de Google han demostrado que el sistema es capaz de basarse en piezas musicales existentes, ya sean tarareadas, cantadas, silbadas o tocadas con un instrumento. Además, MusicLM puede traducir una serie de palabras descriptivas (por ejemplo, "hora de meditar", "hora de despertarse", "hora de correr", "hora de dar el 100%") en una historia melódica que se prolonga durante varios minutos: la B.S.O ideal para una película.


Además, MusicLM puede manejarse con una fusión de imagen y pie de foto, o crear audio "interpretado" con un tipo concreto de instrumento en un género determinado. El nivel de habilidad del "músico" de IA puede ajustarse, y el sistema puede crear melodías inspiradas en lugares, épocas o propósitos (por ejemplo, música enérgica para hacer ejercicio físico).


Pero no todo lo que reluce es oro. El sistema MusicLM también tiene sus defectos, el más notable son las muestras distorsionadas, consecuencia inevitable de la formación. Aunque MusicLM puede generar técnicamente voces, incluidas armonías corales, su calidad es cuestionable. La mayoría de las "letras" son casi incomprensibles o un completo disparate, cantadas por voces sintetizadas que parecen de varios artistas fusionados.


El equipo de Google ha señalado los múltiples obstáculos éticos que presenta un sistema como MusicLM, entre ellos la posibilidad de incluir elementos protegidos por derechos de autor procedentes de los datos de entrenamiento en las melodías generadas. Durante una prueba, se descubrió que alrededor del 1% de la música generada era una copia exacta de la música sobre la que se había educado. Por eso se consideró que esta cantidad era demasiado grande para publicar MusicLM en su forma actual.


Si se desarrollara MusicLM o un sistema similar, seguro que surgirían importantes debates legales, incluso si los sistemas estuvieran pensados para servir de apoyo a los artistas en lugar de sustituirlos. De hecho, sin ir más lejos, en 2020, la discográfica de Jay-Z presentó demandas por derechos de autor contra el canal de YouTube Vocal Synthesis por utilizar IA para crear interpretaciones de canciones como "We Didn't Start the Fire" de Billy Joel. YouTube retiró inicialmente los vídeos, pero más tarde decidió que las solicitudes de retirada estaban "incompletas" y los restableció.


Muchas personas sugieren que los generadores de música por IA, como MusicLM, infringen las leyes de derechos de autor al reproducir audio de las fuentes con las que se entrenan. Tras el lanzamiento de Jukebox, muchos se han preguntado si el uso de música protegida por derechos de autor para entrenar modelos de IA se considera uso legítimo. Lo mismo ocurre con los sistemas de inteligencia artificial que generan imágenes, código y texto, cuyos conjuntos de datos a menudo se extraen de Internet sin permiso del autor.


También nos planteamos la duda de que quizá la música generada por IA podría ser clasificada como obra derivada, por lo que solo los elementos originales tendrían derecho a la protección de los derechos de autor. No se sabe a ciencia cierta qué puede considerarse "original" en este tipo de música, por lo que su uso comercial resulta arriesgado.


Pero esto solo es el principio de una nueva era. Solo el tiempo dirá qué pasa con las herramientas de inteligencia artificial aplicadas a la industria de la música, cómo se establece el aspecto legal sobre ellas y cómo estas afectarán a la creatividad humana.

Comentarios


Consulta a Wolfie.gif
bottom of page