En este post vamos a usar audiocraft la IAs que ha publicado Meta centradas en generar sonidos y música a partir de descripciones de texto (prompts). Para ello usaremos el código publicado por Meta en su repositorio público de Github
Audiogen
Esta IA sirve para generar sonidos a partir de una descripción de los mismos.
En este caso solo disponemos de un modelo:
facebook/audiogen-medium: 1.5B texto a audio
Para esta IA vamos a usar un colab propio creado a partir del README de su repositorio.
En el siguiente vídeo de mi canal de Youtube están descritos los pasos para usarlo:
Musicgen
Musicgen permite crear música de dos formas: a partir de una descripción en texto y además de la descripción usando una melodía como base (solo con el modelo musicgen-melody).
En este caso la demo está mucho más trabajada que en el caso anterior y cuanta con una completa interfaz gráfica que permite probar las diferentes opciones. Usaremos el colab que viene incluido en el README de su repositorio.
Contamos con 4 modelos diferentes:
facebook/musicgen-small: 300M, texto a música
facebook/musicgen-medium: 1.5B, texto a música
facebook/musicgen-melody: 1.5B, texto a música y texto+melodia a música
facebook/musicgen-large: 3.3B, texto a música
En el siguiente vídeo de mi canal de Youtube están descritos los pasos para usarlo:

