Hérault

Générez du son avec l’IA dans vos vidéos grâce à MM-audio dans Comfyui

Dans cette vidéo je vous montre comment ajouter du son dans vos vidéo automatiquement avec MM-audio dans Comfyui.

MMAudio, ou Multimodal Audio, est un outil de synthèse audio avancé conçu pour générer des sons synchronisés à partir d’entrées vidéo et textuelles. Développé à l’origine comme une solution autonome, il repose sur un entraînement multimodal qui combine des ensembles de données audio-visuelles et audio-textuelles. Résultat ? Une capacité impressionnante à produire des pistes audio qui s’alignent parfaitement avec les mouvements et les ambiances d’une vidéo, tout en tenant compte des descriptions textuelles fournies.

Imaginez une scène où un personnage marche dans une forêt : MMAudio peut générer le craquement des feuilles sous ses pas, le chant des oiseaux en arrière-plan, et même une légère brise, le tout en parfaite harmonie avec les images. Cette synchronisation précise est rendue possible grâce à un module de pointe intégré dans MMAudio, qui analyse les séquences visuelles et ajuste l’audio en conséquence.

MM-Audio Comfyui