NVIDIA vient de présenter Fugatto, un nouveau modèle d’intelligence artificielle capable de créer, modifier et transformer des sons à partir de simples descriptions textuelles. Cela peut être de la musique, des voix ou des sons totalement inédits. Une sorte de ChatGPT, mais pour tout ce qui est environnement sonore. On vous explique tout !
Table de Matieres
Fugatto, le « couteau suisse du son »
Fugatto, ou « Foundational Generative Audio Transformer Opus 1 », est un modèle d’IA développé par NVIDIA pour générer et transformer des sons.
Contrairement à d’autres outils d’intelligence artificielle qui sont souvent limités à des tâches spécifiques, Fugatto se veut polyvalent. Si vous souhaitiez créer une musique à partir d’un texte, transformer une voix pour lui donner un autre accent ou une émotion ou encore ajouter des instruments à une chanson existante, Fugatto semble tout à fait capable de répondre à ses besoins.
L’outil fonctionne principalement via des descriptions textuelles. Il vous suffit de décrire le type de son que vous voulez obtenir et Fugatto se charge du reste. Par exemple, vous pouvez lui demander de créer une ambiance de pluie avec des oiseaux qui chantent au lever du jour, et Fugatto génère ce son à partir de cette simple demande. Vous enregistrez le fichier sonore, vous l’intégrez à votre projet et c’est terminé !
À quoi cela pourrait-il servir ?
NVIDIA présente plusieurs scénarios où Fugatto pourrait s’avérer très utile. Par exemple, les producteurs de musique peuvent se servir de Fugatto pour générer rapidement un prototype de chanson, tout en expérimentant différents styles, voix et instruments. Fugatto pourrait aussi permettre d’ajouter des effets et d’améliorer la qualité sonore d’un morceau existant.
Pour les développeurs de jeux vidéo, Fugatto offre la possibilité de modifier des sons pré-enregistrés en fonction des actions des joueurs. En clair, Fugatto pourrait rendre des environnements plus vivants en adaptant les sons ambiants de manière dynamique.
On peut également imaginer des applications de formation linguistique utilisant Fugatto pour personnaliser les voix des exercices. Par exemple, écouter une leçon dans la voix d’un proche pourrait rendre l’expérience plus immersive.
Fugatto en action : une vidéo pour tout comprendre
Pour mieux saisir le potentiel de Fugatto, NVIDIA a partagé une vidéo présentant quelques exemples de ce que le modèle peut réaliser. On y voit Fugatto générer des morceaux de musique à partir de simples descriptions, et manipuler des sons pour leur donner une toute nouvelle dimension.
Vous pouvez regarder la vidéo ici :
Conclusion : une avancée pour la création sonore ?
Pour l’instant, NVIDIA n’a pas encore annoncé de disponibilité publique de Fugatto. Cela signifie que nous devons nous contenter des démonstrations et des explications fournies pour nous faire une idée de son potentiel.
Même si nous ne pouvons pas encore tester Fugatto nous-mêmes, il est clair que cet outil pourrait offrir de nouvelles possibilités dans la création musicale, le développement de jeux vidéo et bien d’autres domaines.
Reste à voir comment et quand NVIDIA décidera de rendre cet outil accessible. Ce qui est certain, c’est que Fugatto est un exemple de plus de l’évolution rapide des outils de création assistée par l’IA, et nous avons hâte de voir ce que les créateurs du monde entier en feront.
Source : NVIDIA