MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

  8月3日(東部時間8月2日)、Metaは、ユーザーがテキストプロンプトを通じて音楽やオーディオを作成できるようにする生成AIツールAudioCraftをオープンソース化しました。

写真3

Meta の公式紹介によると、AudioCraft には 3 つのコア コンポーネントが含まれています。

  • MusicGen: Meta が所有または特別にライセンスした音楽を使用してトレーニングし、テキストプロンプトに基づいて音楽を生成します。
  • AudioGen:トレーニング用のパブリック サウンド効果を使用してオーディオを生成したり、既存のオーディオを拡張したりします。また、環境音 (犬の鳴き声、車のクラクション、木製の床の足音など) も生成できます。
  • EnCodec (改良版):アーティファクトの少ない高品質の音楽を生成したり、オーディオ ファイルをロスレスで圧縮したりできる、ニューラル ネットワーク ベースのオーディオ圧縮デコーダーです。

MusicGen と AudioGen の動作を示すフローチャート

ツールがオープンソース化された後、研究者や実務者は独自のデータセットを使用してモデルをトレーニングできるようになります。同社によると、AudioCraftシリーズのモデルは、高品質のオーディオを安定して長期間生成でき、使いやすく、ミュージシャンやサウンドデザイナーに「インスピレーションを与え」、迅速なブレインストーミングを助け、「新しい方法で作業を繰り返す」ことができるという。

IT Homeの以前の報道によると、Metaは今年6月に、Googleが2017年に発表したTransformerモデルをベースにしたAI言語モデルMusicGenをオープンソース化した。モデル名が示すように、MusicGen は主に音楽生成に使用されます。テキストと既存のメロディーを完全な音楽に変換できます。

AudioCraftプロジェクトアドレス:ここをクリック

<<: 

>>:  スペイン・ラ・リーガ:AIと機械学習でファン体験の変革に取り組む

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

コンピュータビジョンによる3D再構成 - 自動運転に焦点を当てる

最近、私は何かに没頭しています。没頭するというのは、諦めるということではなく、むしろ醸成していくプロ...

...

比較ベースのアルゴリズムでは、5 つの要素をソートするのに 7 回のパスが必要だと言われるのはなぜですか?

結果のソートアルゴリズムの唯一の要件は、オペランドが全順序関係を満たすことです。 a≤b かつ b≤...

...

...

人工知能が仕事を奪っていますが、将来の職場で私たちは何のために戦うのでしょうか?

病院では、人工知能 (AI) は人間の医師よりもレントゲンの分析が得意です。法律事務所では、AI は...

王の英雄を見極める – PM の機械学習初心者の旅

[[204836]]基本概念先月、私は機械学習を原理レベルから理解し始め、オンライン電子書籍「ニュー...

CNNを知っておくべきだ

CNN というと、最初は特定のテレビ局を思い浮かべる人が多かったのですが、数年後にはディープラーニン...

人工知能が持続可能な開発を推進する5つの方法

フォーチュン 500 にランクされる世界的なテクノロジー サービス企業 DXC Technology...

Python による顔認識 (ソースコード付き)

Python は画像やビデオから顔を検出して認識できます。顔の検出と認識は、コンピューター ビジョ...

スマートホームとは何ですか?そしてそれは必要ですか?

スマートホームのコンセプトを最も簡単に説明すると、それは家の自然な進化であるということです。スマート...

機械学習でよく使われる7つの線形次元削減手法の概要

前回の記事では主に非線形次元削減手法についてまとめました。この記事では、一般的な線形次元削減手法につ...

...