MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

  8月3日(東部時間8月2日)、Metaは、ユーザーがテキストプロンプトを通じて音楽やオーディオを作成できるようにする生成AIツールAudioCraftをオープンソース化しました。

写真3

Meta の公式紹介によると、AudioCraft には 3 つのコア コンポーネントが含まれています。

  • MusicGen: Meta が所有または特別にライセンスした音楽を使用してトレーニングし、テキストプロンプトに基づいて音楽を生成します。
  • AudioGen:トレーニング用のパブリック サウンド効果を使用してオーディオを生成したり、既存のオーディオを拡張したりします。また、環境音 (犬の鳴き声、車のクラクション、木製の床の足音など) も生成できます。
  • EnCodec (改良版):アーティファクトの少ない高品質の音楽を生成したり、オーディオ ファイルをロスレスで圧縮したりできる、ニューラル ネットワーク ベースのオーディオ圧縮デコーダーです。

MusicGen と AudioGen の動作を示すフローチャート

ツールがオープンソース化された後、研究者や実務者は独自のデータセットを使用してモデルをトレーニングできるようになります。同社によると、AudioCraftシリーズのモデルは、高品質のオーディオを安定して長期間生成でき、使いやすく、ミュージシャンやサウンドデザイナーに「インスピレーションを与え」、迅速なブレインストーミングを助け、「新しい方法で作業を繰り返す」ことができるという。

IT Homeの以前の報道によると、Metaは今年6月に、Googleが2017年に発表したTransformerモデルをベースにしたAI言語モデルMusicGenをオープンソース化した。モデル名が示すように、MusicGen は主に音楽生成に使用されます。テキストと既存のメロディーを完全な音楽に変換できます。

AudioCraftプロジェクトアドレス:ここをクリック

<<: 

>>:  スペイン・ラ・リーガ:AIと機械学習でファン体験の変革に取り組む

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

COVID-19パンデミックは不動産業界のインテリジェントな変革とアップグレードを加速させた

[[342701]] スマートホーム革命はかなり前から本格化しています。住宅所有者はデータと IoT...

...

自然言語処理がビジネスインテリジェンスの未来である理由

[[187102]] Siri に道順を尋ねるたびに、複雑なコード列がアクティブ化され、「Siri」...

...

研究によると、AppleのCSAMスキャンアルゴリズムは簡単に騙される可能性がある

最近、インペリアル・カレッジ・ロンドンの研究チームは、画像の内容を変えずに画像内容をスキャンするアル...

新たな勢力が市場に参入、コンパイラーの巨匠クリス・ラトナーが自らのビジネスを始める

「私たちのチームは、世界最大かつ最先端のテクノロジー企業出身者で構成されています。世界クラスの才能あ...

...

70年前、彼は試験を避けたかったが、インターネット全体に影響を与えた

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

顔認識:攻撃の種類となりすまし防止技術

コンピュータサイエンスとエレクトロニクスの急速な発展により、顔認証は現在、指紋に次いで世界第2位の市...

...

北京ソフトウェア協会が「人工知能委員会」の設立準備を進め、アジアインフォテクノロジーズの欧陽葉博士が委員長に選出される

10月26日、中国科学技術協会社会サービスセンターの支援を受けて、北京ソフトウェア情報サービス協会(...

非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...

...

eSIM テクノロジーはどのようにしてグローバル BVLOS ドローンの運用を簡素化できるのでしょうか?

近年、ドローンは農業から物流、世界的な軍事作戦まで、多くの産業に革命をもたらしました。 これらの飛行...