MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

MetaはオープンソースのAIツールAudioCraftをリリースしました。これにより、ユーザーはテキストプロンプトを通じて音楽やオーディオを作成できます。

  8月3日(東部時間8月2日)、Metaは、ユーザーがテキストプロンプトを通じて音楽やオーディオを作成できるようにする生成AIツールAudioCraftをオープンソース化しました。

写真3

Meta の公式紹介によると、AudioCraft には 3 つのコア コンポーネントが含まれています。

  • MusicGen: Meta が所有または特別にライセンスした音楽を使用してトレーニングし、テキストプロンプトに基づいて音楽を生成します。
  • AudioGen:トレーニング用のパブリック サウンド効果を使用してオーディオを生成したり、既存のオーディオを拡張したりします。また、環境音 (犬の鳴き声、車のクラクション、木製の床の足音など) も生成できます。
  • EnCodec (改良版):アーティファクトの少ない高品質の音楽を生成したり、オーディオ ファイルをロスレスで圧縮したりできる、ニューラル ネットワーク ベースのオーディオ圧縮デコーダーです。

MusicGen と AudioGen の動作を示すフローチャート

ツールがオープンソース化された後、研究者や実務者は独自のデータセットを使用してモデルをトレーニングできるようになります。同社によると、AudioCraftシリーズのモデルは、高品質のオーディオを安定して長期間生成でき、使いやすく、ミュージシャンやサウンドデザイナーに「インスピレーションを与え」、迅速なブレインストーミングを助け、「新しい方法で作業を繰り返す」ことができるという。

IT Homeの以前の報道によると、Metaは今年6月に、Googleが2017年に発表したTransformerモデルをベースにしたAI言語モデルMusicGenをオープンソース化した。モデル名が示すように、MusicGen は主に音楽生成に使用されます。テキストと既存のメロディーを完全な音楽に変換できます。

AudioCraftプロジェクトアドレス:ここをクリック

<<: 

>>:  スペイン・ラ・リーガ:AIと機械学習でファン体験の変革に取り組む

推薦する

OpenAIのアルトマン氏、ニューヨークタイムズの訴訟に反応: AIはニュース出版社からのトレーニングデータを必要としない

ブルームバーグによると、1月17日、現地時間火曜日にダボスで行われた世界経済フォーラム年次総会で、O...

AI対応データセンターは急速に成長すると予想

企業の人工知能に対する飽くなき需要により、計算集約型の AI アプリケーションを処理するために設計さ...

AI軍拡競争により、将来のAIハードウェアアーキテクチャの開発に3つの主要な方向性が生まれました。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

Boyaのディープラーニング製品がHuman Horizo​​nsの自動運転実現に貢献

ヒューマンホライゾンズテクノロジーズ株式会社は、新エネルギー車、インテリジェントネットワーク、共同交...

NLP ビッグモデルを時系列に適用するにはどうすればよいでしょうか? 5つの方法をまとめました!

最近、カリフォルニア大学は時系列の大規模言語モデルに関する研究のレビューを発表しました。この記事では...

...

AIがバリアフリー時代へ:手話認識・翻訳の応用が意味するものとは?

人々の印象では、AIは「多数派」に属する技術カテゴリーであると私は信じています。いわゆる多数とは、第...

アップル、シアトルのAI研究開発施設を拡張へ

海外メディアの報道によると、アップルは最近シアトルの人工知能研究開発センターのオフィススペースを拡大...

...

...

...

ジャック・マー:機械が人間に取って代わることは決してできない!それは何に代わるのでしょうか?

近年、人工知能、クラウドコンピューティング、ビッグデータ、モノのインターネット、産業用インターネット...