翻訳者 |李睿 レビュー | Chonglou 人工知能の幅広い分野において、ディープラーニングは自然言語処理、コンピュータービジョン、音声認識など多くの領域に革命をもたらしました。しかし、研究者や音楽愛好家を同様に魅了する魅力的な分野は、人工知能アルゴリズムを使用した音楽の生成です。 MusicGen は、テキスト キューを魅力的な音楽作品にシームレスに変換できる、最も高度な制御可能なテキストから音楽への変換モデルの 1 つです。 MusicGenとは何ですか?MusicGen は、シンプルさと制御性を備えた音楽生成用に設計された優れたモデルです。 MusicLM などの既存の方法とは異なり、MusicGen は自己教師付きセマンティック表現の必要性を排除することで際立っています。このモデルは、シングルステージの自己回帰トランスフォーマーアーキテクチャを使用し、32kHz エンコーダー トークナイザーを使用してトレーニングされます。注目すべきは、MusicGen が従来の方法とは異なり、一度に 4 つのコードブックすべてを生成できることです。コードブック間にわずかな遅延を導入することで、モデルはそれらを並行して予測する能力を示し、1 秒あたりわずか 50 ステップでオーディオの自己回帰を実現します。この革新的なアプローチにより、音楽生成プロセスの効率と速度が最適化されます。 MusicGen は 20,000 時間のライセンス音楽を使用してトレーニングされました。開発者らは、ShutterStock と Pond5 の音楽データに加え、10,000 曲の高品質音楽トラックの社内データセットでもトレーニングを行いました。 前提条件公式 MusicGen GitHub リポジトリによると:
利用可能なMusicGenモデル事前トレーニング済みモデルには次の 4 種類があります。
実験以下は、MusicGen 大規模モデルを使用して条件付き音楽を生成した出力です。 以下は MusicGen メロディー モデルの出力です。上記の音声とテキスト入力を使用して、次の音声を生成します。 ColabでMusicGenを設定する方法推論を高速化するには、GPU を使用していることを確認してください。 CPU を使用して 10 秒のオーディオを生成するには 9 分かかりますが、GPU (T4) を使用すると 35 秒しかかかりません。 始める前に、Colab に Torch と TorchAudio がインストールされていることを確認する必要があります。 Facebook から AudioCraft ライブラリをインストールします。 必要なライブラリをインポートします。 モデルをロードします。モデルリストは次のとおりです。 設定パラメータ(オプション) : 条件付き音楽生成(テキストを提供することで音楽を生成します)。 無条件の音楽生成: 1.音楽の継続を生成する音楽の続きを作成するには、オーディオ ファイルが必要です。そのファイルをモデルに渡すと、さらに音楽が生成され、追加されます。 メロディー条件生成を生成します: オーディオ ファイルをディスクに書き込みます。 Colab からファイルをダウンロードする場合は、ディスクに WAV ファイルを書き込む必要があります。以下は、WAV ファイルをディスクに書き込む関数です。モデル出力を最初の入力として受け取り、ファイル名を 2 番目の入力として受け取ります。 2.完全な実装(Google Colab ファイル リンク)Meta の MusicGen ライブラリの完全な実装は、Colab ファイルに記載されています。音楽を自由に探索し、作成するために使用します。 結論は要約すると、Audiocraft の MusicGen は強力で制御可能な音楽生成モデルです。将来的には、Audiocraft は AI 生成音楽の将来の発展に向けて刺激的な可能性を秘めています。ミュージシャンでも AI 愛好家でも、Audiocraft の MusicGen は創造性の世界を広げます。 原題: Colab で Meta の MusicGen を使用して音楽を生成する、著者: Mittal Patel |
<<: テーラーメイド:ChatGPTカスタム指示がAIパーソナライゼーション革命をリード
[[416349]]機械学習の分野では、TensorFlow と PyTorch は誰もがよく知っ...
BERT が 11 個の NLP 記録を破って以来、幅広いタスクに適用できる NLP 事前トレーニ...
2050年には人類は「不死」になる!このトピックを見て驚きましたか?驚きましたか?不死は、すべての...
[[431006]]アルゴリズムの速度最適化でボトルネックが発生し、要件を満たすことができませんか?...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
ResearchAndMarkets が発表した最新のレポートによると、2027 年までに世界の人...
海外メディアの報道によると、仮想現実(VR)でオフィスワークを遂行するのは容易ではないという。本当に...
負荷分散デバイスの製造は負荷分散アルゴリズムに基づいているため、ここでその原理を調べてみましょう。ポ...
企業は現在、AIGC の可能性を活かすためにデータ、人材、プロセスを準備することが今後の課題であると...
12月26日、高級品鑑定機関Entrupyは人工知能技術を使用して、さまざまなブランドのハンドバッグ...
背景機械学習コミュニティでは、教師なし学習(または自己教師あり学習)は長い間、最も価値のある分野の ...
[[416531]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...
多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...