Facebook の MusicGen を使用してテキストを音楽に変換する方法

Facebook の MusicGen を使用してテキストを音楽に変換する方法

翻訳者 |ブガッティ

レビュー | Chonglou

MusicGen を使用すると、誰でもテキスト キューだけを使用してオリジナルの音楽を生成できますこのガイドでは、このクリエイティブなAIモデルを使用して音楽ワークフローを改善する方法について説明します

新しい曲を書くとき、創作上の壁にぶつかることはありますか?あるいは、新しいメロディーやハーモニーを考え出すのを手伝ってくれるAIアシスタントが欲しいです? FacebookMusicGenモデルにより、音楽の創造性と実験が迅速かつ簡単に実現します

見てみましょう:

  • MusicGenはテキストから音楽を生成するツールです
  • Replicate の API 経由でMusicGen を使用するための手順説明
  • AIModels.fyiを使用して同様の音楽作曲モデルを見つけます

MusicGen が、ミュージシャン、作曲家、そしてユニークで完成した音楽を作りたいと考えているすべての人にとって、新しい創造の可能性をどのように解き放つをご覧ください

テキストプロンプトでオリジナルの音楽を生成する

MusicGen を使用すると、雰囲気、ジャンル、楽器などをテキストで記述するだけで、音楽のアイデアを思いつくことができますテキストから音楽を生成するため創造的な方法いくつか紹介します

  • 創造的なブロックを克服する-行き詰まったらテキストの説明に基づいて新しいメロディーや合唱のアイデアを考え出します。
  • 実験と反復-テキストプロンプトを微調整することで、簡単にバリエーションを試すことができます
  • 新しいジャンルを探索しあまり馴染みのないスタイルで独自の音楽を作りましょう
  • バックグラウンド ミュージックの作成-ビデオポッドキャストゲームなどカスタム バックグラウンドミュージックを作成します
  • メロディーのリミックス-既存のメロディーを使用してモデルをトレーニングし、異なるメロディーを生成します

MusicGen は.mp3または.wav形式選択して、最長 8 秒の制作グレードのクリップを提供しますサンプルはインスピレーションの素材として使用したり作品に直接追加したりできます

MusicGen モデルの紹介

MusicGenは2023年FacebookのAI研究チームによって作成されました。これは、ライセンスされた音楽データトレーニングされた自己回帰Transformerモデルです

このモデルは、ベース、ドラム、ハーモニーなどさまざまな音楽要素を表す4 つの並列メロディ ストリームを生成できますこの構造により、幅広いジャンルやスタイルにわたって音楽的に一貫性のある作品を生み出すことができます

MusicGen はさまざまなサイズモデルをいくつか提供しています Replicate で使用される基本モデルはテキストからオーディオへの生成最適化されMelodyですメロディックサスティン最適化された、より大きなモデルもあります

モデル アーキテクチャの詳細については、Facebook Research の論文とプロジェクトの GitHub ページをご覧ください。

モデルの限界

すべてのAIモデルと同様に、MusicGen にもいくつかの制限があります

  • MusicGen の出力は、提供されたキューとメロディーによって影響を受けます。創造的なインプットは、生成される作品の品質と独自性大きな影響を与える可能性があります
  • モデルのトレーニング データは、その音楽スタイルと出力に影響を与えます。あらゆる音楽ジャンルやスタイルを完璧に再現できるとは限りません
  • MusicGen で生成された音楽は望ましい完成度レベルに達するために後処理が必要になる場合があります

これらの制限を理解することで、自分の期待(またはクライアントの期待) を妥当な範囲保ちながら、MusicGen を最大限に活用できるようになります

MusicGen の入力と出力を理解する

入力

  • model_version :生成するモデルのバージョンを選択します(例: 「 melody 」、「 large 」、「 encode-decode 」)
  • プロンプト:生成したい音楽の説明を入力します。
  • input_audio :オーディオファイルを提供することで、生成される音楽に影響を与えます
  • 継続時間:生成されるオーディオの継続時間を指定します
  • 継続:生成された音楽が入力オーディオのメロディーを継続するかどうかを選択します
  • top_k、top_p、 temperatureなどのパラメータを使用すると、出力を微調整できます。

出力

出力モードは、生成されたオーディオ ファイルを指す URI を表す文字列です

MusicGenモデルの使用に関するステップバイステップガイド

このセクションでは、MusicGen モデルを効果的に使用して音楽作品を生成する方法について詳しく説明しますステップには、特定のコード スニペット、何が起こっているかについての説明が付属しています

ステップ1 : Node.jsクライアントソフトウェアをインストールする

まず、 Replicate用のNode.js クライアントソフトウェアをインストールする必要があります。このクライアントソフトウェアを使用すると、Replicate API対話し MusicGen モデルを実行できるようになります

npm install replicate

このコマンドは、「replicate」と呼ばれる必要な Node.jsパッケージをインストールします

ステップ2 : APIトークンを設定する

Replicate APIにアクセスする前に、API トークンを環境変数として設定する必要があります。このトークンは API へのリクエストを認証します。

export REPLICATE_API_TOKEN=your_api_token

your_api_token を実際のReplicate A PI トークン交換します

ステップ3 :モデルを実行し音楽を生成する

ここで MusicGen モデルを実行して、指定された入力に基づいて音楽を生成してみましょう。 API リクエストを行うには、 Node.js クライアントソフトウェアを使用します。

 import Replicate from "replicate"; // Create a Replicate client instance const replicate = new Replicate({ auth: process.env.REPLICATE_API_TOKEN, }); // Define input parameters for the model const modelVersion = "melody"; const prompt = "Expressive piano melody"; const duration = 10; // Duration of the generated audio in seconds // Run the MusicGen model const output = await replicate.run( "facebookresearch/musicgen:7a76a8258b23fae65c5a22debb8841d1d7e816b75c2f24218cd2bd8573787906", { input: { model_version: modelVersion, prompt: prompt, duration: duration, // Other input parameters here }, } ); console.log("Generated audio URI:", output);

このコードスニペットでは:

  • インストールされた Node.js パッケージからReplicateクラスをインポートします
  • API トークンを使用して、 Replicateクライアントソフトウェアインスタンスを作成しました
  • 音楽作成のためのモデルバージョン、プロンプト、および期間を定義します
  • replication.run() メソッドを使用して、指定された入力MusicGenモデルを実行します
  • 生成されたオーディオ URI はコンソールに記録されます。

ステップ4 :生成されたオーディオ閲覧する

モデルを実行すると、生成された楽曲指すオーディオ URIが返されます。この URI を使用して、生成されたオーディオにアクセスし、参照することができます。

それでおしまいこの時点で、MusicGen モデルを使用して入力に基づいて楽曲を作成することができました。

結論は

おめでとう MusicGen モデルを使用した音楽作曲のステップバイステップガイドを完了しましたこれらの手順に従え AI力を活用してユニークで創造的な音楽作品を生成できます。 AI 駆動型音楽の世界を探求し続ける際には、さまざまな入力とパラメータを試して、幅広い音楽の可能性を探ってみてください。ご質問がある場合やさらにサポートが必要な場合は、お気軽にお問い合わせいただくかこのガイドに記載されているリソースを参照してくださいAIで音楽作りを楽しんでください!

原題: Facebook の MusicGen でテキストを音楽に変える方法、著者: Mike Young

<<: 

>>:  九張雲吉DataCanvasマルチモーダル大規模モデルプラットフォームの実践と思考

ブログ    
ブログ    

推薦する

WOT2019 検索推奨アルゴリズムフォーラム: さまざまな分野における AI ベースの検索推奨の実用化

6月21日、WOT2019グローバルテクノロジーサミットとグローバル人工知能テクノロジーサミットが北...

インテリジェントな意思決定理論: AI 主導の意思決定企業の創出

人工知能モデルを使用してより優れた意思決定を促進する方法は、現在非常に注目されている研究テーマです。...

キャッシュ、キャッシュ アルゴリズム、キャッシュ フレームワークの概要

導入私たちは皆、キャッシュについて聞いたことがあります。キャッシュとは何かと尋ねると、完璧な答えが返...

...

...

...

RLHF が LLM トレーニングの鍵となるのはなぜですか? AI専門家が5つの代替案を検討し、Llama 2のフィードバックメカニズムのアップグレードを説明

ChatGPTが主導する大規模言語モデルの時代において、避けては通れないトピックが「人間のフィードバ...

人工知能が初めて小児脳腫瘍治療薬の開発に貢献

専門家は、この画期的な進歩により、人工知能を使って新たながん治療法を開発するという新しい時代が到来す...

普通のプログラマーから人工知能の仕事に転職するにはどうすればいいでしょうか?

人工知能は非常にホットな話題になっています。普通のプログラマーとして、人工知能に転向する方法。プログ...

アンドリュー・ン氏が AI 変革ガイドをリリース: CEO に 5 つのステップで AI 変革を呼びかける

人工知能は間違いなくエンジニアや研究者を変えたが、自社の将来を左右するCEOたちは何をより重視してい...

世界最強のモデル クロード3号が物理・化学を覆す!博士課程の1年間の実験の結果が2時間で解読され、ネットユーザーは「科学的研究はもう存在しない」と叫んだ。

クロード3号は今も奇跡を起こし続けています。公開からわずか数日後、ますます多くの博士号取得者が、未発...

AI企業の成人式:自由が996と衝突し、技術的理想が地上戦争と衝突する

戦争の理由はすべて、例外なく一つのこと、つまり生き残ることにつながります。狼の本能がなければ、生き残...

...

マルチモーダル大規模モデルの最も包括的なレビューはここにあります!マイクロソフトの研究者7人が5つの主要トピックについて協力し、119ページの文書を公開した。

マルチモーダル大規模モデルの最も包括的なレビューはここにあります!マイクロソフトの中国人研究者7名に...

自動運転、論文採点のための人工知能…インテリジェントテクノロジーにはどのような破壊的可能性が秘められているのでしょうか?

[[216050]]教育が人工知能の発展と時代の変化に追いつかなければ、15年後には大学の半数が苦...