機械学習は音楽界を征服するのに役立ち、あなたは次のヴィンセント・ファングになるでしょう

私はアークティック・モンキーズが大好きですが、彼らはもう何年も新しいシングルをリリースしていません。長い間精神的な栄養が不足していたのですが、ある夜、突然、自給自足できるというアイデアが浮かびました。そこで、簡単なコードを書き、Keras と TensorFlow を使ってテキスト生成モデルをトレーニングし、アークティックモンキーズのまったく新しい曲を書きました。

[[336229]]

しかし、条件が限られているため、本物のアークティック・モンキーズの曲と比較することはできませんが、それでも長い間新曲を聞き逃していた自分を慰めてくれます。

この記事では、このコードについて簡単に紹介します。完全なコードは私の GitHub にあります: https://github.com/Rajwrita/Sequence-Models-for-Literature/blob/master/NLP-AM2.0.ipynb。

まず、Arctic Monkeys のほぼすべての曲のデータセット (https://github.com/Rajwrita/Sequence-Models-for-Literature/blob/master/AM.txt) を構築し、その後このコードの実行を続行して、独自のデータセットを使用してテキストを生成してみます。

輸入

まず、ディープラーニングモデル用の共通データフレーム操作ライブラリと TensorFlow および Keras ライブラリパッケージをインポートする必要があります。

 numpyをnpとしてインポートする
tensorflow.keras.preprocessing.sequenceからpad_sequencesをインポートします
tensorflow.keras.layersから埋め込み、LSTM、高密度、ドロップアウト、双方向をインポートします
tensorflow.keras.preprocessing.textからTokenizer をインポートします
tensorflow.keras.modelsからSequential をインポートします
tensorflow.keras.optimizersからAdam をインポートします
tensorflow.kerasからregularizersをインポートする
tensorflow.keras.utils をkuとしてインポートします。

次に、データをインポートします。

データ = open ( 'AM.txt' ). read ()

次に、テキストにトークナイザーをインストールします。トークナイザーは、コーパス全体をカバーする単語の辞書を生成できます。これは基本的にキーと値のペアです。キーは単語であり、値はその単語に対して生成されたトークンです。つまり、トークナイザーは文の文字列を個々の単語に分割し、各単語に一意の整数値を割り当てます。このステップは非常に重要であり、後続の埋め込みレイヤーデータの準備の基礎となります。

単語インデックスの長さを取得することで、コーパス内の単語の総数を取得できます。これに1を加えることで、外部語彙を導入することができます。対応するコードは次のとおりです。

 tokenizer = Tokenizer()data = open ( 'AM.txt' ). read ()
 tokenizer.fit_on_texts(コーパス)
合計単語数 = len(tokenizer.word_index) + 1

次に、トークンリストを使用してインポートシーケンスを作成します。簡単に言えば、インポートされたシーケンスは Python リストです。テキストコーパスの各行は、トークナイザーを通じてトークンリストを生成します。次のようなテキスト行です:

このプロセスを通じて、これらの単語を表すトークンの文字列に変換されます。これはデータセットの各行に対して実行されます。コードは次のとおりです。

入力シーケンス = []
コーパス内の行の場合:
   token_list = tokenizer.texts_to_sequences([行])[0]
 iが範囲(1, len(token_list))内にある場合:
      n_gram_sequence = トークンリスト[:i+1]
      入力シーケンス.append(n_gram_sequence)

ご覧のとおり、インポートされたシーケンスは、単に文をフレーズに分割し、その後にコーパス内の最長の文の長さを取得したものです。このステップは非常に簡単で、すべての文をループして、最も長い文を見つけるだけです。

 max_sequence_len = max ([len(x) はinput_sequences内のxについて])

ここで、すべてのシーケンスが同じ長さになるようにパディングします。シーケンスをゼロで事前に埋めておくと、ラベル値の抽出が容易になります。ラベル値を取得するには、最後のトークンを取得するだけです。

 input_sequences = np.array(pad_sequences(input_sequences,maxlen=max_sequence_len, padding= 'pre' ))

パディング後、予測値とラベル値が作成され、シリーズは基本的に x 配列と y 配列に分割されます。ここでは Python の slice 属性が使用されます。コードは次のとおりです。

予測子、ラベル = input_sequences[:,:-1]、input_sequences[:,-1]

データが x 配列と y 配列に分割されたので、特定のフレーズの分類予測を行うニューラルネットワークの作成を開始できます。

埋め込みレイヤーから始める

埋め込み層は、単語を理解するあらゆるディープラーニングモデルにとって不可欠な層です。その実際の機能は、同じ意味を持つ単語に同じ数値を割り当てることで、高次元空間から低次元空間にベクトルを投影し、ベクトルに対して直接数学的演算を実行できるようにすることです。

テキストの行では、すべての単語が処理され、ニューラルネットワークで意味が付与されます。最初のパラメーターは単語を扱い、2 番目のパラメーターは描画される単語ベクトルの次元、最後のパラメーターは入力次元のサイズです。これは実際には最長シーケンスの長さから 1 を引いた値です。 1 を減算する理由は、ラベル値を取得するために各シーケンスの最後の単語を切り取るため、結果のシーケンスは最大シーケンス長より 1 少なくなるためです。

モデルを追加します(Embedding(total_words, 100, input_length=max_sequence_len-1))

LSTM (Long Short-Term Memory) レイヤーの追加

画像ソース: unsplash

LSTM レイヤーのセル状態はコンテキスト全体を保存し、次の単語が隣接する単語だけでなく他の単語からも影響を受けることを保証します。

単一の LSTM レイヤーに加えて、積み重ねられた LSTM レイヤーを使用することもできます。双方向 LSTM レイヤーを使用すると、生データを最初から最後まで学習アルゴリズムに入力し、また戻すことができるため、ニューラルネットワークがテキストをより適切に理解できるようになります。双方向 LSTM は、ニューラルネットワークの収束を高速化するのに役立ちます。

シーケンス情報が最終状態に直接渡されるのではなく、2 番目の LSTM レイヤーに渡されるように、戻りシーケンスアノテーションを True に設定します。

モデルを追加します(Bidirectional(LSTM(150, return_sequences = True )))

次に、密なレイヤーを使用して線形関係をさらに捕捉し、上記のレイヤーの出力を単語の確率に変換します。ソフトマックス活性化関数は、すべての入力単語の確率を (-∞,∞) から (0,1) に変換します。

 model.add (密(total_words/2, activation= 'relu' ,
 kernel_regularizer =regularizers.l2(0.01)))model.add (Dense(total_words )
 、活性化 = 'ソフトマックス' ))

ここではカテゴリ分類を行っているため、カテゴリクロスエントロピーの法則を設定する必要があります。オプティマイザに関しては、ここでは Adam オプティマイザが選択されます。

最終段階 — エポック

最後に、モデルのトレーニングには時間がかかります。データセットにはデータがあまりないので、モデルのトレーニングには約 500 エポックかかります。

 history = model.fit(予測子、ラベル、エポック=100、詳細=1)

予測する単語が増えるほど、生成される文字化けした文字も増えます。これは、すべての単語だけでなく、その前後の単語も予測する必要があるため、次の単語の不確実性は常に前の単語よりも高くなるからです。最終的にネットワークが予測したテキストを見てみましょう。

 seed_text = 「私はアークティックモンキーズが大好きで、

十分な単語を網羅したコーパスを構築することで、ニューラルネットワークをコーパス上でトレーニングし、次の単語を予測することで複雑なテキストを予測できるようになります。

機械学習を使えば、コンテンツ制作はもはや難しくありません。このコードを使って、お気に入りの歌手のために曲を書いてみてください。

<<: 心が開かれました！ Adobeなどの研究者が「自撮り」を「他人が撮った写真」に変え、感動的な魔法の写真編集効果を実現

>>: Weilingsi チームは、グラフ同型性の下での同変性と高い計算効率を備えた「自然グラフネットワーク」メッセージパッシングメソッドを提案しました。

ブログ

機械学習は音楽界を征服するのに役立ち、あなたは次のヴィンセント・ファングになるでしょう

企業はどのように AI を活用してビジネスの成長を促進できるのでしょうか?

IoTとAIの組み合わせがもたらす大きなチャンス

休日のAI本リスト：人工知能をしっかり学びたいなら、まずはこの6冊から始めましょう〜

TensorFlow を使い始めるための重要なポイントをここにまとめました。まだ怠ける理由がありますか?

Google による Kaggle の買収が 3 つの世界 (AI、機械学習、データサイエンス) に衝撃を与えたのはなぜでしょうか?

AI動画の「ちらつき」問題が解決しました！動画スタイルを簡単に変更、北京大学卒業生の作品

AIは教育分野で大きな可能性を秘めています。どのように活用できるでしょうか?

人工知能分野で最も有望な技術トップ10

推薦する

快手の生活行動モデリングソリューションTWINは、数年分の過去のビデオをレビューし、ユーザーの隠れた興味を探ることで、KDD 2023に選ばれました。

人工知能によるテキスト検出の実践的有効性に関する議論

解読: ボストンダイナミクスがアルゴリズムを使用してアトラスロボットの感覚世界を構築する方法

CPUのみを使用して自律航行船を開発、実際に実現

2021 年に人工知能が最も大きく発展する分野はどれでしょうか?

AI+中国製 Baidu Brain が蘇州にご招待し、「インテリジェント」製造についてお話しします

人工知能によりデータの痕跡を監視できるようになりました。このとき、ユーザーのプライバシーとセキュリティをどのように維持できるのでしょうか?

AIが業界全体でビジネス成果をどのように変革しているか

文勝ビデオの次の目的地であるメタはすでにビデオ制作を開始している

機械学習はどのような種類のタスクを解決できますか?

AlphaGO よりも強力な人工知能アルゴリズムが登場しました!まさに中国です！

新しいAIシステムが地震を正確に予測できるようになりました

本当に滑らか: 浙江大学、ETH チューリッヒ、CityU が共同で開発した 3D ヘアモデリングの新しい手法、NeuralHDHair