TensorFlow 2 入門ガイド。初心者必見です!

Tensorflow とは何ですか?

TensorFlow は Google が立ち上げたディープラーニングフレームワークで、2019 年に第 2 バージョンがリリースされました。これは世界で最も有名なディープラーニングフレームワークの 1 つであり、業界の専門家や研究者によって広く使用されています。

Tensorflow v1 は Python らしさが欠けていたため、使いにくく理解しにくいものでしたが、Keras を搭載した v2 のリリースにより、Tensorflow.keras と完全に同期され、使いやすく、学習しやすく、理解しやすくなりました。

これはディープラーニングに関する記事ではないので、ディープラーニングの用語とその背後にある基本的な考え方を理解していることを前提としています。

非常に有名なデータセットである IRIS データセットを使用して、ディープラーニングの世界を探索します。

では、早速コードを見てみましょう。

データセットのインポートと理解

sklearn.datasetsからload_irisをインポートする 
アイリス = load_iris()

さて、このアイリスは辞書です。次のコードを使用してキーの値を表示できます。

 >>> iris.keys()  
 dict_keys(['データ', 'ターゲット', 'フレーム', 'ターゲット名', 'DESCR', '機能名', 'ファイル名'])

つまり、データはデータキーに、ターゲットはターゲットキーに、というようになります。このデータセットの詳細を確認するには、iris[['DESCR'] を使用します。

ここで、ニューラルネットワークの作成に役立つ他の重要なライブラリをインポートする必要があります。

 from sklearn.model_selection import train_test_split #データを分割する 
 numpyをnpとしてインポートする 
 pandasをpdとしてインポートする 
 matplotlib.pyplot をpltとしてインポートします。  
テンソルフローをtfとしてインポートする 
 tensorflow.keras.layersからDense をインポートします 
 tensorflow.keras.modelsからSequential をインポートします

ここでは、Tensorflow から Dense と Sequential という 2 つの主要なものをインポートしました。 tensorflow.keras.layers からインポートされた Dense は、密に接続されたレイヤーの一種です。密に接続されたレイヤーとは、前のレイヤーのすべてのノードが現在のレイヤーのすべてのノードに接続されていることを意味します。

Sequential は Keras API であり、Sequential API とも呼ばれ、ニューラルネットワークの構築に使用します。

データをよりよく理解するために、それをデータフレームに変換することができます。やりましょう。

 X = pd.DataFrame(データ = iris.data、列 = iris.feature_names)  
印刷(X.head())

X.head()

ここでは、column = iris.feature_names を設定していることに注意してください。ここで、feature_names は 4 つの機能名すべてを含むキーです。

ターゲットも同様に、

 y = pd.DataFrame(データ = iris.target、列 = ['irisType'])

y.head()

ターゲットセット内のクラスの数を確認するには、次のようにします。

 y.irisType.値カウント()

ここでは、それぞれラベル 0、1、2 を持つ 3 つのクラスがあることがわかります。

 iris.target_names #iris辞書のキー値です

これらは予測する必要があるクラス名です。

機械学習のためのデータ前処理

現在、機械学習の最初のステップはデータの前処理です。データ前処理の主な手順は次のとおりです。

欠損値を入力する
データをトレーニングセットと検証セットに分割する
データを標準化する
カテゴリデータをワンホットベクトルに変換する

欠損値

欠損値があるかどうかを確認するには、pandas.DataFrame.info() を使用できます。

 X.info()

この方法では、（幸運にも）欠損値がなく、すべての機能が float64 形式であることがわかります。

トレーニングセットとテストセットに分割

データセットをトレーニングセットとテストセットに分割するには、先ほど紹介した sklearn.model_selection の train_test_split 関数を使用できます。

 X_train、X_test、y_train、y_test = train_test_split(X、y、test_size=0.1)

ここで、test_size は、データセット全体の 10% をテストデータとして使用するというステートメントです。

データの標準化

一般的に、データの偏差が非常に大きい場合は、データを標準化します。偏差値を確認するには、pandas.DataFrame の var() 関数を使用して、すべての列の偏差値を確認します。

 X_train.var()、X_test.var()

ご覧のとおり、X_train と X_test の両方の偏差値は非常に低いため、データを標準化する必要はありません。

カテゴリデータをワンホットベクトルに変換する

出力データは、iris.target_name を使用してすでに確認した 3 つのクラスのいずれかになることがわかっているので、ターゲットをロードすると、すでに 0,1,2 の形式 (0 = クラス 1、1 = クラス 2 など) になっているという朗報があります。

この表現の問題点は、モデルが大きな数値に高い優先順位を与える可能性があり、偏った結果につながる可能性があることです。したがって、この問題を解決するには、ワンホット表現を使用します。人気のあるキャリアの詳細については、こちらをご覧ください。組み込みの KERS TO_CATEGRICAL を使用することも、skLearn の OneHotEncoding を使用することもできます。 to_classical を使用します。

 y_train = tf.keras.utils.to_categorical(y_train)  
 y_test = tf.keras.utils.to_categorical(y_test)

正しく変換されたかどうかを確認するために、最初の 5 行のみをチェックします。

 y_train[:5,:]

はい、独自の表現に変換しました。

最後に

最後に、データを Numpy 配列に変換し直して、後でモデルで役立つ追加の関数を使用できるようにします。これを行うには、

 X_train = X_train.値   
 X_test = X_test.値

最初のトレーニング例の結果を見てみましょう。

 X_トレイン[0]

ここでは、最初のトレーニング例の4つの特徴の値を見ることができます。その形状は（4）です。

to_Category を使用する場合、ターゲットラベルはすでに配列形式になっています。

機械学習モデル

これで、ようやくモデルを作成してトレーニングする準備が整いました。まず簡単なモデルから始め、次に複雑なモデル構造に移り、Keras のさまざまなトリックとテクニックを紹介します。

基本モデルをコーディングしてみましょう

model1 = Sequential() #シーケンシャルオブジェクト

まず、Sequential オブジェクトを作成する必要があります。モデルを作成するには、選択に応じてさまざまなタイプのレイヤーを追加するだけです。過剰適合を観察し、後でさまざまな正規化手法を使用して過剰適合を削減できるように、10 層の高密度レイヤーモデルを作成します。

 model1. add ( Dense( 64, activation = 'relu' , input_shape = X_train[0].shape))  
 model1. add ( 密度 (128, アクティベーション = 'relu' )  
 model1. add ( 密度 (128, アクティベーション = 'relu' )  
 model1. add ( 密度 (128, アクティベーション = 'relu' )  
 model1. add ( 密度 (128, アクティベーション = 'relu' )  
 model1. add ( 密度 (64, アクティベーション = 'relu' )  
 model1. add ( 密度 (64, アクティベーション = 'relu' )  
 model1. add ( 密度 (64, アクティベーション = 'relu' )  
 model1. add ( 密度 (64, アクティベーション = 'relu' )  
 model1. add ( 密度 (3, アクティベーション = 'softmax' )

最初のレイヤーでは、追加のパラメータ INPUT_Shape を使用していることに注意してください。このパラメータは、最初のレイヤーのサイズを指定します。この場合、トレーニング例の数は気にしません。代わりに、私たちは機能の数だけを気にします。したがって、任意のトレーニング例の形状を渡します。この場合、input_Shape 内の (4,) です。

これは多クラス分類問題なので、出力層で Softmax (活性化関数) を使用していることに注意してください。これがバイナリ分類問題であれば、シグモイド活性化関数を使用します。

シグモイド、線形、tanh など、任意の活性化関数を渡すことができますが、実験により、このタイプのモデルでは relu が最も優れたパフォーマンスを発揮することがわかっています。

モデルの形状を定義したら、次のステップでは損失、オプティマイザー、メトリックを指定します。これらのパラメータは、keras の Compile メソッドを使用して指定します。

 model1.compile(オプティマイザー= 'adam' 、損失= 'categorical_crossentropy' 、メトリック= [ 'acc' ])

ここでは、確率的勾配降下法、RMSProp などの任意の最適化ツールを使用できますが、ここでは Adam を使用します。

ここでは、マルチクラス分類の問題があるために CATEGRICAL_CROSENTROPY を使用します。バイナリ分類の問題がある場合には、BINARY_CROSENTROPY を使用します。

メトリックはモデルを評価する上で重要です。さまざまな指標に基づいてモデルを評価できます。分類の問題の場合、最も重要な指標は予測の正確さを示す精度です。

モデルの最後のステップは、それをトレーニングデータとトレーニングラベルに適合させることです。コーディングしてみましょう。

 history = model1.fit(X_train, y_train, batch_size = 40, epochs = 800, validation_split = 0.1

fit はトレーニングのすべての履歴を含むコールバックを返します。これを使用して、プロットなどのさまざまな便利なタスクを実行できます。

履歴コールバックには history という属性があり、これは history.history としてアクセスできます。これは、すべての損失とメトリックの履歴を含む辞書です。つまり、このケースでは、Loss、Acc、val_loses、val_acc の履歴があり、それぞれの履歴には history.history.loss または history.history['val_acc'] などとしてアクセスできます。

指定されたエポック数は 800、バッチサイズは 40、検証分割は 0.1 です。つまり、トレーニングの分析に使用する検証データが 10% になったことになります。 800 エポックを使用すると、データがオーバーフィットします。つまり、トレーニングデータでは非常に良好なパフォーマンスが得られますが、テストデータでは良好なパフォーマンスが得られません。

モデルがトレーニングされると、トレーニングセットと検証セットの両方で損失と精度を確認できます。

ここでは、トレーニングセットの精度が 100%、検証セットの精度が 67% であることがわかります。これは、このようなモデルとしては優れた結果です。次に、画像を描いてみましょう。

 plt.plot(履歴.履歴[ 'acc' ])  
 plt.plot(履歴.履歴[ 'val_acc' ])  
 plt.xlabel( 'エポック' )  
 plt.ylabel( 'Acc' )  
 plt.legend([ 'トレーニング' , '検証' ], loc= '右上' )

トレーニングセットの精度が検証セットの精度よりもはるかに高いことがはっきりとわかります。

同様に、損失を次のようにプロットします。

 plt.plot(history.history[ '損失' ])  
 plt.plot(history.history[ 'val_loss' ])  
 plt.xlabel( 'エポック' )  
 plt.ylabel( '損失' )  
 plt.legend([ 'トレーニング' , '検証' ], loc= '左上' )

ここでは、検証セットの損失がトレーニングセットの損失よりもはるかに大きいことがはっきりとわかります。これは、データが過剰適合されているためです。

モデルが適切に機能するかどうかを確認するには、model.evaluate を使用してチェックします。データとラベルを評価関数に入力します。

モデル1.評価(X_テスト、y_テスト)

したがって、モデルの精度は 88% であり、過剰適合モデルとしては非常に良好であることがわかります。

正規化

モデルに正規化を追加して、さらに改善してみましょう。正規化により、モデルの過剰適合が軽減され、モデルが改善されます。

モデルに L2 正則化を追加します。 L2 正規化の詳細については、ここをクリックしてください。モデルに L2 正則化を追加するには、正則化を追加するレイヤーを指定し、追加のパラメーター kernel_Regularizer を指定してから、tf.keras.Regularizers.l2() を渡す必要があります。

また、モデルにドロップアウトを実装することで、オーバーフィッティングを減らし、パフォーマンスを向上させることができます。ドロップアウトの理論と動機について詳しくは、この記事をご覧ください。

このモデルを再定義してみましょう。

 model2 = シーケンシャル()  
 model2. add (Dense(64, activation = 'relu' , input_shape = X_train[0].shape))  
 model2.add ( Dense(128, activation = 'relu' , kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(128、アクティベーション = 'relu' 、kernel_regularizer = tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (tf.keras.layers.Dropout(0.5)  
 model2.add (Dense(128、アクティベーション = 'relu' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(128、アクティベーション = 'relu' 、kernel_regularizer = tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(64、アクティベーション = 'relu' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(64、アクティベーション = 'relu' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (tf.keras.layers.Dropout(0.5)  
 model2.add (Dense(64、アクティベーション = 'relu' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(64、アクティベーション = 'relu' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))  
 model2.add (Dense(3、アクティベーション = 'softmax' 、kernel_regularizer=tf.keras.regularizers.l2(0.001)  
 ))

よく観察すると、2 つのドロップアウトレイヤーと各密なレイヤーに正規化を追加したことを除いて、すべてのレイヤーとパラメーターは同じであることがわかります。

その他すべて (損失、オプティマイザー、エポックなど) は同じままにします。

 model2.compile(オプティマイザー= 'adam' 、損失= 'categorical_crossentropy' 、メトリック=[ 'acc' ])  
 history2 = model2.fit(X_train、y_train、エポック=800、validation_split=0.1、batch_size=40)

それではモデルを評価しましょう。

なんと、正規化レイヤーとドロップアウトレイヤーを追加することで、精度が 88% から 94% に向上しました。 BN 層を追加すると、さらに改善されます。

描いてみましょう。

正確さ

plt.plot(history2.history[ 'acc' ])  
 plt.plot(history2.history[ 'val_acc' ])  
 plt.title( '精度とエポック' )  
 plt.ylabel( 'Acc' )  
 plt.xlabel( 'エポック' )  
 plt.legend([ 'トレーニング' , '検証' ], loc= '右下' )  
 plt.show()

 plt.plot(history2.history[ '損失' ])  
 plt.plot(history2.history[ 'val_loss' ])  
 plt.title( '損失とエポック' )  
 plt.ylabel( '損失' )  
 plt.xlabel( 'エポック' )  
 plt.legend([ 'トレーニング' , '検証' ], loc= '右上' )  
 plt.show()