機械学習に必須: TensorFlow を使用するための 11 のヒント

[[326623]]

TensorFlow 2.x は、モデルの構築と全体的な使用において多くの利便性を提供します。それで、tf の新機能は何ですか?

Keras を使用した簡単なモデル構築。
あらゆるプラットフォームでの本番環境における堅牢なモデル展開。
強力な研究実験。
廃止されたAPIをクリーンアップすることでさまざまな手順を簡素化

この記事では、TensorFlow API の一部である関数/クラスにより、TensorFlow の使用がスムーズになり、コード行数が削減され、効率が向上する TF 2.0 の 10 の機能について説明します。

1. 入力パイプラインを構築するためのtf.data API

tf.data API は、データパイプラインと関連操作の機能を提供します。パイプラインの構築、前処理関数のマッピング、データセットのシャッフルやバッチ処理などを行うことができます。

テンソルを使用したパイプラインの構築

>>> データセット = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ])
 >>> iter(データセット).next().numpy()
 8

データセットのシャッフルとバッチ処理

# シャッフル
>>> データセット = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ]).shuffle( 6 )
 >>> iter(データセット).next().numpy()
 0
 # バッチ
>>> データセット = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ]).batch( 2 )
 >>> iter(データセット).next().numpy()
配列([ 8 , 3 ], dtype=int32)
 # シャッフルとバッチ
>>> データセット = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ]).shuffle( 6 ).batch( 2 )
 >>> iter(データセット).next().numpy()
配列([ 3 , 0 ], データ型=int32)

2つのデータセットを圧縮する

>>> dataset0 = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ])
 >>> dataset1 = tf.data.Dataset.from_tensor_slices([ 1 , 2 , 3 , 4 , 5 , 6 ])
 >>> データセット = tf.data.Dataset.zip((データセット0, データセット1))
 >>> iter(データセット).next()
 (<tf.Tensor: shape=(), dtype=int32, numpy= 8 >、<tf.Tensor: shape=(), dtype=int32, numpy= 1 >)

外部関数のマッピング

def into_2(数値):
数値 * 2を返す
>>> データセット = tf.data.Dataset.from_tensor_slices([ 8 , 3 , 0 , 8 , 2 , 1 ]).map(into_2)
 >>> iter(データセット).next().numpy()
 16

2. 画像データジェネレータ

これは、tensorflow.keras API の最も優れた機能の 1 つです (私の意見では)。画像データジェネレーターは、バッチ処理と前処理中にデータセットのスライスを生成し、リアルタイムでデータ拡張を実行できます。

ジェネレーターを使用すると、ディレクトリまたはデータフレームから直接データをストリーミングできます。

画像データジェネレーターにおけるデータ拡張に関する誤解は、既存のデータセットにさらにデータを追加するというものです。これはデータ拡張の実際の定義ですが、画像データジェネレーターでは、データセット内の画像はトレーニングプロセス中のさまざまなステップでオンザフライで変換されるため、モデルはこれまで見たことのないノイズの多いデータでトレーニングできます。

 train_datagen = イメージデータジェネレータ(
        再スケール = 1 ./ 255 、
        せん断範囲 = 0.2 、
        ズーム範囲 = 0.2 、
        水平反転=True
 ）

ここでは、すべてのサンプルが（正規化のために）再スケーリングされ、他のパラメータは拡張のために使用されます。

 train_generator = train_datagen.flow_from_directory(
 'データ/トレーニング' 、
        ターゲットサイズ=( 150 , 150 ),
        バッチサイズ = 32 、
        class_mode = 'バイナリ'
 ）

リアルタイムデータストリームのディレクトリを指定します。これは、データフレームを使用して行うこともできます。

 train_generator = flow_from_dataframe(
    データフレーム、
    x_col = 'ファイル名' 、
    y_col = 'クラス' 、
    class_mode = 'カテゴリ' 、
    バッチサイズ = 32
 ）

x_col パラメータは画像への完全なパスを定義し、y_col パラメータは分類のラベル列を定義します。

このモデルは発電機で直接電力を供給することができます。 steps_per_epoch パラメータを指定する必要がありますが、実際にはサンプル数/バッチサイズになります。

モデル.フィット(
    列車ジェネレータ、
    検証データ=val_generator、
    エポック=EPOCHS、
    steps_per_epoch = (num_samples // batch_size)、
    validation_steps=(num_val_samples // batch_size)
 ）

3. tf.image を使用したデータ拡張

データの拡張が必要です。データが不十分な場合は、データを変更して個別のデータポイントとして扱うことが、より少ないデータでトレーニングを行う非常に効果的な方法です。

tf.image API には画像を変換するためのツールがあり、これは後で前述の tf.data API を介してデータ拡張に使用できます。

反転 = tf.image.flip_left_right(画像)
視覚化する(画像、反転)

上記のコードの出力は次のようになります。

飽和 = tf.image.adjust_saturation(画像、 5 )
視覚化する(画像、飽和)

上記のコードの出力は次のようになります。

回転 = tf.image.rot90(画像)
視覚化(画像、回転)

上記のコードの出力は次のようになります。

切り取られた画像 = tf.image.central_crop(画像、central_fraction= 0.5 )
視覚化(画像、切り抜き)

上記のコードの出力は次のようになります。

4.TensorFlowデータセット

pip で tensorflow-datasets をインストールします

これは、Tensorflow によって収集されたさまざまなドメインからの非常によく知られたデータセットをダンプするための唯一の出発点であるため、非常に便利なライブラリです。

 tensorflow_datasets を tfds としてインポートする
mnist_data = tfds.load( "mnist" )
 mnist_train、mnist_test = mnist_data[ "train" ]、mnist_data[ "test" ]
 isinstance(mnist_train、tf.data.Dataset)をアサートする

Tensorflow データセットは次のリンクにあります。

https://www.tensorflow.org/datasets/catalog/overview

オーディオ、画像、画像分類、オブジェクト検出、構造化、要約、テキスト、翻訳、ビデオは、tfds によって提供されるタイプです。

5. 事前学習済みモデルに基づく転移学習

転移学習は機械学習における新たなホットなトピックです。ベースラインモデルがすでに他の誰かによってトレーニングされている場合、そのモデルはもはや適用可能でも実用的でもありません。転移学習は、事前トレーニング済みのモデルを特定のユースケースに再利用したり、異なるユースケースに拡張したりすることでこの問題を解決します。

TensorFlow は、目的のユースケースに簡単に拡張できるベースラインの事前トレーニング済みモデルを提供します。

ベースモデル = tf.keras.applications.MobileNetV2(
    入力シェイプ=IMG_SHAPE、
    include_top=False、
    重み = 'imagenet'
 ）

この base_model は、追加のレイヤーや異なるモデルを使用して簡単に拡張できます。次に例を示します。

モデル = tf.keras.Sequential([
    ベースモデル、
    グローバル平均レイヤー、
    予測レイヤー
])

6. 見積もり

推定器は TensorFlow の完全なモデルの高レベル表現であり、簡単にスケーリングして非同期的にトレーニングできるように設計されています - TensorFlow ドキュメント

事前に作成された推定器は非常に高レベルのモデル抽象化を提供するため、低レベルの複雑さを気にすることなく、モデルのトレーニングに直接集中できます。例えば：

線形推定 = tf.estimator.線形分類器(
    機能列=機能列
）
線形推定のトレーニング(train_input_fn)
結果 = linear_est.evaluate(eval_input_fn)

これは、tf.estimator を使用して推定器を構築およびトレーニングするのが非常に簡単であり、推定器をカスタマイズすることもできることを示しています。

TensorFlow には、LinearRegressor、BoostedTreesClassifier など、事前に作成された推定器が多数あります。詳細については、Tensorflow のドキュメントをご覧ください。

7. カスタムレイヤー

ニューラルネットワークは、さまざまな種類の層を持つ多層のネットワークとしてよく知られています。 TensorFlow には、多くの定義済みレイヤー (Dense、LSTM など) が含まれています。しかし、より複雑なアーキテクチャの場合、レイヤーのロジックはメインレイヤーよりもはるかに複雑になります。このような場合、TensorFlow ではカスタムレイヤーを構築できます。これは、tf.keras.layers.Layer クラスをサブクラス化することで実行できます。

クラスCustomDense(tf.keras.layers.Layer):
    def __init__(self, num_outputs):
スーパー(CustomDense、self).__init__()
        自己.num_outputs = num_outputs
    def build(self, input_shape):
        自己.カーネル = 自己.重みを追加します(
 「カーネル」 、
            形状 = [ int (input_shape[- 1 ]),
            自己.num_outputs]
        ）
    def call(self, 入力):
 tf.matmul(入力、self.kernel)を返します。

ドキュメントに記載されているように、独自のレイヤーを実装する最良の方法は、tf.keras.Layer クラスを拡張して以下を実装することです。

__init__ は、入力に依存しないすべての初期化を実行する場所です。
構築。入力テンソルの形状がわかっており、残りの初期化を実行できます。
呼び出して、前方計算を実行できます。

カーネルの初期化は __init__ 自体で実行できますが、ビルドで実行した方がよいでしょう。そうしないと、新しいレイヤーを作成するたびに input_shape を明示的に指定する必要があります。

8. カスタマイズされたトレーニング

tf.keras シーケンスおよびモデル API を使用すると、モデルのトレーニングが容易になります。ただし、複雑なモデルをトレーニングする場合は、ほとんどの場合、カスタム損失関数が使用されます。さらに、モデルのトレーニングはデフォルトのトレーニングとは異なる場合があります (たとえば、異なるモデルコンポーネントに個別に勾配を適用するなど)。

TensorFlow の自動微分化は、勾配を効率的に計算するのに役立ち、これらのプリミティブはカスタムトレーニングループを定義するために使用されます。

 def train(モデル、入力、出力、学習率):
    tf.GradientTape() を t として使用します:
        # モデル予測からの損失の計算
        current_loss = loss(出力、モデル(入力))
    # 得られた損失を持つ訓練可能な変数の勾配
    dW, db = t.gradient(current_loss, [model.W, model.b])
    # 重みにグラデーションを適用する
    モデル.W.assign_sub(学習率 * dW)
    model.b.assign_sub(学習率 * db)

このサイクルは、ユースケースに応じてよりカスタマイズされた設定で、複数の期間にわたって繰り返すことができます。

9. チェックポイント

TensorFlow モデルの保存には 2 つの方法があります。

SavedModel: モデルの完全な状態とすべてのパラメータを保存します。これはソースコードとは関係ありません。

 model.save_weights( 'チェックポイント' )

チェックポイント

チェックポイントは、モデルで使用されるすべてのパラメータの正確な値をキャプチャします。 Sequential API または Model API を使用して構築されたモデルは、SavedModel 形式で簡単に保存できます。

ただし、カスタムモデルの場合はチェックポイントが必要です。

チェックポイントには、モデルによって定義された計算の説明は含まれていないため、通常は、保存されたパラメータ値を使用するソースコードが利用可能な場合にのみ役立ちます。

チェックポイントを保存

checkpoint_path = "save_path"
 # チェックポイントの定義
ckpt = tf.train.Checkpoint(モデル = モデル、オプティマイザ = オプティマイザ)
 # CheckpointManager オブジェクトの作成
ckpt_manager = tf.train.CheckpointManager(ckpt、チェックポイントパス、max_to_keep= 5 )
 # モデルの保存
ckpt_manager.save()

チェックポイントからロード

TensorFlow は、ロードされたオブジェクトから開始して、名前付きエッジを持つ有向グラフをトラバースすることにより、変数をチェックポイント値に一致させます。

ドキュメントを介したモデル回復のための依存関係グラフ

ckpt_manager.latest_checkpointの場合:
    ckpt.restore(ckpt_manager.latest_checkpoint)

10. ケラスチューナー

これは TensorFlow のかなり新しい機能です。

 !pip keras-tuner をインストールします

ハイパーパラメータチューニング (ハイパーチューニング) は、ML モデルの構成を定義するパラメータを選択するプロセスです。これらの要素は、特徴エンジニアリングと前処理後のモデルのパフォーマンスを決定づけるものです。

 # model_builderはモデルを構築して返す関数です
チューナー = kt.Hyperband(
    モデルビルダー、
    目標 = 'val_accuracy' 、
    最大エポック = 10 、
    係数 = 3 、
    ディレクトリ = 'my_dir' 、
    プロジェクト名 = 'intro_to_kt'
 ）

ハイパーランドに加えて、ベイジアン最適化とランダムサーチもチューニングに使用できます。

チューナー.検索(
    画像_train、ラベル_train、
    エポック = 10 、
    検証データ=(画像テスト、ラベルテスト)、
    コールバック=[ClearTrainingOutput()]
 ）
 # 最適なハイパーパラメータを取得する
best_hps = チューナー.get_best_hyperparameters(num_trials= 1 )[ 0 ]

さらに、最適なハイパーパラメータを使用してモデルをトレーニングします。

モデル = tuner.hypermodel.build(best_hps)
モデル.フィット(
    画像_列車、
    ラベル_トレイン、
    エポック = 10 、
    検証データ=(画像テスト、ラベルテスト)
 ）

11. 分散トレーニング

複数の GPU があり、トレーニングループを複数の GPU に分散してトレーニングを最適化したい場合は、TensorFlow のさまざまな分散トレーニング戦略によって GPU の使用を最適化し、GPU でのトレーニングを処理できます。

MirroredStrategy は最も一般的に使用される戦略です。どのように機能しますか?

すべての変数とモデルグラフがレプリカにコピーされます。
入力はレプリカ間で均等に分散されます。
各レプリカは、受信した入力の損失と勾配を計算します。
これらの勾配は、すべてのレプリカを合計することによって同期されます。
同期後、各レプリカ上の変数のコピーに対して同一の更新が行われます。

戦略 = tf.distribute.MirroredStrategy()
 strategy.scope() を使用する場合:
    モデル = tf.keras.Sequential([
        tf.keras.layers.Conv2D(
 32 、 3 、活性化= 'relu' 、入力形状=( 28 、 28 、 1 )
        ）、
        tf.keras.layers.MaxPooling2D()、
        tf.keras.layers.Flatten()、
        tf.keras.layers.Dense( 64 、アクティベーション= 'relu' )、
        tf.keras.layers.dense( 10 ) の構文
    ])
    モデル.コンパイル(
        損失 = "sparse_categorical_crossentropy" 、
        オプティマイザー = "adam" 、
        メトリック=[ '精度' ]
    ）