たった 10 行のコードでディープラーニングを実行できますか? PaddlePaddleフレームワークの高レベルAPIでAIを簡単に操作しよう

高レベルAPIとは

ディープラーニングは、人工知能時代の中核技術として、近年、学術界と産業界の両方でますます重要な役割を果たしています。しかし、ディープラーニングの理論は習得が難しすぎる上、開発プロセスも複雑すぎるため、多くの人がディープラーニングから遠ざかっています。

ディープラーニングの学習プロセスを簡素化し、ディープラーニング開発の難易度を軽減するために、Baidu PaddlePaddle フレームワークは 1 年近くの改良を経て、ディープラーニング API を継続的に最適化し、開発者の使用シナリオに合わせてカプセル化してきました。最新バージョンの PaddlePaddle フレームワークでは、高度な統合と科学的な統一性を備えた新しい PaddlePaddle API システムがリリースされました。

PaddlePaddle フレームワークは、API を基本 API と高レベル API の 2 種類に分類します。ピザ作りを例にとると、一般的に2つの方法があります。1つは小麦粉、牛乳、ハムなどの材料を用意し、丁寧に加工しておいしいピザを作る方法です。2つ目は、販売者から焼き上がったピザと用意された具材を購入し、ピザを直接温めて食べる方法です。

では、これら 2 つの方法の違いは何でしょうか?方法 1 を使用すると、自分で材料を用意し、料理を混ぜ合わせ、好みに合わせてソースを作り、さまざまな味を満足させることができます。ただし、これは「経験豊富な人」に適しています。初心者の場合は、惨めに失敗する可能性があります。方法 2 は、販売者から事前に焼かれたピザとフィリングを使用し、直接加熱して非常に迅速にピザを作ることです。味は保証されます。ただし、方法 1 と比較すると、味の選択肢は少なくなります。

フレームワークを例に挙げると、基本 API は方法 1 に対応し、高レベル API は方法 2 に対応します。基本 API を使用すると、制限なしに好きなように独自のディープラーニングモデルを構築できます。方法 2 を使用すると、モデルを迅速に実装できますが、自律性が低くなる可能性があります。

ただし、ピザを作るのとは異なり、PaddlePaddle フレームワークを使用すると、両方の長所を活かすことができます。高レベル API 自体は独立したシステムではないため、基本 API と組み合わせて使用することで高レベルと低レベルの統合を実現でき、より便利に使用できるようになります。これにより、開発プロセス中に高レベル API の利便性を考慮しながら、基本 API のパワーを享受できるようになります。

高レベルAPI、すべて

PaddlePaddle フレームワークの高レベル API の全体像は次のとおりです。

図からわかるように、PaddlePaddle フレームワークの高レベル API は、データの読み込み、モデルの構築、モデルのトレーニング、モデルの視覚化、高レベルの使用の 5 つのモジュールで構成されています。 PaddlePaddle フレームワークは、さまざまな使用シナリオに合わせてさまざまな高レベル API を提供し、開発の難易度を軽減し、誰もが簡単にディープラーニングを始められるようにします。

まず、ディープラーニングにおける典型的な手書き数字分類タスクを通じて、PaddlePaddle の高レベル API を簡単に見てみましょう。次に、各モジュールに含まれる API について詳しく紹介します。

輸入パドル
paddle.vision.transforms からCompose、Normalize をインポートします
paddle.vision.datasetsからMNISTをインポートする
paddle.nnをnnとしてインポートする
 
 # ここではデータの前処理、正規化が使用されます
変換 = Compose([正規化(平均=[ 127.5 ],
                               標準偏差 = [ 127.5 ],
                               データフォーマット = 'CHW' )]) 
 
 # データの読み込み、トレーニング セットにデータ前処理操作を適用する
train_dataset = paddle.vision.datasets.MNIST(モード = 'train' 、transform = transform)
 test_dataset = paddle.vision.datasets.MNIST(モード = 'test' 、変換 = transform) 
 
 # モデルネットワーク
mnist = nn.シーケンシャル(
        nn.フラット化()、
        nn.リニア( 784,512 ) ,
        nn.ReLU()、
        nn.ドロップアウト( 0.2 )、
        nn.リニア( 512,10 )) 
 
 # モデルのカプセル化、モデルクラスによるカプセル化
モデル = paddle.Model(mnist) 
 
 # モデル構成: モデルのトレーニングの準備、オプティマイザー、損失関数、精度計算方法の設定
モデルを準備します(オプティマイザー=paddle.optimizer.Adam(パラメーター=model.parameters()),
              損失=nn.CrossEntropyLoss()、
              メトリック = paddle.metric.Accuracy()) 
 
 # モデルトレーニング、
モデル.fit(train_dataset,
          エポック = 10 、
          バッチサイズ = 64 、
          詳細 = 1 ) 
 
 # モデル評価、
モデルを評価します(テストデータセット、詳細= 1 ) 
 
 #モデルを保存します。
モデルを保存( 'model_path' )

例からわかるように、データの前処理、データの読み込み、モデルのネットワーク化、モデルのトレーニング、モデルの評価、モデルの保存などのシナリオでは、1 ～ 3 行のコードで高レベル API を実装できます。数十行のコードを必要とする従来の方法と比較して、高レベル API では、MNIST 分類器を簡単に実装するために必要なコードは数十行だけです。非常に少ないコードで基本 API と同じ効果を実現できるため、ディープラーニングの学習しきい値が大幅に下がります。

初めてディープラーニングフレームワークを学習し、PaddlePaddle 高レベル API を使用する場合、「とても面倒だ。なぜ PaddlePaddle 高レベル API がこんなに早く開発されたのか? まだ数行のコードを書きたい!」と言うかもしれません。

高レベルAPI、その方法

次に、CV タスクを例に、さまざまなシナリオで PaddlePaddle 高レベル API を使用する方法を簡単に紹介します。

この例の完全なコードは AI Studio で入手できます。ソフトウェアやハードウェア環境を準備することなく、オンラインで直接コードを実行できます。とても便利です: https://aistudio.baidu.com/aistudio/projectdetail/1243085

1. データの前処理とデータの読み込み

データのロードについては、いくつかの一般的なタスクでは、PaddlePaddle フレームワークの組み込みデータセットを使用してデータのロードを完了できます。 PaddlePaddle フレームワークは、一般的に使用されるデータセットをドメイン API として使用し、それらを paddle.vision.datasets ディレクトリに統合します。これには、CV 分野で一般的な MNIST、Cifar、Flowers などのデータセットが含まれます。

データ前処理のシナリオでは、PaddlePaddle フレームワークは 20 を超える一般的な画像前処理 API を提供し、画像の色相、コントラスト、彩度、サイズなどのさまざまなデジタル画像処理方法などのデータ強化を迅速に実装できます。画像前処理 API は paddle.vision.transforms ディレクトリに統合されており、非常に便利です。データ前処理変換を作成し、その中に必要なデータ前処理メソッドを保存し、データ読み込みプロセス中にその変換をパラメーターとして渡すだけです。

さらに、独自のデータセットをロードする必要がある場合は、Paddle フレームワークの標準データ定義およびデータロード API である paddle.io.Dataset と paddle.io.DataLoader を使用して、データセットの定義とデータのロードをワンクリックで完了できます。ここでは、Dataset を使用してデータセットを定義する方法を示す例を示します。例は次のとおりです。

 paddle.ioからデータセットをインポート
 
クラスMyDataset(データセット):
 「」 「 」
    ステップ1: paddle.io.Datasetクラスを継承する
「」 「 」
    __init__(self)を定義します。
 「」 「 」
    ステップ2: コンストラクタを実装し、データ読み取りメソッドを定義し、トレーニングデータセットとテストデータセットを分割する
「」 「 」
スーパー(MyDataset、self).__init__() 
 
        自己データ = [
             [ 'traindata1' , 'label1' ],
             [ 'traindata2' , 'label2' ],
             [ 'traindata3' , 'label3' ],
             [ 'traindata4' , 'label4' ],
         ] 
 
    def __getitem__(self, インデックス):
 「」 「 」
    ステップ 3: __getitem__ メソッドを実装し、インデックスを指定するときにデータを取得する方法を定義し、単一のデータ (トレーニング データと対応するラベル) を返します。
 「」 「 」
    データ = self.data[インデックス][ 0 ]
    ラベル = self.data[インデックス][ 1 ] 
 
戻りデータ、ラベル
 
    __len__(自分)を定義します:
 「」 「 」
    ステップ4: データセットの合計数を返す__len__メソッドを実装する
「」 「 」
 len(self.data)を返す
 
 # テスト定義データセット
train_dataset = MyDataset() 
 
 print( '==============トレーニングデータセット==============' )
データの場合、train_dataset のラベル:
    print(データ、ラベル)

上記の仕様の 4 つの手順に従うだけで、独自のデータセットを実装できます。次に、train_dataset をパラメーターとして DataLoader に渡し、データローダーを取得してトレーニングデータの読み込みを完了します。

【ヒント: データセットの定義については、PaddlePaddle フレームワークはマップスタイルと反復可能スタイルの両方のデータセット定義をサポートしています。それぞれ paddle.io.Dataset と paddle.io.IterableDataset を継承するだけで済みます。】

2. ネットワーク構築

ネットワーク構築モジュールでは、PaddlePaddle の高レベル API が基本 API と一貫性があり、ネットワーク構築には paddle.nn 下の API が統一的に使用されます。 paddle.nn ディレクトリには、畳み込みに関連する Conv1D、Conv2D、Conv3D、再帰型ニューラルネットワークに関連する RNN、LSTM、GRU など、モデルネットワーキングに関連するすべての API が含まれています。

ネットワークメソッドについては、PaddlePaddle フレームワークはモデル構築に Sequential または SubClass をサポートします。 Sequential は線形ネットワーク構造を素早く構築するのに役立ちますが、SubClass はより豊富で柔軟なネットワーク構造をサポートします。実際の使用シナリオに基づいて、最も適切なネットワーク方法を選択できます。たとえば、順次線形ネットワーク構造の場合、Sequential を直接使用できます。より複雑なネットワーク構造の場合は、SubClass を使用してモデルを構築し、__init__ コンストラクターで Layer を宣言し、宣言された Layer 変数を forward で使用して順方向計算を行います。

Sequential と SubClass の例をそれぞれ見てみましょう。

1. シーケンシャル

線形ネットワークモデルの場合、ネットワークモデル構造の順序に従って Sequential にレイヤーを追加するだけです。具体的な実装は次のとおりです。

 # シーケンシャルネットワーキング
mnist = nn.シーケンシャル(
    nn.フラット化()、
    nn.リニア( 784,512 ) ,
    nn.ReLU()、
    nn.ドロップアウト( 0.2 )、
    nn .リニア( 512,10 )
 ）

2. サブクラス

SubClass を使用したネットワークの実装は次のとおりです。

 # サブクラスネットワーキング
クラスMnist(nn.Layer):
    __init__(self)を定義します。
 super (Mnist, self).__init__() 
 
        self.flatten = nn.Flatten()
        self.linear_1 = nn.Linear( 784 , 512 )
        self.linear_2 = nn.Linear( 512,10 )です。
        自己.relu = nn.ReLU()
        自己ドロップアウト = nn.ドロップアウト( 0.2 ) 
 
    def forward(自分自身、入力):
        y = self.flatten(入力)
        y = 自己.線形_1(y)
        y = 自己.relu(y)
        y = 自己ドロップアウト(y)
        y = 自己.線形_2(y) 
 
 yを返す

上記の SubClass ネットワーキングの結果は、Sequential ネットワーキングの結果とまったく同じです。SubClass ネットワーキングを使用すると、Sequential ネットワーキングを使用するよりも複雑になることがはっきりとわかります。ただし、これによりネットワークモデル構造に柔軟性がもたらされます。さまざまなシナリオに対応するために、さまざまなネットワークモデル構造を設計できます。

3. PaddlePaddleフレームワーク組み込みモデル

カスタマイズされたモデル構造に加えて、PaddlePaddle フレームワークには多くの組み込みモデルが「思慮深く」用意されており、わずか 1 行のコードでディープラーニングモデルを実装できます。現在、PaddlePaddle フレームワークに組み込まれているモデルはすべて CV 分野のモデルであり、一般的な vgg シリーズ、resnet シリーズ、その他のモデルを含め、すべて paddle.vision.models ディレクトリにあります。使い方は次のとおりです:

インポートパドル
paddle.vision.models からresnet18をインポートします
 
 # 方法1: 1行のコードで直接使用する
resnetresnet = resnet18() 
 
 # 方法2: 二次開発のバックボーンネットワークとして利用する
クラスFaceNet(paddle.nn.Layer):
    def __init__(self, num_keypoints= 15 , pretrained=False):
スーパー(FaceNet、self).__init__() 
 
        self.backbone = resnet18(事前トレーニング済み)
        self.outLayer1 = paddle.nn.Linear( 1000 , 512 )
        self.outLayer2 = paddle.nn.Linear( 512 , num_keypoints* 2 ) 
 
    def forward(自分自身、入力):
         出力 = self.backbone(入力)
         アウト = self.outLayer1(アウト)
         アウト = self.outLayer2(アウト)
戻る

3. モデルの可視化

モデルの構築が完了したら、モデルのネットワーク構造とパラメータを視覚化する必要がある場合があります。モデルを Model でカプセル化し、model.summary を呼び出すだけで、次のようにネットワークモデルの視覚化を実現できます。

 mnist = nn.シーケンシャル(
    nn.フラット化()、
    nn.リニア( 784,512 ) ,
    nn.ReLU()、
    nn.ドロップアウト( 0.2 )、
    nn.リニア( 512,10 )) 
 
 # モデルのカプセル化、モデルクラスによるカプセル化
モデル = paddle.Model(mnist)
モデル.要約()

出力は次のようになります。

 ---------------------------------------------------------------------------
 レイヤー（タイプ）入力形状出力形状パラメータ#
 ===========================================================================
   フラット化-795 [[ 32 , 1 , 28 , 28 ]] [ 32 , 784 ] 0           
    線形- 5 [[ 32 , 784 ]] [ 32 , 512 ] 401 , 920         
     ReLU - 3 [[ 32 , 512 ]] [ 32 , 512 ] 0          
    ドロップアウト- 3 [[ 32 , 512 ]] [ 32 , 512 ] 0            
    線形- 6 [[ 32 , 512 ]] [ 32 , 10 ] 5 , 130       
    ===========================================================================
    合計パラメータ: 407,050  
    トレーニング可能なパラメータ: 407、050  
    トレーニング不可能なパラメータ: 0  
 ---------------------------------------------------------------------------
入力サイズ (MB): 0.10  
フォワード/バックワードパスのサイズ (MB): 0.57  
パラメータサイズ (MB): 1.55  
推定合計サイズ (MB): 2.22  
 ---------------------------------------------------------------------------
 { 'total_params' : 407050 、 'trainable_params' : 407050 }

Model.summary は、ネットワークの各層の形状だけでなく、ネットワークの各層のパラメータ数とモデルのパラメータの合計数も示すため、モデルのすべての情報を非常に便利かつ直感的に確認できます。

4. モデルのトレーニング

1. 高レベルAPIを使用してすべてのデータセットをトレーニングする

これまで、ディープラーニングの開発者を悩ませてきた問題は、モデルトレーニングのコードが複雑すぎることでした。プログラムを実行するには多くの手順が必要になることが多く、コードが長いため多くの開発者がやる気をなくしていました。

現在、PaddlePaddle の高レベル API は、トレーニング、評価、予測 API をカプセル化しています。Model.prepare()、Model.fit()、Model.evaluate()、Model.predict() を直接使用して、モデルのトレーニング、評価、予測を完了できます。

従来のフレームワークでは、多くの場合、大量のトレーニングコードが必要になります。 PaddlePaddle の高レベル API を使用すると、モデルのトレーニングを 3 ～ 5 行以内で完了できるため、開発コードの量が大幅に簡素化され、初心者の開発者にとって非常に使いやすくなります。具体的なコードは次のとおりです。

 # Modelクラスを使用してネットワーク構造をモデルにカプセル化します
モデル = paddle.Model(mnist) 
 
 # モデルのトレーニングの準備、オプティマイザー、損失関数、精度計算方法の設定
モデルを準備します(オプティマイザー=paddle.optimizer.Adam(パラメーター=model.parameters()),
              損失=paddle.nn.CrossEntropyLoss()、
              メトリック = paddle.metric.Accuracy()) 
 
 # モデルのトレーニングを開始し、トレーニングデータセットを指定し、トレーニングラウンドを設定し、各データセットの計算のバッチサイズを設定し、ログ形式を設定します
モデル.fit(train_dataset,
         エポック = 10 、
         バッチサイズ = 64 、
         詳細 = 1 ) 
 
 # モデル評価を開始し、データセットを指定し、ログ形式を設定します
モデルを評価します(テストデータセット、詳細= 1 ) 
 
 # モデルのテストを開始し、テストセットを指定します
モデル.予測(テストデータセット)

2. 高レベルのAPIを使用して、データセットのバッチでトレーニング、検証、テストを行う

場合によっては、データをバッチでサンプリングしてから、モデルのトレーニングと検証を完了する必要があります。この場合、次のように train_batch、eval_batch、predict_batch を使用して、バッチでトレーニング、検証、テストを完了できます。

 # モデルのカプセル化、モデルクラスによるカプセル化
モデル = paddle.Model(mnist) 
 
 # モデル構成: モデルのトレーニングの準備、オプティマイザー、損失関数、精度計算方法の設定
モデルを準備します(オプティマイザー=paddle.optimizer.Adam(パラメーター=model.parameters()),
              損失=nn.CrossEntropyLoss()、
              メトリック = paddle.metric.Accuracy()) 
 
 # トレーニングセットデータローダーを構築する
train_loader = paddle.io.DataLoader(train_dataset、batch_size= 64 、shuffle=True) を実行します。 
 
 # train_batchを使用してトレーニングを完了します
batch_idの場合、enumerate(train_loader())内のデータ:
    モデル.train_batch([データ[ 0 ]],[データ[ 1 ]]) 
 
 # テストセットデータローダーを構築する
test_loader = paddle.io.DataLoader(test_dataset、places=paddle.CPUPlace()、batch_size= 64 、shuffle=True) 
 
 # eval_batchを使用して検証を完了します
batch_idの場合、enumerate(test_loader())内のデータ:
    モデル.eval_batch([データ[ 0 ]],[データ[ 1 ]]) 
 
 # 予測を完了するにはpredict_batchを使用します
batch_idの場合、enumerate(test_loader())内のデータ:
    モデル.予測バッチ([データ[ 0 ]])

5. 高度な使い方

さらに、PaddlePaddle 高レベル API は、カスタム Loss、カスタム Metric、カスタム Callback などの高度なゲームプレイもサポートします。

カスタマイズされた損失とは、フレームワークの既存の損失インターフェースに損失計算方法が存在しない、またはアルゴリズムがニーズを満たさない特定のタスクに遭遇することがあるため、損失を自分でカスタマイズしたいと考えることを意味します。

メトリックのカスタマイズと損失のカスタマイズのシナリオは同じです。パーソナライズされた方法で実装したい操作が発生した場合は、フレームワークを使用してカスタマイズされた評価計算方法を完成させることもできます。

カスタムコールバックは、トレーニング中にいくつかのパラメータとデータを収集するのに役立ちます。Model.fit() はトレーニングプロセスをカプセル化するため、トレーニング中に損失、メトリック、およびその他の情報を保存する必要がある場合は、コールバックパラメータを通じてこの情報を収集する必要があります。

もっと豊富な遊び方については、記事の最後にあるQRコードをスキャンして入手してください〜

高レベルAPI、次へ

上記の記事では、CV タスクを例にして、PaddlePaddle フレームワークの高レベル API の使用ガイドを紹介しています。その後、PaddlePaddleフレームワークは、データのパディング、データセットの語彙の取得など、NLP分野専用のデータ前処理モジュールもリリースする予定です。ネットワークに関しては、ネットワーク関連のsequence_mask、評価指標関連のBLEUなど、NLP分野のネットワーク専用のAPIも実装します。最後に、NLP分野のアーティファクトトランスフォーマーについても、特定の最適化を実行します。これらの機能がリリースされたら、できるだけ早くお知らせしますので、お楽しみに〜

高レベルAPI、

PaddlePaddle 高レベル API の使用法の紹介を読んだ後、試してみたくなりましたか?

体験方法1：オンライン体験

ソフトウェアやハードウェア環境を準備する必要はありません。次のアドレスに直接アクセスして、オンラインでコードを実行し、効果を確認できます: https://aistudio.baidu.com/aistudio/projectdetail/1243085

体験方法2：現地体験

それでもローカルコンピューターで体験したい場合は、PaddlePaddle オープンソースフレームワーク 2.0 がローカルコンピューターに正常にインストールされていることを確認する必要があります。

以下では、PaddlePaddle オープンソースフレームワーク 2.0 のインストール方法について説明します。以下のコマンドを参照して、pip を使用して直接インストールできます。インストール後、高レベル API の使用を開始できます。

# CPUバージョン

# CPUバージョン
$ pip3 インストール paddlepaddle== 2.0.0rc0 -i https://mirror.baidu.com/pypi/simple  
 # GPU バージョン
$ pip3 インストール paddlepaddle_gpu== 2.0.0rc0 -i https://mirror.baidu.com/pypi/simple