ディープラーニングフレームワークFlashを使用して、わずか数行のコードで画像分類器を構築する方法

[[412621]]

【51CTO.com クイック翻訳】 1. はじめに

画像分類は、画像がどのクラスに属するかを予測するタスクです。このタスクは画像表現のため困難です。画像を平坦化すると、長い 1 次元ベクトルが作成されます。さらに、この表現では隣接する情報が失われます。したがって、特徴を抽出し結果を予測するにはディープラーニングが必要です。

場合によっては、ディープラーニングモデルの構築は困難な作業になることがあります。画像分類の基本モデルは作成しましたが、コードの作成にかなり時間がかかりました。データの準備、モデルのトレーニング、モデルのテスト、サーバーへのモデルのデプロイを行うためのコードを準備する必要があります。ここで Flash が役に立ちます!

Flash は、ディープラーニングモデルを迅速に構築、トレーニング、テストするための高レベルのディープラーニングフレームワークです。 Flash は PyTorch フレームワークに基づいています。したがって、PyTorch を知っていれば、Flash にも精通しているはずです。

PyTorch や Lightning と比較すると、Flash は使いやすいですが、以前のライブラリほど柔軟ではありません。より複雑なモデルを構築する場合は、Lightning を使用するか、PyTorch を直接使用することができます。

Flash を使用すると、わずか数行のコードでディープラーニングモデルを構築できます。ディープラーニングを初めて使用する場合でも、心配する必要はありません。 Flash を使用すると、コードに混乱することなくディープラーニングモデルを構築できます。

この記事では、Flash を使用して画像分類器を構築する方法を説明します。

II. 実施

ライブラリのインストール

ライブラリをインストールするには、次のように pip コマンドを使用します。

 pip インストール lightning-flash

そのコマンドが機能しない場合は、GitHub リポジトリを使用してライブラリをインストールできます。コマンドは次のとおりです。

 pip で git+https://github.com/PyTorchLightning/lightning-flash.git をインストールします

パッケージを正常にダウンロードできたら、ライブラリをロードできるようになります。シードも42番に設定しました。これを実行するコードは次のとおりです。

 pytorch_lightningからseed_everything をインポートします
 
フラッシュをインポート
flash.core.classificationからラベルをインポート
flash.core.data.utilsからdownload_data をインポートします
flash.imageからImageClassificationData、ImageClassifier をインポートします
 
 #ランダムシードを設定します。
シード_エブリシング(42)
グローバルシードセット  42まで
42

データをダウンロード

ライブラリがインストールされたので、次はデータを取得します。デモンストレーションのために、「Cat and Dog dataset」というデータセットを使用します。

このデータセットには、猫と犬の 2 つのカテゴリの画像が含まれています。データセットにアクセスするには、Kaggle で検索してください。データセットにはここからアクセスできます。

データの読み込み中

データをダウンロードしたら、データセットをオブジェクトにロードしましょう。 from_folders メソッドを使用して、データを ImageClassification オブジェクトに格納します。これを実行するコードは次のとおりです。

データモジュール = ImageClassificationData.from_folders(
    train_folder = "cat_and_dog/training_set" 、
    val_folder = "cat_and_dog/validation_set" 、
 ）

モデルの読み込み

データをロードした後、次のステップはモデルをロードすることです。独自のアーキテクチャをゼロから構築するわけではないので、既存の畳み込みニューラルネットワークアーキテクチャに基づく事前トレーニング済みモデルを使用します。

事前トレーニング済みの ResNet-50 モデルを使用します。さらに、データセットに基づいてカテゴリの数を設定します。これを実行するコードは次のとおりです。

モデル = ImageClassifier(バックボーン = "resnet50" 、num_classes = datamodule.num_classes)

モデルのトレーニング

モデルが読み込まれたら、次はモデルをトレーニングします。まず Trainer オブジェクトを初期化する必要があります。モデルを 3 エポックにわたってトレーニングします。さらに、GPU を使用してモデルをトレーニングできるようにします。これを実行するコードは次のとおりです。

トレーナー = flash.Trainer(max_epochs=3, gpus=1)
使用可能な GPU: True 、使用済み: True使用可能な TPU: False 、使用中: 0 TPU コア

オブジェクトを初期化したら、モデルをトレーニングしましょう。モデルをトレーニングするには、finetune と呼ばれる関数を使用できます。関数内で、モデルとデータを設定します。さらに、トレーニング戦略をフリーズに設定して、特徴抽出器をトレーニングしないことを示します。つまり、分類器部分のみをトレーニングします。

これを実行するコードは次のとおりです。

 trainer.finetune(モデル、データモジュール=datamodule、戦略= "freeze" )
 LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0] |名前| タイプ | パラメータ---------------------------------------- 0 | メトリック | ModuleDict | 0 1 | バックボーン | シーケンシャル | 23.5 M 2 | ヘッド | シーケンシャル | 4.1 K ---------------------------------------- 57.2 K トレーニング可能なパラメータ 23.5 M トレーニング不可能なパラメータ 23.5 M 合計パラメータ 94.049 推定モデルパラメータの合計サイズ (MB)  
検証の妥当性チェック: 0it [00:00, ?it/s]
グローバルシードセット  42まで
トレーニング: 0it [00:00, ?it/s]
検証中: 0it [00:00, ?it/s]
検証中: 0it [00:00, ?it/s]
検証中: 0it [00:00, ?it/s]

評価結果は次のとおりです。

結果から、モデルの精度は約 97% であることがわかります。悪くないですね！では、新しいデータでモデルをテストしてみましょう。

モデルのテスト

モデルがトレーニングされていないサンプルデータを使用します。以下はテストするモデルのサンプルです。

 matplotlib.pyplot をpltとしてインポートします。
 PIL インポート画像から
 
図、ax = plt.subplots(1, 5、図のサイズ=(40,8))
 iが範囲(5)内にある場合:
    ax[i].imshow(Image.open ( f'cat_and_dog/testing/{i+1}.jpg' ) )
 plt.show()

モデルをテストするには、フラッシュライブラリの predict メソッドを使用できます。これを実行するコードは次のとおりです。

 model.serializer = ラベル() 
 
予測 = model.predict([ "cat_and_dog/testing/1.jpg" ,
 「cat_and_dog/テスト/2.jpg」 、
 「cat_and_dog/テスト/3.jpg」 、
 「cat_and_dog/テスト/4.jpg」 、
 「cat_and_dog/テスト/5.jpg」 )
印刷(予測)
 [ '犬' 、 '犬' 、 '猫' 、 '猫' 、 '犬' ]

上記の結果から、モデルが正しいラベルを持つサンプルを予測していることがわかります。素晴らしい！後で使用するためにモデルを保存しましょう。

モデルを保存する

モデルをトレーニングし、テストしました。 save_checkpoint メソッドを使用してモデルを保存しましょう。これを実行するコードは次のとおりです。

 trainer.save_checkpoint( "cat_dog_classifier.pt" )

別のコードに対してモデルをロードする場合は、load_from_checkpoint メソッドを使用できます。これを実行するコードは次のとおりです。

モデル = ImageClassifier.load_from_checkpoint( "cat_dog_classifier.pt" )

3. 結論

よくできました! Flash を使用して画像分類器を構築する方法を学びました。記事の冒頭で述べたように、必要なのはほんの数行のコードだけです。すごいと思いませんか?

この記事が、皆さんの状況に合わせた独自のディープラーニングモデルの構築に役立つことを願っています。より複雑なモデルを実装したい場合は、PyTorch の学習を開始することをお勧めします。

原題: Flash を使って数行のコードで画像分類器を構築する方法、著者: Irfan Alghani Khalid

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: ディープラーニングを使用して、写真用の強力な画像検索エンジンを構築します

>>: ドローン基地局は被災地の通信復旧にどのように役立つのでしょうか?

Google は最新の NLP モデルをオープンソース化しました。このモデルは「罪と罰」の全巻を処理できます。

ブログ

年間100万ドルの給料でも、このタイプの才能のギャップを埋めることはできません。 AI業界も「人手不足」

ブログ

AI、VR、ブロックチェーンにより、新しい時代は貧しい人々にとっての楽園となるのでしょうか？

ディープラーニングフレームワークFlashを使用して、わずか数行のコードで画像分類器を構築する方法

[[412621]]

【51CTO.com クイック翻訳】 1. はじめに

II. 実施

ライブラリのインストール

データをダウンロード

データの読み込み中

モデルの読み込み

モデルのトレーニング

モデルのテスト

モデルを保存する

3. 結論

Google は最新の NLP モデルをオープンソース化しました。このモデルは「罪と罰」の全巻を処理できます。

年間100万ドルの給料でも、このタイプの才能のギャップを埋めることはできません。 AI業界も「人手不足」

AI、VR、ブロックチェーンにより、新しい時代は貧しい人々にとっての楽園となるのでしょうか？

女性が30時間以上浴室に閉じ込められた。この危機的状況でAIは彼女を危険から救うことができるのか？

中国をターゲットに！米国はドローンや衛星画像を含むAIソフトウェアの輸出を緊急制限

人工知能の発展の特徴とその3つのタイプの現れについての簡単な分析

スタンフォード大学の美容博士の起業プロジェクトは大成功！ AIビデオ生成がトップストリーマーとしてデビュー

法律、AIが革命を起こすもう一つの業界

推薦する

Yunqi CapitalのChen Yu氏：AI投資家を惹きつけてターゲットにする方法

AIとIoTを活用したスマートサプライチェーン

機械学習が医療に革命を起こす

大規模言語モデルとAIコードジェネレータの台頭

APIなしでは「AI」が成功できない理由

商品受け取り時の顔認証システムを小学生が“クラック”！鳳超が緊急オフラインに

Jetson - Nano Opencv の基本的な使用方法

保険会社、パンデミックによりAI自動化を導入

欧州はAI規制を推進

NBA スターと機械学習が出会うと...

ガイドはここにあります! GPT3.5を微調整して大規模モデルをカスタマイズしましょう！

多国籍食品流通会社Sysco CIDO：当社の成長の秘訣はIT中心