独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラル ネットワークを構築します。

 

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

  • 独自のデータセットの読み込みと前処理
  • Keras での CNN モデルの設計とトレーニング
  • 損失と精度の曲線のプロット
  • モデルを評価し、テスト画像の出力クラスを予測する
  • CNNの中間層出力の可視化
  • 結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

  1. PATH = os.getcwd()  
  2. #データパスを定義する 
  3. data_path = PATH + '/data'    
  4. data_dir_list = os.listdir(データパス)  
  5. データディレクトリリスト

出力:

  1. [ '自転車' '車' '猫' '犬' '花' '馬' '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

  1. #いくつかの画像を視覚化する 
  2. 画像 = X_train[1441,:].reshape((128,128))  
  3. plt.imshow(画像)  
  4. plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する 

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

  1. #入力シェイプの初期化 
  2. input_shape = img_data[0].shape  
  3. #CNNシーケンシャルモデルの設計 
  4. モデル = シーケンシャル ([  
  5. 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
  6. 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
  7. MaxPooling2D(プールサイズ = (2,2))、  
  8. ドロップアウト(0.5)、  
  9. 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
  10. MaxPooling2D(プールサイズ = (2,2))、  
  11. ドロップアウト(0.5)、  
  12. フラット化()、  
  13. 密度(64, 活性化 = 'relu' ),  
  14. ドロップアウト(0.5)、  
  15. 密度(num_classes、アクティベーション = 'softmax' )  
  16. ])  
  17. #モデルのコンパイル 
  18. モデル.コンパイル(  
  19. 損失 = 'カテゴリクロスエントロピー'  
  20. オプティマイザー = 'adadelta'  
  21. メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

  1. ist = model.fit(X_train, y_train,  
  2. バッチサイズ = 16、  
  3. nb_epoch = num_epoch、  
  4. 詳細=1、  
  5. 検証データ = (X_テスト、y_テスト)  



次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

  1. # テスト画像の予測 
  2. 印刷((モデル.予測(テストイメージ)))  
  3. print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0](自転車)に正しく分類しました。


  1. [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
  2. 3.0998811e-01 1.3129448e-02]]  
  3. 画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<:  機械学習: 密度ベースの外れ値検出アルゴリズム

>>:  200 の優れた機械学習チュートリアルの要約「史上最も完全」

ブログ    
ブログ    

推薦する

人工知能技術の発展に関する合理的な見方

[[421597]]社会の生産性が急速に発展するにつれ、文学作品に描かれた未来の技術やより良い生活が...

...

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IoTと機械学習がビジネスを加速させる5つの方法

モノのインターネットと機械学習は、今日のビジネスにおいて最も破壊的なテクノロジーの 2 つです。さら...

Googleなどのテクノロジー大手が新技術を発表:人工知能が自ら進化できるようにする

ニューヨーク・タイムズの最近の報道によると、Googleなどのテクノロジー大手は、人工知能の専門家不...

AI面接官はこんなに簡単に騙される!本棚の写真を動画の背景として使用すると好感度が 15% 上昇します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2021 年にアルゴリズム エンジニアに必要な必須スキルは何ですか?

[[413437]]アルゴリズムエンジニアにはどのような能力が必要ですか? 「ますます増加する量」...

...

インテルと4Paradigmが協力し、誰もがAIを利用できるように

[51CTO.com からのオリジナル記事] 今日、人工知能はもはや遠い概念ではなく、私たちの仕事と...

4つのニューラルネットワークシーケンスデコードモデルとサンプルコードの説明

[[189448]]以下は、ニューラル ネットワーク モデルにおける 4 つのシーケンス デコード ...

LIDAR ポイント クラウドの自己教師あり事前トレーニング用 SOTA!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ディープラーニングの面接で知っておくべきこと

[[208646]]この記事は、「ディープラーニングの面接で知っておくべきことは何ですか」という質問...

Sitechiは新たなブルーオーシャンを開拓し、中小企業市場に注力

Sitechi は、通信業界に特化したソフトウェア開発およびサービス プロバイダーです。業界で最も早...

ChatGPTを旅の途中のプロンプトジェネレーターに変える

ChatGPT は Midjourney 画像生成のテンプレートとして使用できると結論付けられました...