独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラルネットワークを構築します。

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

独自のデータセットの読み込みと前処理
Keras での CNN モデルの設計とトレーニング
損失と精度の曲線のプロット
モデルを評価し、テスト画像の出力クラスを予測する
CNNの中間層出力の可視化
結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

 PATH = os.getcwd()  
 #データパスを定義する 
 data_path = PATH + '/data'    
 data_dir_list = os.listdir(データパス)  
データディレクトリリスト

出力：

 [ '自転車' 、 '車' 、 '猫' 、 '犬' 、 '花' 、 '馬' 、 '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

 #いくつかの画像を視覚化する 
画像 = X_train[1441,:].reshape((128,128))  
 plt.imshow(画像)  
 plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

 #入力シェイプの初期化 
 input_shape = img_data[0].shape  
 #CNNシーケンシャルモデルの設計 
モデル = シーケンシャル ([  
 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
 MaxPooling2D(プールサイズ = (2,2))、  
 ドロップアウト(0.5)、  
 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
 MaxPooling2D(プールサイズ = (2,2))、  
 ドロップアウト(0.5)、  
 フラット化()、  
 密度(64, 活性化 = 'relu' ),  
 ドロップアウト(0.5)、  
 密度(num_classes、アクティベーション = 'softmax' )  
 ])  
 #モデルのコンパイル 
モデル.コンパイル(  
 損失 = 'カテゴリクロスエントロピー' 、  
 オプティマイザー = 'adadelta' 、  
 メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

 ist = model.fit(X_train, y_train,  
 バッチサイズ = 16、  
 nb_epoch = num_epoch、  
 詳細=1、  
 検証データ = (X_テスト、y_テスト)  
 ）

次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

 # テスト画像の予測 
印刷((モデル.予測(テストイメージ)))  
 print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0]（自転車）に正しく分類しました。

 [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
 3.0998811e-01 1.3129448e-02]]  
画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<: 機械学習: 密度ベースの外れ値検出アルゴリズム

>>: 200 の優れた機械学習チュートリアルの要約「史上最も完全」

速報です！ TensorFlow テクニカルディレクターの Pete Warden 氏は辞職し、博士号取得を目指してスタンフォード大学に戻りました。「Google では難しすぎた」からです。

ブログ

ネットワークインテリジェンスに関する誤解は4つある

ブログ

DockerとFlaskをベースにしたディープラーニングモデルのデプロイメント！

ブログ

Transformerが3Dモデリングに革命を起こし、MeshGPT生成結果がプロのモデラーやネットユーザーに衝撃を与える：革命的なアイデア

ブログ

数人のアメリカ人作家が共同で書簡を書き、AIが著作権のあるコンテンツを使って作品を生み出す場合、著者に補償を与えるよう求めた。

ブログ

Photoshop の新しい AI 機能により、数回クリックするだけで空を置き換えることができます

ブログ

手書きの最も単純なLRUアルゴリズム

ブログ

香港科技大学のタン・ピン氏のチームが3D生成における重要な問題を突破し、多頭モンスターの出現を防止

ブログ

人工知能は10の新たな雇用を生み出す

ブログ

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

速報です！ TensorFlow テクニカルディレクターの Pete Warden 氏は辞職し、博士号取得を目指してスタンフォード大学に戻りました。「Google では難しすぎた」からです。

ネットワークインテリジェンスに関する誤解は4つある

DockerとFlaskをベースにしたディープラーニングモデルのデプロイメント！

Transformerが3Dモデリングに革命を起こし、MeshGPT生成結果がプロのモデラーやネットユーザーに衝撃を与える：革命的なアイデア

数人のアメリカ人作家が共同で書簡を書き、AIが著作権のあるコンテンツを使って作品を生み出す場合、著者に補償を与えるよう求めた。

Photoshop の新しい AI 機能により、数回クリックするだけで空を置き換えることができます

手書きの最も単純なLRUアルゴリズム

香港科技大学のタン・ピン氏のチームが3D生成における重要な問題を突破し、多頭モンスターの出現を防止

人工知能は10の新たな雇用を生み出す

推薦する

ヘルスケアにおける人工知能の応用

たった1ミリ低くなれば時間が遅くなります!科学者が初めてミリメートルスケールで一般相対性理論を検証

OpenAIが安全チームを設置準備: AIのリスクを評価し、外部からの悪用を防ぐ

写真を3Dに変換する品質が急上昇！ GitHub がショートポジションをオープンしたところ、300 人以上がスターを付けました

画像からの「テキスト生成」の難しさを克服し、同レベルの拡散モデルを粉砕せよ！ TextDiffuser アーキテクチャの 2 世代の詳細な分析

Google X 中国博士がロボットシミュレーターSimGANをリリース、ICLR2021が出版

マイクロソフトのGitHub Copilotサービスは大きな損失を被っていると報じられており、同社は独自のAIチップを開発してNvidiaに対抗する予定だ

AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか？

日本メディア：中国は人工知能の分野で米国を追い越している

2030 年までに人工知能はどのようになるでしょうか?

AIとIoTはどのように連携するのでしょうか?

Facebook、MITなどが研究論文を発表：ディープラーニングの実際の仕組みを説明する理論

軍用ロボットは障害物を乗り越えるために車輪を使うか脚を使うかを決定できる