TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

[[405128]]

このチュートリアルでは、TensorFlow (Keras API) を使用して、細胞の画像をマラリア感染の有無としてラベル付けするバイナリ分類タスク用のディープラーニングモデルを実装します。

データセットのソース: https://www.kaggle.com/iarunava/cell-images-for-detecting-malaria

データセットには2つのフォルダが含まれています

感染: 13780 枚の画像
感染なし: 13780 枚の画像

合計27558枚の画像。

このデータセットは、NIH の公式ウェブサイトから取得されています: https://ceb.nlm.nih.gov/repositories/malaria-datasets/

環境: Kaggle、Tianchi Lab、Gogole Colab のどれでも OK です。

関連モジュールのインポート

cv2をインポート
テンソルフローをtfとしてインポートする
tensorflow.keras.modelsからSequential をインポートします
tensorflow.keras.layersからDense、Conv2D、MaxPool2D、Flatten、Activation をインポートします。
 sklearn.model_selectionからtrain_test_split をインポートします
numpyをnpとしてインポートする
matplotlib.pyplot をpltとしてインポートします。
インポートグロブ
インポートOS

形状の異なる画像データの場合、画像の前処理を実行するために OpenCV が必要です。

画像を numpy 配列 (デジタル形式) の形式でグレースケールに変換し、(70x70) の形状にサイズを変更します。

 img_dir= "../input/マラリア検出用セルイメージ/cell_images"    
画像サイズ=70
 def load_img_data(パス):
    # データをシャッフルする
    image_files = glob.glob(os.path.join (path, "Parasitized/*.png" ) ) + \
                  glob.glob(os.path.join (path, "Uninfected/*.png" ) )
    x, y = [], []
 image_files内のimage_fileの場合:
        #感染していないタグには0 、感染しているタグには1 という名前を付けます
        「感染していない」場合はラベル = 0   image_file内、それ以外は1
        #画像をグレースケールで読み込む
        img_arr = cv2.imread(画像ファイル、cv2.IMREAD_GRAYSCALE)
        # 画像のサイズを(70x70)に変更します
        img_resized = cv2.resize(img_arr, (img_size, img_size))
        X.append(画像のサイズを変更)
        y.append(ラベル)
 X, yを返す
X, y = load_img_data(img_dir)

Xの形を確認してください。

印刷(X.shape)

X の形状は (27558, 70, 70, 1) です。ここで、27558 は画像データを表し、70*70 はピクセル単位の画像の長さと幅を表します。

さらに、ネットワークの収束を早めるには、データを正規化する必要があります。 sklearn にはいくつかのスケーリング方法があります。たとえば、次のとおりです。

ここで 255 で割るのは、ピクセルが持つことができる最大値が 255 であるためで、スケーリングが適用されると、ピクセルの範囲は 0 から 1 の間になります。

 X, y = load_img_data(img_dir)
 # (n_samples, 70, 70, 1)に再形成します ( NN に適合させるため)
 X = np.array(X).reshape(-1, 画像サイズ, 画像サイズ, 1)
 #ピクセルを[0, 255]から[0, 1]にスケーリングすると、ニューラルネットワークのトレーニングが速くなります
バツ = バツ / 255 
 
 # データセットをシャッフルして分割する
X_train、X_test、y_train、y_test = train_test_split(X、y、test_size=0.1、stratify=y)
 print( "合計トレーニングサンプル数: " , X_train.shape)
 print( "検証サンプルの合計数:" , X_test.shape[0])

sklearn の train_test_split() メソッドを使用して、データセットをトレーニングセットとテストセットに分割します。全体のデータの 10% を使用して後で検証します。

構築されたモデルでは、3 つの畳み込み層を追加し、次に層で構成される完全に接続された密な層である Flatten を追加します。

モデル = シーケンシャル()
モデル。 (Conv2D(64, (3, 3), input_shape=X_train.shape[1:])を追加します。
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Conv2D(64, (3, 3)))
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Conv2D(64, (3, 3)))
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Flatten()) 
 
モデル.add (密(64))
 model.add(アクティベーション( "relu" )) 
 
モデル.add (密(64))
 model.add(アクティベーション( "relu" )) 
 
モデル.add (密(1))
 model.add(アクティベーション( "シグモイド" )) 
 
 model.compile(損失= "binary_crossentropy" 、オプティマイザー= "adam" 、メトリック=[ "accuracy" ])
印刷(モデル.要約())

出力はバイナリ（感染しているか感染していないか）なので、出力層の活性化関数としてシグモイド関数を使用します。

 # 10エポック、64バッチサイズでモデルをトレーニングします 
 model.fit(X_train、np.array(y_train)、バッチサイズ=64、エポック=10、検証分割=0.2)

トレーニングデータセットとその検証分割では 94% の精度が達成されました。

次にevaluate()を使用してテストデータセットでモデルを評価します。

損失、精度 = model.evaluate(X_test, np.array(y_test), verbose=0)
 print(f "{len(X_test)} 枚の画像でテストした結果は次のとおりです\n 精度: {accuracy} | 損失: {loss}" )

出力は次のようになります

2756枚の画像でテストした結果は
精度: 0.9404934644699097 | 損失: 0.1666732281446457

このモデルはテストデータでも94%の精度で正常に動作した。

最後に、モデルを保存して、このすべてを終了します。

モデルを保存( "model.h5" )

【編集者のおすすめ】

Hongmengさん、たとえそれが単なるAndroidシェルだとしても、何が問題なのですか？
Kubernetes が Docker を放棄するのはなぜですか?
「PPT システム」から現実へ: HarmonyOS、あなたは本当にそれに惹かれますか?
これら 6 つの Python IDE とコードエディターを使用したことがありますか?
Kubernetes の実践: 正常な終了

<<: マッピングドローンは多くの「ファン」を獲得しており、これらの利点は刺激的です

>>: AIイノベーションを奨励する100万ドルの賞金：2021 DIGIXグローバルキャンパスAIアルゴリズムエリートコンペティションが開幕

人工知能業界の給与が明らかに、転職の時期が来た

ブログ

BigDL-LLMを使用して、数百億のパラメータを持つLLM推論を即座に加速します。

ブログ

百度地図のデータ収集リンクの80％はAIベースになっており、旅行業界はインテリジェントにアップグレードされている

ブログ

新しい形の人工知能が登場: AIaaSについてお話しましょう

ブログ

人工知能の3つの利点と3つの欠点

ブログ

アルバータ大学のチームのプロジェクトは、しかめ面の細部まで完璧に再現した超リアルな肖像画を制作する

ブログ

人工知能技術は交通にどのように応用できるのでしょうか?

ブログ

ついに誰かが「組み込み人工知能」を明らかにした

ブログ

人工知能と自然言語処理の概要: AI の 3 つの主要段階と NLP の主な応用分野

ブログ

TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

人工知能業界の給与が明らかに、転職の時期が来た

BigDL-LLMを使用して、数百億のパラメータを持つLLM推論を即座に加速します。

百度地図のデータ収集リンクの80％はAIベースになっており、旅行業界はインテリジェントにアップグレードされている

新しい形の人工知能が登場: AIaaSについてお話しましょう

人工知能の3つの利点と3つの欠点

アルバータ大学のチームのプロジェクトは、しかめ面の細部まで完璧に再現した超リアルな肖像画を制作する

人工知能技術は交通にどのように応用できるのでしょうか?

ついに誰かが「組み込み人工知能」を明らかにした

人工知能と自然言語処理の概要: AI の 3 つの主要段階と NLP の主な応用分野

推薦する

AI基礎データサービス市場は新たな段階に入った

ルカン氏は罵倒し、マスク氏は笑って泣いた。9体のヒューマノイドロボットが記者会見を開いたからだ。

Capital One は NLP を使用して SMS 経由で顧客と潜在的な詐欺行為について話し合う

畳み込みニューラルネットワークに関する15の質問：CNNと生物視覚システムの研究と探究

53ページのPDFが広く出回り、中核社員が次々と退職。OpenAIにはどんな秘密があるのか？

人工知能は寒い冬を迎え、自動運転車の開発は妨げられている

2018 年に知っておくべき 15 の人工知能統計

AI アプリケーションをテストするにはどうすればいいですか?

AIはワクチン業界に何をもたらすのでしょうか?

Appleは、来年の製品発売を目標に、独自の大規模モデルフレームワークをベースにしたApple GPTを秘密裏に開発していると噂されている。