女性の死因第1位である乳がんをディープラーニングで検出するにはどうすればいいのでしょうか?

女性の死因第1位である乳がんをディープラーニングで検出するにはどうすればいいのでしょうか?

[51CTO.com からのオリジナル記事] 乳がんは女性に最も多く見られる浸潤がんであり、女性のがんによる死亡原因としては肺がんに次いで 2 番目に多いものです。

この記事では、WideResNet をベースにニューラル ネットワークを構築し、スライド画像を、ディープラーニングを使用して乳がんを検出するカテゴリとディープラーニングを使用しないカテゴリの 2 つのカテゴリに分類します。

浸潤性乳管がん(IDC)は最も一般的なタイプの乳がんである。アメリカがん協会は、米国では毎年 18 万人以上の女性が浸潤性乳がんと診断されており、その大半が IDC であると推定しています。

乳がんの種類を正確に識別して分類することは重要な作業であり、AI ベースの自動化された方法により、時間を大幅に節約し、誤診を減らすことができます。

データセットについて

オハイオ州クリーブランドのケース・ウェスタン・リザーブ大学の研究者たちは、この質問に関するデータセットを収集しました。元のデータセットは Kaggle スタッフによって前処理され、私たちの作業の出発点となりました。

詳細については、http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip を参照してください。

[[229666]]

図1: 各スライドには約1700個の50x50ピクセルのタイルが含まれます

データセットには 162 枚の全マウントスライドが含まれています。スライドは 40 倍の解像度でスキャンされました。最終的に、それらは 50 x 50 ピクセルの 275,215 個のパッチに分割されました。

次に、各パッチに 0 または 1 のラベルが割り当てられます。IDC を含むパッチの場合はラベル 1、IDC を含まないパッチの場合はラベル 0 になります。

図2: 陽性および陰性のIDC組織の3つの例

WideResNet によるスライドの分類

残差接続を使用する ResNet アーキテクチャは、画像分類タスクに非常に適しています。 ResNet の中心的なアイデアは、1 つ以上のレイヤーをスキップする、いわゆる「アイデンティティ ショートカット接続」を導入することです。

WideResNet アーキテクチャは、深さが 16 層だけでも同様のパフォーマンスを実現できることを示しています。これは、爆発/消失勾配や劣化など、非常に深い ResNet に関連するさまざまな問題を解決するのに役立ちます。

Vincent Fung 氏と Apil Tamang 氏のブログ投稿の詳細を利用すると、ResNet が実際に何に使用されているかがわかります。

図3: 残余ブロック

オーバーレイ レイヤーを目的の基礎マップに直接適合させるよりも、残差マップにオーバーレイ レイヤーを適合させる方が簡単であると想定されます。これは、より深いモデルではより浅いモデルよりもトレーニング エラーが高くならないことを示唆しています。

ResNet は、その優れた実用的な結果により、さまざまなコンピューター ビジョン タスクで最も人気のあるアーキテクチャの 1 つに急速に成長しました。

さらに、WideResNet が存在するのには理由があります。精度が向上するごとに、レイヤーの数をほぼ 2 倍にする必要があるため、非常に深い残差ネットワークをトレーニングすると、特徴の再利用が徐々に減少するという問題が発生し、ネットワークのトレーニングが非常に遅くなります。

図4: WideResNetトレーニング

これらの問題に対処するために、Zagoruyko と Komodakis は ResNet ブロックのアーキテクチャの詳細な実験的研究を実施し、これに基づいて残差ネットワークの深さを減らし、幅を増やすことができる新しいアーキテクチャを提案しました。彼らはそれを「ワイド残余ネットワーク」と呼んでいます。

ここでは、WideResNet アーキテクチャを使用してこの問題を段階的に解決するプロセスについて説明します。 Deep Learning Studio を使用すると、プログラミング、構文、データセットの取り込みを気にすることなく、ニューラル ネットワークを迅速に構築できます。

プロジェクトの作成

ローカルまたはクラウドで実行されている Deep Learning Studio にログインした後、+ ボタンをクリックして新しいプロジェクトを作成します。

データセットの取り込み

次に、[データ] タブでこのプロジェクトのデータセットを作成します。通常、トレーニングと検証の比率は 80% 対 20% が適切ですが、必要に応じて他の設定を使用することもできます。

マシンにデータセット全体をメモリにロードするのに十分なメモリがある場合は、「データセットをメモリにロード」を「データセット全体」に設定することを忘れないでください。

ニューラルネットワークの作成

以下のようにレイヤーをドラッグ アンド ドロップすることでニューラル ネットワークを作成できます。

右側のプロパティを使用して、WideResNet が完全にトレーニングできるように設定されていることを確認します。さらに、最初の密なレイヤー (Dense_3) には約 20 個のニューロンがあり、ReLU が活性化関数として使用されます。

最終的な密なレイヤー (Dense_1) は、出力次元が 1 で、アクティベーションがシグモイドである必要があります。その理由は、この問題を分類問題ではなく回帰問題として設定しているためです。

回帰出力が 0.5 未満の場合、入力はクラス 0 (つまり、IDC がんなし) に属し、それ以外の場合は IDC がんがあると言えます。

ハイパーパラメータとトレーニング

使用したハイパーパラメータを下の図に示します。これらのハイパーパラメータを自由に変更して実験してみてください。

最後に、「トレーニング」タブからトレーニングを開始し、トレーニング ダッシュボードで進捗状況を追跡できます。

トレーニングが完了すると、「結果」タブで結果を確認できます。 1 時間あたり 0.90 ドルのコストがかかる K80 GPU で、数時間で 85% を超える精度を達成しました。

Deep Learning Studio を使用すると、Web アプリケーションまたは REST API としてデプロイするのは簡単で、次に示すように [デプロイ] タブを使用して実行できます。

モデルを展開する

デプロイされたモデルには、次のように Web アプリケーションまたは REST API としてアクセスできます。

結論

Deep Learning Studio を使用すると、ディープラーニング モデルをわずか数分で構築し、数秒で展開できます。

この利便性により、開発者はプログラミングや API などの他の側面を気にすることなく、複雑な問題を解決できるようになります。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  ジャック・マー:世界の未来を決めるのは技術ではなく、技術の背後にある人々、理想、価値観だ

>>:  AIと5Gの登場:モノのインターネットの発展は鈍化しているのか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AIガバナンスがトップに躍り出るには

人工知能(AI)技術は現在、広く利用されています。 AI ガバナンスが重要なのは、AI はより大きな...

nn.Module クラスに基づく線形回帰モデルの実装

[[411355]]前回はシーケンシャルモデルを紹介しましたが、ほとんどの場合、ニューラルネットワー...

マイクロソフト CEO ナデラ氏へのインタビュー: 人工知能の全体的な方向性と将来はどのようなものでしょうか?

人工知能の将来はどうなるのでしょうか?どのような方向に発展していくべきでしょうか?開発プロセス中に注...

GPT-4 の出力がなぜそれほどランダムなのか、深く考えたことはありますか?

今年はAI分野で大規模言語モデル(LLM)が注目され、OpenAIのChatGPTやGPT-4が大人...

データが足りない場合はどうなりますか?コンピュータビジョンデータ拡張手法の概要

データが足りない場合はどうすればいいですか?学者たちは、ディープラーニングモデルにおけるデータ不足の...

MIT は Google と提携して 7 台のマルチタスク ロボットをトレーニングし、9,600 のタスクで 89% の成功率を達成しました。

タスクの数が増えるにつれて、現在の計算方法を使用して汎用の日常的なロボットを構築するコストは法外なも...

人工知能チュートリアル(IV):確率論入門

このシリーズの前回の記事では、行列と線形代数についてさらに詳しく説明し、JupyterLab を使用...

NLP タスクに最適な 6 つの Python ライブラリ

この記事では、自然言語処理タスクに最適な 6 つの Python ライブラリを紹介します。初心者でも...

ロボットがあなたの仕事を奪おうとしているのでしょうか?データはあなたが考えすぎている可能性を示唆している

編集者注:人工知能技術が進歩し続けるにつれ、職を失うことを心配する人が増えています。彼らの理由は、根...

ナレッジグラフを使用して RAG 機能を改善し、大規模モデルの幻覚を軽減する

幻覚は、大規模言語モデル (LLM) を使用するときによく発生する問題です。 LLM は流暢で一貫性...

アメリカでは500万の仕事が機械に置き換えられました!スーパーAIは人類に不死をもたらすのか、それとも破滅をもたらすのか?

人工知能は1956年以来40年以上の発展を遂げてきました。現在、AI の目標はコンピューターを人間の...

興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

動的プログラミング基本的に、それは次のことを意味します。女の子を追いかけるときは、彼女の親しい友達全...

GPT 1周年深夜の雑談: プログラミングなしで誰もが GPT を定義できる時代が到来!

執筆者 | Yun Zhao制作:51CTO テクノロジースタック(WeChat ID:blog)深...

従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

Amazonが2006年にEC2サービスをリリースしてから11年が経ちました。この 11 年間で、A...