EasyDLは、臨床試験データの敵対的学習と複数のアルゴリズムの比較を簡単に処理します。

EasyDLは、臨床試験データの敵対的学習と複数のアルゴリズムの比較を簡単に処理します。

[51CTO.com からのオリジナル記事] 画像学習は高度なアルゴリズムであり、画像への高い適応性により、多くの産業改革に質的変化をもたらしました。しかし、企業にとって、画像学習パラメータを調整するためのディープラーニングに精通した人材を見つけることは困難です。データサイエンティストチームの高額な人的資源コストと相まって、多くの中小企業は意欲を失っています。しかし、企業の間では、画像認識適応業界を通じていくつかの問題点を解決したいという需要が継続的に存在しています。

Baidu EasyDL は、アルゴリズムの基礎知識を持たない開発者や企業向けに Baidu が提供する AI 画像認識ソリューションです。データ量が少なく、操作が簡単で、画像認識 AI モデルのトレーニングが速いという利点があります。 EasyDL を使用すると、中小企業や個人が短期間で AI 機能を取得し、画像認識を生産や趣味の制作に取り入れることができます。これは、優れた一連の技術ソリューションの基礎として機能します。

画像特徴学習アルゴリズムは、従来の画像パターン認識アルゴリズムから派生した新しいアルゴリズムです。そのアルゴリズムのプロトタイプは、Leica Biosystems の子会社ブランドである Aperio シリーズ ソフトウェア Image Analysis から借用したものです。これは、非常に成熟した Image Analysis パターン認識アルゴリズムの反復進化アルゴリズムです。現在、特徴学習アルゴリズムは、臨床の非染色尿沈殿物検査医療機器製品でますます使用されるようになっています。

従来のアルゴリズムであれ AI であれ、単一のアルゴリズムを使用する場合、どのアルゴリズムが使用されていても、システムが結果の正しさを単独で証明することはできません。ただし、競合するアルゴリズムが導入されると、2 つの AI アルゴリズムを通じて結果の正しさを相互に証明できます。

従来の単一 AI アルゴリズムでは、自身の認識エラーを指摘することができず、多くの場合、各結果を手動で確認する必要がありますが、敵対的アルゴリズムはこの問題を効果的に解決できます。人間は、アプリケーション プロセスで正しい推論を完了するために、2 つの AI の異なる結果を仲裁するだけで済みます。完全に自律的な敵対システムでは、仲裁結果がトレーニング セットに追加され、2 つの AI の精度が向上します。これにより、単一の AI アルゴリズムの過剰学習が回避され、AI の精度が向上します。

そこで、EasyDLと特徴学習を対決させてみました。どちらも操作性が良く、必要なサンプルサイズも小さくなっています。さらに、EasyDLと画像特徴学習アルゴリズムは、相互学習サンプル、サンプル収集、注釈ツールを使用できるため、互いに競争して、より高度なAI学習を形成できます。競争の中で、より正確な認識モデルを形成でき、画像学習を通じて実際の問題を解決するという企業のニーズを満たすだけでなく、より高い認識効果も実現できます。

臨床試験データに基づく画像モデリングの8つのステップに基づいた対決の詳細な説明は次のとおりです。

特徴学習とは、元の画像からトレーニングに使用できる画像モデルを作成することであり、画像の強化、画像のセグメンテーション、画像の注釈付け、画像のクリーニング、トレーニングのユーザビリティレビュー(画像レビュー)、単一カテゴリの特徴モデルの学習、複数カテゴリの特定の特徴の学習、およびトレーニングモデルを動作プログラムに注入するという 8 つのステップが必要です。

EasyDL と特徴学習のトレーニング方法は基本的に同じですが、単一カテゴリの特徴モデルを学習するプロセスと複数のカテゴリ固有の特徴を学習するプロセスでは、EasyDL はディープラーニングを複数の論理レイヤーの 1 つとして使用し、独立して計算を完了します。

トレーニング モデルを操作手順に挿入すると、ローカル イントラネット システムの利点を活用して機能の学習が自動的に完了し、EasyDL は API インターフェイスとローカライズされた認識 SDK を提供して展開を完了します。

EasyDLと特徴学習の比較

1) 画像の強化

特徴学習は、臨床検査室の顕微鏡画像に適した「L30 画像強化」を提供し、画像強化パラメータを調整してより優れた画像特徴を取得するために使用されます。強調された画像は強調されていない画像よりも鮮明で、細胞内の線はより明瞭で、背景はより純粋ですが、強調が過剰になる場合もあるため、顕微鏡とカメラのパラメータを調整する必要があります。

2) 画像のセグメンテーション、画像の分類、画像の注釈付け。

特徴学習ベースの高速カット分類・注釈ソフトウェア「L31 Image Annotation」システムを使用して、画像のカットを行うこともできます。 L31 は非常に使いやすいです。 1 つのセルを丸で囲み、セル分類をクリックするだけです。 L31 は自動的に画像のセグメンテーションを完了し、ラベル名として自動的に名前を付け、イントラネット画像データ サーバー「HomeShip\FH\Cell Name\」にアップロードします。

EasyDL のトレーニング画像は Baidu のプラットフォームにアップロードする必要があるため、画像クリーニング操作後、細胞、結晶、チューブ、菌類の各タイプを個別にアップロードできます。EasyDL で直接注釈を付けることや、注釈付きのトレーニング データを API 経由でアップロードすることもできます。

特徴学習には、画像の切り取り、分類、ラベル付けのシステムが付属しています

Baidu EasyDLデータ操作インターフェース

3) 画像のクリーニング:

画像クリーニングの目的は、トレーニング モデルがトレーニングを妨げる要因を減らすことができるように、対象オブジェクトに関係のない画像情報を削除することです。 「L33 特徴学習システム」には、学習画像を簡単かつ効率的に処理し、無効な情報を削除できる画像修正ツールが付属しています。写真編集プロセスには、わずか数ステップしか必要ありません。

1. 「ワイドボーダー」を2回クリックして境界線の範囲を広げます

2. 「背景をマーク」をクリックして、AIに背景色(小さな赤いボックス)を知らせます。

3. 「スマッジ」をクリックして無効な色や不純物を消去します

4. 「エッジを閉じる」をクリックして、セル本体を可能な限り画像の中央に配置します。

5.「画像を保存」をクリックして保存します

この組み込み画像修正ツールを使用すると、通常、画像を修正するのに 10 秒しかかかりません。

4) 画像のトレーニング、EasyDL 画像のアップロードとレビュー:

まず、http://ai.baidu.com/easydl/ で登録またはログインし、「トレーニングの開始」をクリックし、詳細については Baidu の公式の説明を参照してから、モデルを作成し、モデル名やその他の関連情報を入力します。

「トレーニングモデルを開始」をクリックし、トレーニング用に「画像分類」または「オブジェクト検出」モデルを選択します。

次に、オブジェクト検出モデルを例に、使用手順を詳しく紹介します。

ステップ 1: モデルを作成します。カスタムモデル名

作成したモデルが生成され、モデルIDが表示されます。

ステップ 2: データセットを作成します。特徴学習によって処理されたばかりのサブクラスの名前を使用して、データセットに自分で名前を付けることができます。ここでは正常赤血球と正常白血球の2つのデータセットが作成されます。作成後、右側の「注釈/アップロード」をクリックしてデータ画像をインポートします。一度にアップロードできる画像は 20 枚までですのでご注意ください。アップロードされたアトラスは特徴学習後に切り出された画像であるため、EasyDL の画像サイズ制限の対象にはなりません。

データをアップロードしたら、データの注釈付けを実行します。「ラベルの追加」をクリックし、フィーチャー画像を選択して、ラベル名を設定して保存します。「BLC」は白血球(主に好中球)を表します。赤血球および結晶の標識方法は白血球の場合と同じなので、詳細な説明は省略します。

特に大量のデータを持つモデルの場合、EasyDL は最近「スマート ラベリング」機能を開始しました。この機能は、「データセットのラベリング/アップロード」ステップで「スマート ラベリング」ボタンをクリックするだけで有効にできます。この機能は、モデル効果を向上させるために、より重要な画像を自動的に選択してラベル付けを優先し、残りの画像に事前ラベル付けします。これにより、データラベル付けプロセス全体の効率が大幅に向上し、非常に便利です。

ステップ 3: モデルをトレーニングします。データ セットがアップロードされたら、左側のナビゲーション バーにある [モデルのトレーニング] オプションをクリックします。赤血球を例にとると、トレーニング用の赤血球データ セットを選択します。敵対的トレーニングはエンドとクラウド間のデュアルプラットフォーム システム対決に基づいているため、「オフライン認識 SDK」オプションをチェックする必要はありません。ネットワーク接続なしで使用する場合は、SDK をオフラインでトレーニングするオプションをチェックできます。その後、Baidu の強力なクラウド プラットフォームがトレーニングを完了するまで、一定の時間を待つ必要があります。このトレーニングは約 1.5 時間続きます。

ステップ 4: モデルの検証。トレーニングが完了したら、左側のナビゲーション バーで [モデルの検証] をクリックします。

ステップ5: モデルリリース。モデルの効果が使用に十分であることを確認した後、「モデルのオンライン申請を送信」をクリックします。モデルのレビューは約 1 営業日以内に完了し、レビューに合格するとモデルをオンラインで展開できます。

機能学習画像レビュー:

特徴学習画像トレーニングには、「L33 画像学習システム」を使用する必要があります。このシステムは、特徴抽出方法エディター、画像ディレクトリ、トレーニング可能な画像リスト、特徴指標リスト、単一指標スコアリング、学習ステータスの 5 つの部分で構成されています。フィーチャの基本要素はフィーチャ メソッド エディターによって制御されるため、通常は変更しないことをお勧めします。

イメージ単体トレーニング:

1. まず、画像ディレクトリを通じてトレーニング アトラスのパスを確認します。

2. 最初のトレーニングでは、「すべていいえ」をクリックし、赤いボタン「トレーニングを開始」をクリックします。

3. 毎回、トレーニング画像の細胞端が自動的に識別されます。医師は、輪郭に細胞全体が含まれているかどうかを確認する必要があります。含まれている場合は、「はい」をクリックして、次の画像トレーニングに進みます。

4. トレーニングが完了すると、システムは「完了」を促し、「L33 画像学習システム」は「特徴インデックスリスト」で学習結果を自動的に計算します。クリックすると表示されます。

5. 利用できない画像については、「いいえ」をクリックして修正作業を中断するか、削除するか、修正を続行することができます。

6. 「L33 画像学習システム」は、チェックされた画像を自動的に使用可能な画像として設定するため、オプションはポップアップ表示されません。

具体的なトレーニング:

重みの調整: 特徴インデックス リストでは、識別するタイプの特性に応じて特徴インデックスを選択できます。選択されていないインデックスは計算に含まれません。例えば、赤血球は体積や円周が一定の範囲内にあるため使用可能ですが、結晶は大きさの制限はありませんが、形状や色に違いがあるため、特殊な色指示薬を使用することができます。

各インジケーターには独自の重みがあります。インジケーターをクリックすると、重みのステータスを選択できます。システムは、さまざまな重みオプションに基づいてインジケーターの重みレベルを自動的に計算し、次の計算でスコアリング基準を計画します。重量に応じてスコア棒の太さは異なりますが、スコアは次のトレーニング セッションでのみ更新されます。

重みを調整した後、赤いボタン「トレーニングを開始」を再度クリックすると、プログラムは 3 ~ 5 ポイント以内に新しいインジケーターの認識モデルをすばやく完成させます。

テスト認識:テスト認識は「L35 画像認識システム」に依存します。L35 はルート メイン システムのバックグラウンド システムであるため、操作インターフェイスがなく、開くには指示に頼る必要がありますが、L35 テスト指示ファイルを提供します。

テストモードでは、L35は細胞の種類を判定しませんが、その種類に対する各細胞の認識スコアを表示します。一般的に、認識モデルを満たす細胞(番号02は白血球)は陽性であり、モデルを満たさない細胞や画像品質が悪い細胞は陰性です。図では、白血球は基本的に陽性であり、モデルを満たさない細胞は陰性です。

場合によっては、付着画像が陽性になることがあります。この場合、尿沈渣メインシステムの認識スコア範囲を変更するか、抽出方法で画像分割機能を参照するだけで済みます。認識状況がまだ満足できない場合は、重みを調整して認識を正確に制御できます。成功するまで、さらに数回試すことができます。

正式な識別手順は尿沈渣メインシステムによって制御および呼び出され、識別結果は尿沈渣メインシステムに表示されます。メインシステムの正式な認識操作中に、誤った注釈が変更された場合、システムは変更されたセル画像を新しい学習サンプルとして自動的に要約し、次のシステム学習で自己アップグレードと反復を実現できます。

EasyDL モデルの展開:

EasyDL モデルが審査され承認された後、EasyDL 認識を使用するには 2 つの方法があります。1 つは、「Experience H5」を使用して H5 QR コードを生成し、認識用の画像をアップロードする方法です。さらに、モデルの API インターフェースを直接呼び出すことで効果をテストすることもできます。

敵対的アルゴリズムの実装:

EasyDL は、iOS、Android、Windows、Linux システムの端末デバイスへの展開をサポートし、デュアルフロントエンド AI 敵対的検証を実現できます。

EasyDL と特徴学習の現在の対立は、主に誤認識の相互修正に反映されています。次に、結果を手動で分析して、誤った画像をトレーニング モデルのデータセットに再度追加し、モデルを反復できるようにします。現在、敵対的トレーニングは手動で行う必要があります。

尿沈渣の臨床検査におけるさまざまな AI アルゴリズム/製品の長所と短所の比較:

EasyDL と機能学習の現在の利点と欠点:

EasyDL は Baidu が開発した高度な AI アルゴリズムであり、トレーニングしやすいディープラーニング画像認識モデル トレーニング プラットフォームとして位置付けられています。非常に強力な汎用認識機能、より簡単な画像カウントおよびオブジェクト認識ソリューションの展開機能を備えており、Baidu の強力なクラウド プラットフォーム トレーニングに依存しているため、企業のトレーニング サーバーとディープラーニングの人材への投資が節約され、企業はビジネスの製品化にさらに集中できます。

EasyDL はトレーニング画像のサイズに制限があるため、産業用顕微鏡や臨床用顕微鏡などの特定のシナリオで使用する場合、ストレージ容量が GB を超える画像を分割して、大きな画像のトレーニングと認識を実現する必要があります。医療用顕微鏡検査や産業用スキャン操作の場合、上流および下流の画像処理システムを通じて適応操作を実行できます。

EasyDL は、iOS、Android、Windows、Linux などの主要なプラットフォームとの互換性が向上しました。 WIN プラットフォームでは、winAPI を通じてサードパーティのソフトウェアもインテリジェントに開発できるため、企業の開発の難易度が軽減されます。

EasyDL は完全な生産性変換機能を備え、まさに産業および医療分野で必要とされる強力な画像認識カーネル システムです。

特徴学習の欠点は、画像セグメンテーション アルゴリズムに大きく依存していることです。より複雑な画像に直面した場合、個々の画像をセグメント化できないため、識別できません。したがって、特徴学習は、臨床細胞学、組織学、工業粒子検出、組立ライン品質検査など、特定の個別の種類の画像に限定されます。モデルの一般化の観点から見ると、特徴学習は特定のアプリケーション向けに完全にカスタマイズされたモデルであり、一般化機能を持つことはできません。

あらゆる AI 技術は人工知能の 1 つの側面に過ぎず、いずれも単独では産業応用の複雑な問題を解決することはできないため、さらに前進するためには互いの欠点を補う必要があります。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  なぜマスク氏の新しい「脳コンピューターインターフェース」は大きな進歩なのでしょうか?

>>:  AI機能をエッジに拡張する方法: ストレージが基盤となる

ブログ    
ブログ    

推薦する

9つの主要テーマ!機械学習アルゴリズム理論に関する面接の質問の要約

[[342976]]機械学習は、強力な理論的側面と実践的側面を備えた技術分野です。機械学習関連の仕事...

教育における人工知能の重要性とは何でしょうか?

未来は人工知能のものであるというのは議論の余地のない事実です。10年前に自動運転車や無人自動販売機に...

MITとIBMが共同で「コンピュータービジョンの黄金時代に備える」ための新しいデータセットを発表

人工知能の分野における画像分類問題に関して言えば、トレーニングとテストに最もよく使用されるデータセッ...

もう在宅勤務​​はしないのですか? GANの父イアン・グッドフェローは怒りのあまりアップルを辞職した

アップルに3年間在籍した後、同社の機械学習担当ディレクターのイアン・グッドフェロー氏が突然辞任を発表...

3つの大きなトレンドが浮上、我が国のドローン産業の発展の概要

我が国の戦略的新興産業の一つとして、ドローンの研究開発、製造、応用は現在、我が国で大きな注目を集めて...

アンドリュー・ン氏のチームが2019年のAIトレンドを振り返る:自動運転は寒い冬を迎え、ディープフェイクはモンスターとなった

あと数日で2019年も終わりです。今年は AI が夢から現実へと移り変わる年です。NLP から自動運...

大規模なオープンソースデータセットが衝撃的なスキャンダルを暴露、人気AI企業が関与していた

執筆者 | Qingzhu制作:51CTO テクノロジースタック(WeChat ID:blog)ビッ...

未来はAIエンジニアの手に。しかし変革を成功させるのは簡単ではない

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

Bard と ChatGPT: 2 つの言語モデルの頂点対決

Bard と ChatGPT は、それぞれ Google AI と OpenAI によって開発された...

人工知能の現状と今後の発展はどのようなものでしょうか?

まず、人工知能の現在の開発状況を理解しましょう。人工知能技術は現在、急速な発展期にあります。雨後の筍...

EU諸国の4分の1がAIによるサイバーセキュリティ管理を望んでいる

予想外かもしれませんが、消費者のかなりの部分は、サイバーセキュリティを生身のサイバーセキュリティ専門...

...

将来のモバイル通信ネットワーク、6Gと人工知能の統合

将来の 6G ネットワークのより豊富なビジネス アプリケーションと極めて厳しいパフォーマンス要件を満...

成熟したAIは独自のコードを書くべきだ。IBMは55の言語で5億行のコードデータセットを公開

[[400902]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

自動運転によりシェアリングエコノミーは再び普及するでしょうか?

自動運転技術の開発は常に議論の的となっています。自動運転の将来に関して、避けて通れない話題が1つあり...