デジタルツインがディープラーニングのデータ格差を埋める

デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する必要があり、デジタル ツインが成功の鍵となります。

今日の世界では、データが王様です。 Amazon、Apple、Facebook、Google、Walmart、Netflix など、世界で最も価値のある企業には共通点が 1 つあります。それは、データが最も価値のある資産であるということです。これらの企業はすべて、ディープラーニング (DL) を使用してこのデータを活用します。

[[329342]]

どのようなビジネスに携わっていても、データは最も貴重な資産です。独自の DL を実行してこれらの資産を保護する必要があります。ディープラーニングを成功させるための最も重要な要素は、適切な種類のデータが十分にあることです。ここでデジタルツインが登場します。

デジタル ツインは、実際の物理プロセス、システム、またはデバイスのデジタル レプリカです。簡単に言えば、デジタルツインは現実世界を仮想世界に再構築したものです。要するに、デジタル ツインは、特に危険、高価、または時間のかかるプロセスを伴うディープラーニング プロジェクトの成功の鍵となる可能性があります。

ディープラーニングの将来性

現在までに、半導体製造業を含むほぼすべての業界が、DL が戦略的優位性を生み出す可能性を認識しています。ディープラーニングはニューラル ネットワークを使用して高度なパターン マッチングを実行します。ディープラーニングは、顔認識や音声認識、医療画像分析、バイオインフォマティクス、材料検査など、さまざまな分野に応用されています。

半導体製造においては、製品の欠陥分類などの分野にディープラーニングが応用されています。大手企業のほとんどは、この有望な新しい競争環境で優位に立つために奮闘しています。

企業がディープラーニングとそのメリットを模索し始めると、多くの企業が次の 2 つの事実に気づきます。1 つ目は、ディープラーニングのプロトタイプを簡単に立ち上げられること。2 つ目は、「優れたプロトタイプ」から「製品品質」の結果を得るのは難しいことです。

現在、低コストから無料のディープラーニング プラットフォーム、ツール、キットが利用できるようになったため、ディープラーニング アプリケーションの初期開発は、通常のアプリケーション開発に比べて非常に迅速かつ比較的容易になりました。ただし、ディープラーニング アプリケーションの製品化は、従来のアプリケーションの製品化よりも簡単ではなく、より困難な場合もあります。

その理由はデータにあります。実稼働品質の結果をもたらさないディープラーニング アプリケーションと、特定の問題を解決する方法を完全に変えるディープラーニング アプリケーションの違いは、通常、十分なデータと、適切な種類のデータが十分にあるかどうかです。

ディープラーニングにおけるデータギャップ

ディープラーニングはパターンマッチングに基づいており、マッチングするターゲットを表すデータをニューラルネットワークに提示することで「プログラム」されます。大量のデータにより、ネットワークがオブジェクトを認識するように(そしてそれがオブジェクトではない場合を認識するように)トレーニングされます。

ディープラーニングには、プロトタイプを迅速に作成し、概念実証を提供する強力な機能があります。しかし、ディープラーニングの本当の利点は開発のスピードではありません。これは、データの力を解き放ち、他の方法ではできないことを可能にする事実です。

あらゆるディープラーニング アプリケーションの成功は、トレーニングに使用されるデータセットの深さと幅によって決まります。トレーニング データセットが小さすぎたり、狭すぎたり、または「標準的」すぎる場合、ディープラーニング手法は標準的な手法よりも優れた結果を出すことはできません。実際、もっと悪い結果になるかもしれません。ネットワークが目の前の問題の正しい性質を把握できるように、すべての重要な状態やデモンストレーションを表すのに十分なデータでネットワークをトレーニングすることが重要です。

自動運転や半導体製造などの一部の分野で難しいのは、最も深刻な異常のいくつかが(幸いなことに)めったに発生しないことです。しかし、ディープラーニング アプリケーションで、車の前を走る子供 (または致命的なフォトマスク エラー) を認識するには、このようなケースを多数使用してネットワークをトレーニングする必要がありますが、現実には、現実世界にはこのようなデータはそれほど多くありません。デジタル ツインは、ネットワークがこれらの状態を認識できるように適切にトレーニングするのに十分な異常データを作成する唯一の方法です。


上図は標準偏差をつけた正規分布曲線です。半導体製造では、運転と同様に、「異常」なイベントは非常にまれですが、最悪のケースではチップが故障する可能性があるため、ニューラル ネットワークはできるだけ多くの異常なイベントについてトレーニングする必要があります。全体的な平均効果は十分ではありません。

デジタルツインがギャップを埋める

実際のプロセス、システム、機器を仮想的に表現したデジタル ツインは、ディープラーニング ネットワークを正常にトレーニングするために適切な量と種類のデータを作成するための重要なツールです。

デジタル ツインを使用して DL トレーニング データを作成する理由はいくつかあります。

  • 取得するデータは顧客のものである可能性があるため、ディープラーニングのトレーニングに使用することはできません。
  • ディープラーニングに必要なデータを作成するリソースを、クライアントのプロジェクトに完全に割り当てなければならない場合があります。
  • ディープラーニング アプリケーションを開発しましたが、ニューラル ネットワークを必要な精度に調整してトレーニングするには特定のデータが必要であることがわかりましたが、ファブ リソースを使用してデータを作成するコストは法外に高額です。
  • ディープラーニング ネットワークを適切にトレーニングするのに十分な異常データを見つけることができないことはご存じでしょう。最後の状況はほぼ普遍的です。

理想的には、データを完全に制御するには、3 つのデジタル ツインが必要です。つまり、独自のプロセスをシミュレートするための入力データを提供するために生産パイプラインで先行するプロセス/機器のデジタル ツイン、独自のプロセス/機器のデジタル ツイン、および検証のために出力を下流に送ることができるように生産パイプラインでプロセス/機器に続くデジタル ツインです。

2019 SPIE レチクル テクノロジー カンファレンスで、D2S はディープラーニング技術を使用して作成された 2 つのデジタル ツイン、走査型電子顕微鏡 (SEM) デジタル ツインと間接リソグラフィー技術 (ILT) デジタル ツインを紹介する論文を発表しました (図 2 は SEM デジタル ツインの出力を示しています)。デジタル ツインの出力は一般に製造業には不十分ですが、これらのデジタル ツインはディープラーニング ニューラル ネットワークのトレーニングと検証に使用されてきました。重要なのは、これらのデジタル ツインはシミュレーションではなくディープラーニングによって生成されることです。

これは、ディープラーニングを他の DL に必要なデータを生成するツールとして使用する例であり、ディープラーニングへの投資による複利的なメリットを示しています。

上図は、SEM デジタルツインによって生成されたマスク SEM 画像と実際の SEM 画像の 2 つの例を示しています。同じ位置の水平カットラインに沿った画像強度も表示されます。画像が非常に似ているだけでなく、エッジでの信号応答も同様です。

ディープラーニングの成功へのロードマップ

これらすべては大変な作業のように思えます。コンサルティング会社にディープラーニングを依頼してみませんか? 忘れないでください、データが王様です! データを保護し、ディープラーニングを自分で実行しましょう。ありがたいことに、私たちが従うことができる確立された成功への道があります。

まず、ディープラーニングに影響を与えるプロジェクトを特定する必要があります。慎重に選択する必要があります。ディープラーニングはパターンマッチングなので、その分野に該当するものを選択する必要があります。欠陥分類などの画像ベースのアプリケーションに適しています。工場内のすべての装置は、問題が発生しない限りほとんど参照されない大量の動作データを作成します。

この貴重なデータを事後の診断ツールとして使用するだけでなく、工場全体のデータを継続的に監視し、問題が発生する前のパターンにフラグを立てるようにディープラーニング アプリケーションをトレーニングすることで、問題が影響を及ぼす前に特定して修正し、ダウンタイムを節約できます。

たとえば、Mycronic 社は、2020 SPIE Advanced Lithography Conference での eBeam Initiative ランチタイム プレゼンテーションで、マシン ログ ファイルのデータを使用してディープラーニングを活用し、「ムラ」(人間にとっては不快な明るさの不均一な効果)などの異常を予測する方法を明らかにしました。これは、フラット パネル ディスプレイ (FPD) マスクでは画像処理アルゴリズムで検出するのが非常に難しいことで知られています。

多くの場合、オペレーターは非常に面倒でエラーが発生しやすいプロセスを実行しますが、従来のアルゴリズムを使用して自動化することは困難であるため、ディープラーニングに適しています。目視検査であろうと他の手段であろうと、特定の状況を検査する専門家は、その作業を正しく実行できる可能性が非常に高くなります。しかし、同様の状況の例を数多く経験すると、人間は間違いを犯し、ますます信頼できなくなっていきます。

状況によっては、ディープラーニングは人間ほど優れていない可能性があります。しかし、場合によっては人間よりも優れた結果を出すこともあります。人間はタスクに費やす時間が長くなるにつれてミスが増えますが、ディープラーニングの成功確率は量や時間とともに低下することはありません。

ディープラーニングの成功へのギャップを埋める

ディープラーニング プロジェクトを特定したら、データを厳密に制御しながら成功への道を歩むためのさまざまなリソースを利用できます。ディープラーニングを初めて使用し、ディープラーニングのパイロット プロジェクトに対する包括的なサポートをご希望の場合は、Center for Deep Learning for Electronics Manufacturing (CDLe、www.cdle.ai) に参加できます。これは、才能とリソースを結集して当社独自の問題領域におけるディープラーニングの最先端技術を推進し、企業全体のあらゆる製品へのディープラーニングの導入を加速して、お客様に提供する製品を改善することを目的とした業界リーダーのコンソーシアムです。

すでにディープラーニング プロジェクトを開始しているが、ディープラーニング データのギャップが原因で問題が発生している場合は、D2S が、DL を成功させるために強化および適応させるために必要なデジタル ツインの構築をお手伝いします。

<<:  人工知能が建設業界の様相を変えている

>>:  自動運転車は交通事故のほとんどをなくすことはできないかもしれない

ブログ    
ブログ    
ブログ    

推薦する

無意味または有害なボットトラフィックは年間最大2億5000万ドルのコストがかかる

Cyber​​news によると、ますます多くの企業が、検出がますます困難になっている悪意のあるボッ...

...

史上最大規模のAIによる疫病対策キャンペーン

普段は人工知能技術にあまり興味がない人でも、この特別な期間中はAIという文字の組み合わせに注目するで...

[ビッグガイがやってくるエピソード9] データセキュリティとデータベースセキュリティの黄金律

[51CTO.com からのオリジナル記事] ライブショー「ビッグネームがやってくる」の今回のエピソ...

RDA を使用してデータの問題を解決し、AIOps の実装を加速する方法

【51CTO.com クイック翻訳】ロボティックデータオートメーション (RDA) とは?ロボティッ...

音声インターフェース:私たちはインタラクションの次の時代の瀬戸際にいる

[[185877]]コンピュータ処理、音声認識、モバイル通信、クラウドコンピューティング、ニューラル...

テンセント AI ラボが初の自動モデル圧縮フレームワークのソースを公開: ディープラーニングをポケットに

テンセントAIラボ機械学習センターは本日、世界初の自動ディープラーニングモデル圧縮フレームワーク「P...

Nvidia は Arm を買収して何をしたいのでしょうか?中国の承認後、クアルコムの影が再び現れる

またタトゥー?興味深いのは、この取引の解約手数料の詳細がまだ発表されていないことです。現時点では、独...

[ディープラーニングシリーズ] PaddlePaddleとTensorflowでGoogLeNet InceptionV2/V3/V4を実装する

前回の記事では、GoogLeNet InceptionV1のネットワーク構造を紹介しました。この記事...

コンピュータービジョンを使用してフィッシング攻撃を検出するにはどうすればよいでしょうか?

好きでも嫌いでも、あるいは恐れていても、ChatGPT に代表される新興の人工知能 (AI) プラッ...

任意のデータセットに基づいて LLM (大規模言語モデル) ロボットを作成する

今日、偶然Embedchainというウェアハウスを見つけ、とても便利だと思ったので、皆さんとシェアし...

企業は生成 AI のリスクをどのように管理できるでしょうか?

生成 AI の導入は昨年急増しました。このテクノロジーはイノベーションと生産性の向上を約束する一方で...

ChatGLM-6Bを最適化するにはどうすればいいですか?たった 1 行のコード | 最も「流行」のモデル

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

マイクロソフトアジアリサーチは、知識蒸留を使用して小さなViTを改善するTinyMIMを提案

1. 研究の動機マスクモデリング (MIM、MAE) は、非常に効果的な自己教師ありトレーニング方法...