デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する必要があり、デジタルツインが成功の鍵となります。

今日の世界では、データが王様です。 Amazon、Apple、Facebook、Google、Walmart、Netflix など、世界で最も価値のある企業には共通点が 1 つあります。それは、データが最も価値のある資産であるということです。これらの企業はすべて、ディープラーニング (DL) を使用してこのデータを活用します。

[[329342]]

どのようなビジネスに携わっていても、データは最も貴重な資産です。独自の DL を実行してこれらの資産を保護する必要があります。ディープラーニングを成功させるための最も重要な要素は、適切な種類のデータが十分にあることです。ここでデジタルツインが登場します。

デジタルツインは、実際の物理プロセス、システム、またはデバイスのデジタルレプリカです。簡単に言えば、デジタルツインは現実世界を仮想世界に再構築したものです。要するに、デジタルツインは、特に危険、高価、または時間のかかるプロセスを伴うディープラーニングプロジェクトの成功の鍵となる可能性があります。

ディープラーニングの将来性

現在までに、半導体製造業を含むほぼすべての業界が、DL が戦略的優位性を生み出す可能性を認識しています。ディープラーニングはニューラルネットワークを使用して高度なパターンマッチングを実行します。ディープラーニングは、顔認識や音声認識、医療画像分析、バイオインフォマティクス、材料検査など、さまざまな分野に応用されています。

半導体製造においては、製品の欠陥分類などの分野にディープラーニングが応用されています。大手企業のほとんどは、この有望な新しい競争環境で優位に立つために奮闘しています。

企業がディープラーニングとそのメリットを模索し始めると、多くの企業が次の 2 つの事実に気づきます。1 つ目は、ディープラーニングのプロトタイプを簡単に立ち上げられること。2 つ目は、「優れたプロトタイプ」から「製品品質」の結果を得るのは難しいことです。

現在、低コストから無料のディープラーニングプラットフォーム、ツール、キットが利用できるようになったため、ディープラーニングアプリケーションの初期開発は、通常のアプリケーション開発に比べて非常に迅速かつ比較的容易になりました。ただし、ディープラーニングアプリケーションの製品化は、従来のアプリケーションの製品化よりも簡単ではなく、より困難な場合もあります。

その理由はデータにあります。実稼働品質の結果をもたらさないディープラーニングアプリケーションと、特定の問題を解決する方法を完全に変えるディープラーニングアプリケーションの違いは、通常、十分なデータと、適切な種類のデータが十分にあるかどうかです。

ディープラーニングにおけるデータギャップ

ディープラーニングはパターンマッチングに基づいており、マッチングするターゲットを表すデータをニューラルネットワークに提示することで「プログラム」されます。大量のデータにより、ネットワークがオブジェクトを認識するように（そしてそれがオブジェクトではない場合を認識するように）トレーニングされます。

ディープラーニングには、プロトタイプを迅速に作成し、概念実証を提供する強力な機能があります。しかし、ディープラーニングの本当の利点は開発のスピードではありません。これは、データの力を解き放ち、他の方法ではできないことを可能にする事実です。

あらゆるディープラーニングアプリケーションの成功は、トレーニングに使用されるデータセットの深さと幅によって決まります。トレーニングデータセットが小さすぎたり、狭すぎたり、または「標準的」すぎる場合、ディープラーニング手法は標準的な手法よりも優れた結果を出すことはできません。実際、もっと悪い結果になるかもしれません。ネットワークが目の前の問題の正しい性質を把握できるように、すべての重要な状態やデモンストレーションを表すのに十分なデータでネットワークをトレーニングすることが重要です。

自動運転や半導体製造などの一部の分野で難しいのは、最も深刻な異常のいくつかが（幸いなことに）めったに発生しないことです。しかし、ディープラーニングアプリケーションで、車の前を走る子供 (または致命的なフォトマスクエラー) を認識するには、このようなケースを多数使用してネットワークをトレーニングする必要がありますが、現実には、現実世界にはこのようなデータはそれほど多くありません。デジタルツインは、ネットワークがこれらの状態を認識できるように適切にトレーニングするのに十分な異常データを作成する唯一の方法です。

上図は標準偏差をつけた正規分布曲線です。半導体製造では、運転と同様に、「異常」なイベントは非常にまれですが、最悪のケースではチップが故障する可能性があるため、ニューラルネットワークはできるだけ多くの異常なイベントについてトレーニングする必要があります。全体的な平均効果は十分ではありません。

デジタルツインがギャップを埋める

実際のプロセス、システム、機器を仮想的に表現したデジタルツインは、ディープラーニングネットワークを正常にトレーニングするために適切な量と種類のデータを作成するための重要なツールです。

デジタルツインを使用して DL トレーニングデータを作成する理由はいくつかあります。

取得するデータは顧客のものである可能性があるため、ディープラーニングのトレーニングに使用することはできません。
ディープラーニングに必要なデータを作成するリソースを、クライアントのプロジェクトに完全に割り当てなければならない場合があります。
ディープラーニングアプリケーションを開発しましたが、ニューラルネットワークを必要な精度に調整してトレーニングするには特定のデータが必要であることがわかりましたが、ファブリソースを使用してデータを作成するコストは法外に高額です。
ディープラーニングネットワークを適切にトレーニングするのに十分な異常データを見つけることができないことはご存じでしょう。最後の状況はほぼ普遍的です。

理想的には、データを完全に制御するには、3 つのデジタルツインが必要です。つまり、独自のプロセスをシミュレートするための入力データを提供するために生産パイプラインで先行するプロセス/機器のデジタルツイン、独自のプロセス/機器のデジタルツイン、および検証のために出力を下流に送ることができるように生産パイプラインでプロセス/機器に続くデジタルツインです。

2019 SPIE レチクルテクノロジーカンファレンスで、D2S はディープラーニング技術を使用して作成された 2 つのデジタルツイン、走査型電子顕微鏡 (SEM) デジタルツインと間接リソグラフィー技術 (ILT) デジタルツインを紹介する論文を発表しました (図 2 は SEM デジタルツインの出力を示しています)。デジタルツインの出力は一般に製造業には不十分ですが、これらのデジタルツインはディープラーニングニューラルネットワークのトレーニングと検証に使用されてきました。重要なのは、これらのデジタルツインはシミュレーションではなくディープラーニングによって生成されることです。

これは、ディープラーニングを他の DL に必要なデータを生成するツールとして使用する例であり、ディープラーニングへの投資による複利的なメリットを示しています。

上図は、SEM デジタルツインによって生成されたマスク SEM 画像と実際の SEM 画像の 2 つの例を示しています。同じ位置の水平カットラインに沿った画像強度も表示されます。画像が非常に似ているだけでなく、エッジでの信号応答も同様です。

ディープラーニングの成功へのロードマップ

これらすべては大変な作業のように思えます。コンサルティング会社にディープラーニングを依頼してみませんか? 忘れないでください、データが王様です! データを保護し、ディープラーニングを自分で実行しましょう。ありがたいことに、私たちが従うことができる確立された成功への道があります。

まず、ディープラーニングに影響を与えるプロジェクトを特定する必要があります。慎重に選択する必要があります。ディープラーニングはパターンマッチングなので、その分野に該当するものを選択する必要があります。欠陥分類などの画像ベースのアプリケーションに適しています。工場内のすべての装置は、問題が発生しない限りほとんど参照されない大量の動作データを作成します。

この貴重なデータを事後の診断ツールとして使用するだけでなく、工場全体のデータを継続的に監視し、問題が発生する前のパターンにフラグを立てるようにディープラーニングアプリケーションをトレーニングすることで、問題が影響を及ぼす前に特定して修正し、ダウンタイムを節約できます。

たとえば、Mycronic 社は、2020 SPIE Advanced Lithography Conference での eBeam Initiative ランチタイムプレゼンテーションで、マシンログファイルのデータを使用してディープラーニングを活用し、「ムラ」（人間にとっては不快な明るさの不均一な効果）などの異常を予測する方法を明らかにしました。これは、フラットパネルディスプレイ (FPD) マスクでは画像処理アルゴリズムで検出するのが非常に難しいことで知られています。

多くの場合、オペレーターは非常に面倒でエラーが発生しやすいプロセスを実行しますが、従来のアルゴリズムを使用して自動化することは困難であるため、ディープラーニングに適しています。目視検査であろうと他の手段であろうと、特定の状況を検査する専門家は、その作業を正しく実行できる可能性が非常に高くなります。しかし、同様の状況の例を数多く経験すると、人間は間違いを犯し、ますます信頼できなくなっていきます。

状況によっては、ディープラーニングは人間ほど優れていない可能性があります。しかし、場合によっては人間よりも優れた結果を出すこともあります。人間はタスクに費やす時間が長くなるにつれてミスが増えますが、ディープラーニングの成功確率は量や時間とともに低下することはありません。

ディープラーニングの成功へのギャップを埋める

ディープラーニングプロジェクトを特定したら、データを厳密に制御しながら成功への道を歩むためのさまざまなリソースを利用できます。ディープラーニングを初めて使用し、ディープラーニングのパイロットプロジェクトに対する包括的なサポートをご希望の場合は、Center for Deep Learning for Electronics Manufacturing (CDLe、www.cdle.ai) に参加できます。これは、才能とリソースを結集して当社独自の問題領域におけるディープラーニングの最先端技術を推進し、企業全体のあらゆる製品へのディープラーニングの導入を加速して、お客様に提供する製品を改善することを目的とした業界リーダーのコンソーシアムです。

すでにディープラーニングプロジェクトを開始しているが、ディープラーニングデータのギャップが原因で問題が発生している場合は、D2S が、DL を成功させるために強化および適応させるために必要なデジタルツインの構築をお手伝いします。

<<: 人工知能が建設業界の様相を変えている

>>: 自動運転車は交通事故のほとんどをなくすことはできないかもしれない