導入 異常検出に関するいくつかの入門的な質問。 質問することは学習するための最良の方法の一つです。しかし、特に異常検出のように比較的馴染みのあるトピックの場合、どこから始めればよいのか、何を質問すればいいのかわからないことがあります。この場合、他の人の問題に耳を傾け、その考えを参考にして学習を進めるのが最善です。ここでは、「何でも聞いてください: 異常検出」ウェビナー中に寄せられた質問をいくつか紹介します。開始する際にお役立てください。 外れ値と外れ値の違いは何ですか? 外れ値とは、分布の位置または平均から遠く離れた観測値です。ただし、必ずしも異常な動作や異なるプロセスから生じる動作を表すわけではありません。一方、異常は、さまざまなプロセスによって生成されるデータ パターンです。 医薬品における異常検出の応用はありますか? 異常検出は、製薬ライフサイエンス分野で多くの用途があります。医薬品製造におけるプロセス監視および品質管理のための統計的プロセス管理 (SPC) または品質管理 (QC) および多変量プロセス管理 (MSPC) チャートの使用が含まれます。異常をタイムリーに検出することが、異常な事象を回避し、安全基準を遵守するための鍵となります。店頭取引における異常を発見することで、医薬品小売データにおける処方薬の乱用を阻止することができます。複数パラメータの臨床試験データにおける異常をリアルタイムで検出することで、臨床試験の成功を確実にすることができます。 GAN は異常検出にも使用されますか? その場合、業界での使用例を教えてください。 生成的敵対的ネットワーク (GAN) は、異常の識別に非常に効果的な新しい教師なし学習方法です。 GAN は反復的に設計されており、敵対的トレーニングは再構築されたサンプルを使用して残差損失を最適化することを目的としているため、半構造化データと非構造化データでうまく機能します。これらは、医療画像分析(放射線科医が識別が難しい腫瘍を見つけるのに役立ちます)、顔認識、テキストから画像への変換などに非常に役立ちます。 データの相関関係は異常検出に影響しますか? どのような方法を使用でき、これらの影響をどのように軽減できますか? 異常検出を開始する前に相関データをクリーンアップして削除したほうがよいでしょうか? ウェビナーで述べたように、相関関係が異常検出に影響を与えるとは考えていませんが、相関関係のある変数をどのように扱うかを判断するのに役立つ多くの手法があります。 1 つの提案は、主成分分析 (PCA) などの手法を使用して次元を削減することです。 ネットワーク アクティビティまたはデータ内の異常なアクティビティの識別に関連する異常を検出するのに適していると推奨されるアルゴリズムは何ですか? ウェビナーで述べたように、異常検出のさまざまなアプリケーションやユースケースに適したアプローチやアルゴリズムは数多くあります。その中には、リカレントニューラルネットワーク (RNN)、敵対的生成ネットワーク (GAN)、アイソレーションフォレスト、ディープオートエンコーダーなどがあります。ネットワーク/グラフ分析に特に興味がある場合、ネットワーク グラフ内の異常を識別するために使用される 2 つの主な方法は、直接近隣外れ値検出アルゴリズム (DNODA) とコミュニティ近隣アルゴリズム (CNA) です。 私の現在の仕事では、「新しさ」を見つけることが主な目的です。品質管理チャートは既知のパターンには有効ですが、新しいパターンを自動的に識別することは困難です。この点に関して役立つツールのアイデアをいくつか得たいと思っていました。 単変量品質管理チャートの場合、西洋の電気規則を使用していくつかの共通パターンを検出できます。部分最小二乗法 (PLS) などの従来の多変量法は、単変量法では検出できない複数の変数を含むパターンを捕捉します。オートエンコーダーは最も包括的なツールであり、最も広範囲のさまざまなパターンをカバーします。多変量、周期的、非線形、インタラクティブなパターンをキャプチャできます。通常のデータセットを使用してオートエンコーダをトレーニングすると、トレーニング セットには存在しなかった新しいデータに現れるパターンにラベルが付けられます。 PCA を実行して次元を減らすと、データセット内の異常に影響しますか? 異常は消えますか? もしそうなら、どうすればそれを防ぐことができますか? PCA を実行すると、元のデータセット内の分散の一定の割合が取得されます。したがって、異常検出に PCA を使用する方法は、元の点から低次元空間で表された点までの「距離」を計算することです。距離が大きいほど(つまり、観測値を低次元空間にマッピングするときに「失われる」ものが多いほど)、異常であるとみなされます。 |
<<: Facebook AI はディープラーニングを使用してプログラミング言語の変換を実現し、コードベースの移行はもはや困難ではありません。
>>: 人工知能技術はスマートビルの未来をどのように変えるのでしょうか?
GPT-4 はすでに人間がチップを作るのに役立っています!ニューヨーク大学タンドン工学部の研究者た...
現在、この写真は AI コミュニティで広く流布されています。さまざまな文化ビデオ モデルの誕生時期、...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
今後20年間で、人工知能やロボット、ドローン、自動運転車などの関連技術により、中国での雇用は約12%...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
企業は AI ツールを使用して、顧客ロイヤルティにプラスの影響を与え、利益を増やすことができる会話型...
回帰アルゴリズムといえば、理解しやすく非常に単純なため、多くの人が線形回帰を思い浮かべると思います。...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
多くの企業にとっての優先事項は、人間の労働者を AI に置き換えることではなく、人間の能力を増強し、...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
記憶の道をたどってみると、この時代に人類がどれだけ進歩したかがわかるでしょう。昔は、愛する人に手紙を...
Google待望の大躍進、 Gemini大型モデルがついに発売!最も目を引くのは、次の写真とビデオで...