翻訳者 | 朱 仙中 校正 | 梁哲、孫淑娟 まとめ人工知能 (AI) ベースのシステムは大きな可能性を秘めており、さまざまな複雑なタスクを支援するためにますます使用されるようになっています。ただし、不確実性という課題があるため、結果は完全に信頼できるものではありません。不確実性の定量化 (UQ) は、最適化および意思決定プロセスにおける不確実性を軽減する上で重要な役割を果たし、科学、ビジネス、エンジニアリングにおけるさまざまな実用的なアプリケーションに対処するために使用できます。 本稿では、不確実性の概念、発生源、種類、測定方法を簡単に紹介し、ベイズ技術を使用した多数の UQ 手法を要約し、既存の文献の問題点とギャップを指摘し、さらなる開発の方向性を提案し、人工知能による金融犯罪対策の応用事例を要約します。 導入近年、イベントや環境の変化に応じて自動的にアクションを実行する、プロアクティブな性質を持つ AI ベースのシステムを使用するニーズが高まっています。これらのシステムは、アクティブなデータベースから、今日の企業の中核となるビジネス プロセスを推進するアプリケーションまで、さまざまな領域にわたります。ただし、多くの場合、システムが応答する必要があるイベントは監視ツールによって生成されるのではなく、複雑な時間的述語に基づいて他のイベントから推測される必要があります。機械学習 (ML) モデルは、トレーニング データに基づいて最適なソリューションを生成します。多くのアプリケーションでは、このような推論は本質的に非決定的です。ただし、データとモデル パラメータの不確実性が考慮されていない場合、この最適なソリューションは、実際の展開では失敗するリスクが依然として高くなります。 一般的な AI ベースのシステム パイプラインには、データの収集、データの前処理、データから学習するモデルの選択、モデルをトレーニングするための学習アルゴリズムの選択、学習したモデルからの推論の導出が含まれます。しかし、これらの各ステップは本質的に不確実です。たとえば、データの不確実性は、現実世界のデータを確実に収集または表現できないことから生じる可能性があります。凝固、クリーニング、ラベル付けなどのデータの前処理における不完全さも、データの不確実性の一因となる可能性があります。モデルは現実世界の代理としてのみ機能し、学習および推論アルゴリズムはさまざまな単純化された仮定に依存しているため、モデリングと推論に不確実性が生じます。 AI システムによる予測は、これらすべての不確実性の原因の影響を受けやすく、信頼性の高い不確実性評価は、AI システムの開発者とユーザーにとって重要な判断基準となります。たとえば、データの不確実性が高い場合は、データ記述プロセスを改善する必要がある可能性があり、モデルの不確実性が高い場合は、より多くのデータを収集する必要がある可能性があります。ユーザーにとって、正確な不確実性は、特に効果的なコミュニケーション戦略と組み合わせると、AI 支援による意思決定を改善するために不可欠な透明性と信頼の重要な層を追加できます。 AI システムにこのような信頼を与えることは、医療、金融、社会科学などの重要なアプリケーションで AI システムを信頼性高く導入するために不可欠です。 AI システムにおける UQ を改善するために多くの方法が提案されていますが、特定の UQ 方法の選択は、ベースモデル、機械学習タスクの種類 (回帰、分類、セグメンテーション)、データの特性、機械学習モデルの透明性、最終目標など、多くの要因によって異なります。不適切に使用すると、特定の UQ 方法によって不正確な不確実性の推定値が生成され、ユーザーに誤解を与える可能性があります。さらに、不確実性の推定値が非常に正確であっても、適切に伝達されなければ誤解を招く可能性があります。 この論文では、不確実性の種類とその原因について詳しく説明し、UQ アプローチについて説明し、不確実性モデリングを形式化し、複雑なシステムにおけるその概念について説明します。この記事では、ベイズ手法を使用して ML における不確実性を定量化するさまざまなアプローチの概要を説明します。さらに、不確実性尺度の評価は、分類、回帰、セグメンテーションなどのさまざまな機械学習タスクでも注目されています。この論文では、UQ アプローチのキャリブレーション用語を提供することで文献のギャップを埋め、金融犯罪分野における UQ の実際の応用を実証し、そのようなシステムの一般的な評価フレームワークを開発します。 恣意的な不確実性偶然性不確実性 (「統計的不確実性」とも呼ばれる) は、同じ実験を実行するたびに異なる未知の量を表します。偶然性不確実性とは、確率の変動性から生じる固有の不確実性を指します。基礎となる変数には常に変動性があるため、このタイプの不確実性は軽減できません。これらの不確実性は確率分布によって特徴付けられます。たとえば、機械式の弓から発射された矢は、毎回の射撃でまったく同じ(同じ加速度、高度、方向、最終速度)になり、矢の軸のランダムで複雑な振動によりターゲットの同じ点に当たることはありません。また、このような知識は、結果として生じる着弾点の分散を排除するのに十分なほど決定することはできません。 認識論的不確実性認識論的不確実性(「体系的不確実性」とも呼ばれる)とは、原理的には知ることができるが、実際には知らない事柄を指します。認識論的不確実性とは、限られたデータと知識から生じるプロセス モデルにおける科学的な不確実性です。認識論的不確実性は代替モデルによって特徴付けられます。離散ランダム変数の場合、認識論的不確実性は代替確率分布を使用してモデル化されます。このような不確実性の原因の一例として、地球の表面近くの重力による加速度を測定するために設計された実験が挙げられます。一般的に使用される重力加速度 9.8 m/s² は空気抵抗の影響を無視していますが、物体の空気抵抗を測定してそれを実験に組み込むことで、重力加速度の計算における不確実性を減らすことができます。 恣意性と認識論的不確実性が相互作用する偶然性不確実性と認識論的不確実性は、単一の用語内で同時に発生することもあります。たとえば、実験パラメータが偶然性不確実性を示し、これらの実験パラメータがコンピューター シミュレーションに入力される場合などです。不確実性の定量化に使用する場合は、ガウス過程や多項式カオス展開など、コンピュータ実験で知られている代替モデルが使用されます。このような代替モデルは、実験パラメータの偶然性不確実性に依存するか、または相互作用する認識論的不確実性を示します。この不確実性は、もはや恣意性または認識性のいずれかだけに分類することはできず、より一般的な推論の不確実性です。実際のアプリケーションでは、両方のタイプの不確実性が存在します。不確実性の定量化は、これら 2 種類の不確実性を個別に明示的に表現することを目的としています。 偶然性不確実性の定量化は比較的単純であり、伝統的な(頻度主義的)確率が最も基本的な形式です。よく使われる手法にはモンテカルロ法があります。認識論的不確実性を評価するには、システム、プロセス、またはメカニズムに関する知識の欠如を理解しようとする必要があります。認識論的不確実性は、多くの場合、ベイズ確率の観点から理解されます。確率は、合理的な人が特定の主張についてどの程度確信を持っているかを示すものとして解釈されるためです。 モデルとデータの不確実性モデルの不確実性には、モデルの不完全性によって引き起こされる不確実性が含まれます。これは、トレーニング中に不適切なモデル構造を使用することによって発生したエラー、または未知のサンプルやトレーニング データセットの不十分なカバレッジによって発生した知識不足が原因である可能性があります。対照的に、データの不確実性は、データから直接生じる不確実性に関係します。データの不確実性は、現実世界を表現する際やデータ サンプル内の分布を表現する際に情報が失われることによって発生します。モデルの不確実性には、モデルの不完全性によって引き起こされる不確実性が含まれます。これは、トレーニング プロセスのエラー、不十分なモデル構造、または未知のサンプルやトレーニング データセットの不十分なカバレッジによる知識不足が原因である可能性があります。対照的に、データの不確実性は、データから直接生じる不確実性に関係します。データの不確実性は、現実世界を表現する際の情報の損失とデータ サンプル内の分布によって発生します。 たとえば、回帰タスクでは、入力とターゲットの測定値のノイズにより、ネットワークが修正する方法を学習できないデータの不確実性が発生する可能性があります。分類タスクでは、サンプルに含まれる情報がカテゴリを 100% の確実性で識別するのに十分でない場合、予測データに不確実性が生じます。情報損失は、たとえば、現実世界の情報を表すために特定の解像度の画像ピクセルを使用したり、ラベル付けプロセスでエラーが発生したりすることによって、測定システムの結果発生します。 理論的には、アーキテクチャ、学習プロセス、またはトレーニング データセットを改善することでモデルの不確実性を減らすことは可能ですが、データの不確実性は考慮されません。 予測の不確実性入力データ領域に基づいて、予測の不確実性は次の 3 つの主要なカテゴリに分類できます。
図1: 不確実性の種類 不確実性と変動性技術専門家は、不確実な量の「範囲」を推定するよう求められることがよくあります。変動性の範囲を示すよう求められているのか、不確実性の範囲を示すよう求められているのかを区別することが重要です。同様に、モデル作成者にとっては、変動性または不確実性のどちらをモデル化しているのか、また、それらの関係(もしあれば)がどのようなものかを理解することが重要です。 不確実性の源
質問タイプ不確実性の定量化には、主に 2 つのタイプの問題があります。1 つは不確実性の順方向伝播 (さまざまな不確実性の原因がモデルを通じて伝播され、システム応答の全体的な不確実性が予測される)、もう 1 つはモデル不確実性とパラメータ不確実性の逆評価 (テスト データを使用してモデル パラメータを同時に調整する) です。 不確実性の前方伝播不確実性の伝播とは、不確実性を入力に伝播するシステムの出力における不確実性を定量化することです。不確実性の原因に記載されているパラメータの変動が出力に与える影響に焦点を当てています。不確実性伝播解析の目的は次のとおりです。
モデルの不確実性とパラメータの不確実性の逆評価システムのいくつかの実験測定データとその数学モデルのいくつかのコンピューターシミュレーション結果が利用可能な場合、逆不確実性定量化は、実験と数学モデル間の差(バイアス補正と呼ばれる)とモデル内に存在する未知のパラメータ値(パラメータキャリブレーションまたは単にキャリブレーションと呼ばれる)の両方を推定します。一般に、これは前方不確実性伝播よりもはるかに難しい問題ですが、モデル更新プロセス中に実装されることが多いため、非常に重要です。 逆不確実性定量化にはいくつかのケースがあります。
図2: 不確実性の定量化における問題の種類 数学的表現先ほど述べたように (図 1)、予測の不確実性は認識論的不確実性と偶然性不確実性の 2 つの部分で構成されており、これら 2 つの部分の合計として次のように表すことができます。 認識論的不確実性は、モデルパラメータ上の確率分布として表現できます。 作る: 次の入力を持つトレーニング データセットを表します。 対応するカテゴリー: ここで、C はカテゴリの数を表します。目標は、目的の出力を生成する次の関数の ω パラメータを最適化することです。 これを実現するために、ベイズアプローチを使用してモデルの尤度関数が定義されます。 分類には、次のソフトマックス尤度関数を使用できます。 方程式1 回帰の場合、ガウス尤度を仮定できます。 式2 上記の式では、τ はモデルの精度を表します。そして事後分布は次のようになります。 与えられたデータセット(ωのトレーニング)の場合: ベイズの定理を適用すると、次のように書くことができます。 式3 与えられたサンプルx*に対して、p(ω|x,y)の分類ラベルは次のように予測できます。 式4 このプロセスは推論または限界化と呼ばれます。しかし: 解析的に計算することはできませんが、変分パラメータを使用して近似することができます。 目標は、モデルによって得られた事後分布に近い分布を近似することです。したがって、精度τに関するKullback-Leibler(KL)ダイバージェンスを最小限に抑える必要があります。これら 2 つの分布の類似性は次のように測定できます。 式5 予測分布は、次のように KL ダイバージェンスを最小化することで近似できます。 式6 で: ターゲットを表します。 KL ダイバージェンス最小化は、証拠下限 (ELBO) 最大化として再構成することもできます。 式7 で: 最初の項を最大化することでデータを適切に記述でき、2 番目の項を最小化することで前者にできるだけ近づくことができます。このプロセスは変分推論 (VI) と呼ばれます。ドロップアウト変分推論は最も一般的に使用される方法の 1 つであり、複雑なモデルでの近似推論に広く使用されてきました。最小化の目標は次のとおりです。 式8 ここで、N と P はそれぞれサンプル数と破棄確率を表します。データに関連する不確実性を取得するには、上記の式 2 の精度 τ をデータの関数として表すことができます。認識論的不確実性を得る 1 つの方法は、2 つの関数を混合することです。で、 予測平均関数はfθ(x)、モデル精度関数はgθ(x)です。 この場合、尤度関数は次のように記述できます。 モデルの重みに事前分布を適用し、特定のデータ サンプルに対して重みがどれだけ変化するかを計算します。ユークリッド距離損失関数は次のように調整できます。 式9 予測分散は次のように得られます。 式10 オプションの方法不確実性の定量化の問題に対処するために多くの研究が行われてきましたが、そのほとんどは不確実性の伝播の問題を扱っています。過去 10 ~ 20 年の間に、逆不確実性定量化の多くの手法も開発され、ほとんどの小規模および中規模の問題に有効であることが証明されています。 図3: 不確実性の定量化に対する選択的アプローチ 前方伝播
非確率的手法としては、区間分析、ファジー理論、可能性理論、証拠理論などが最も広く使用されている手法です。 確率的アプローチは意思決定分析理論と一致しているため、エンジニアリング設計における最も厳密な不確実性分析方法と考えられています。その基礎となるのは、サンプリング統計の確率密度関数の計算です。変数のガウス変換によって得られるランダム変数の場合、これを厳密に行うことで正確な信頼区間を得ることができます。 逆不確実性1. 頻度主義:パラメータ推定値の標準誤差は簡単に取得でき、信頼区間に拡張できます。 2. ベイズ学派:ベイズの枠組みでは、逆不確実性定量化法がいくつかあります。最も複雑な方向は、バイアス補正とパラメータ調整の問題を解決することです。これらの問題の課題には、不適切なモデルやパラメータの不確実性の影響だけでなく、コンピューター シミュレーションや実験からのデータの不足も含まれます。よくある状況としては、実験とシミュレーションでは入力環境が異なることが挙げられます。もう一つの一般的な状況は、実験から得られたパラメータがシミュレーションに入力されることです。計算コストの高いシミュレーションでは、ガウス過程や多項式カオス展開などの代替モデルが必要になることが多く、これにより逆問題を定義して、問題を最もよくシミュレートする代替モデルを見つけることができます。 3. モジュラー法:逆不確実性定量化の方法は、モジュラーベイズ法です。モジュラー ベイジアン アプローチは、4 つのモジュール プロセスからその名前が付けられています。現在利用可能なデータに加えて、未知のパラメータの事前分布も指定する必要があります。
4. 完全法:完全ベイズ法では、未知のパラメータに事前確率を割り当てるだけでなく、他のハイパーパラメータにも事前確率を割り当てます。 図4: ベイズ法を用いた不確実性の定量化 機械学習における不確実性の定量化図5: 機械学習における不確実性定量化の分類 評価分類
図6: 分類モデルのモデル可視化と分布の不確実性
図7: 分類モデルのモデル可視化と分布の不確実性
回帰の評価
対照的に、他のアプローチでは、予測の存在が想定される、いわゆる予測区間 (PI) を直接予測します。このような間隔では、特定の予測を与えるのではなく、不確実性が均一な分布として現れます。名前が示すように、この方法の確実性は予測区間のサイズによって直接測定できます。平均予測区間幅 (MPIW) は、モデルの平均確実性を評価するために使用できます。予測区間の正確性を評価するには、予測区間カバレッジ確率 (PICP) を適用できます。 PCIP は、予測区間内に含まれるテスト予測の割合を表します。
図8: 回帰モデルのモデル可視化と分布の不確実性 図9: 回帰モデルのモデル可視化と分布の不確実性
較正派生予測信頼が実際の正確性の確率の適切な近似を表す場合、予測は十分に調整されると言われています。したがって、不確実性の定量化方法を使用するには、システムが十分に調整されていることを確認する必要があります。回帰タスクの場合、予測される信頼区間がデータセットから経験的に計算された信頼区間と一致する必要があるキャリブレーションを定義できます。 通常、キャリブレーションエラーは、モデルの不確実性に関連する要因によって引き起こされます。データの不確実性が根本的な不確実性を表しているため、これは直感的に理解しやすいです。つまり、入力xとターゲットyは同じ実際の情報を表します。次に、データの不確実性が正しく予測されていると、完全に較正されたシステムにつながります。これは、これらの方法がそれぞれモデルとデータの不確実性を定量化し、予測のモデルの不確実性を減らすことを目指しているため、明らかです。モデルの不確実性を減らすことでキャリブレーションを改善する方法に加えて、大規模で成長している文献は、キャリブレーションエラーを明示的に削減する方法を調査します。次のセクションでは、キャリブレーションエラーを定量化するためのこれらの方法と測定について説明します。これらの方法はモデルの不確実性を減らすのではなく、モデルの不確実性をデータの不確実性の表現に伝播することに注意することが重要です。 たとえば、バイナリ分類器が過剰にフィットし、テストセットのすべてのサンプルを確率1のクラスAとして予測する場合、テストサンプルの半分は実際にはクラスBです。再調整方法は、ネットワーク出力を0.5にマッピングして信頼できる信頼スコアを取得する可能性があります。 0.5の確率はデータの不確実性に等しくありませんが、予測データの不確実性に伝播されるモデルの不確実性を表します。 キャリブレーション方法キャリブレーション方法は、アプリケーションの手順に基づいて3つの主要なカテゴリに分類できます。
現実世界のアプリケーションNice Actimizeは、地域および世界の金融機関、政府規制当局に対するさまざまな金融犯罪、リスク、コンプライアンスソリューションのプロバイダーです。同社は、リアルタイムのクロスチャネル詐欺防止、マネーロンダリング防止検出およびトランザクション監視ソリューションを提供して、支払い詐欺、サイバー犯罪、制裁監視、市場乱用、顧客デューデリジェンス、インサイダー取引に対処するのに役立ちます。 AIベースのシステムと高度な分析ソリューションは、盗難、詐欺、規制の罰則、制裁からの財政的損失を排除するよりも早く、より早く異常な行動を検出できます。これにより、企業や組織はさまざまな損失を減らし、調査員の効率を高め、法的コンプライアンスと監督の質を向上させるのに役立ちます。 金融犯罪におけるAIベースのシステムの使用が成長するにつれて、不確実性を定量化して対処することがますます重要になります。一方で、不確実性の定量化は、詐欺防止に必要なリスク最小化に重要な役割を果たします。一方、詐欺調査に関する追加の洞察を提供するいくつかの挑戦的なデータソースがありますが、これらのデータを検証することは困難です。これにより、信頼できる「グラウンドトゥルース」が非常に挑戦的な作業になります。 Actimizeの一般的な評価フレームワーク上記の問題に対処するために、さまざまな特定のベースラインデータセットと評価メトリックを含む評価プロトコルをアクティブ化し、あらゆる種類の不確実性をカバーし、不確実性の定量化研究を促進するのに役立ちます。さらに、彼らはリスク回避と最悪の評価の問題を考慮しました。この共通のプロトコルにより、データサイエンティストは、確立されたベンチマークと実際のデータセットとさまざまなタイプの方法を簡単に比較できます。 結論は不確実性の定量化(UQ)は、AIベースのシステムと意思決定プロセスの重要な部分の1つであり、さまざまな実際のアプリケーションの不確実性を評価するのにますます一般的になっています。現在、不確実性は従来の機械と深い学習方法の不可欠な部分になっているため、この記事では、従来の機械学習と深い学習における最も重要なUQの概念と方法の比較的包括的な概要も提供します。 翻訳者紹介Zhu Xianzhong 氏は、51CTO のコミュニティ エディターであり、51CTO の専門ブロガー兼講師であり、濰坊の大学のコンピューター教師であり、フリーランス プログラミング コミュニティのベテランです。初期にはさまざまな Microsoft テクノロジに注力し (ASP.NET AJX および Cocos 2d-X に関連する 3 冊の技術書を編纂)、オープンソースの世界に 10 年近く携わってきました (人気のフルスタック Web 開発テクノロジに精通)。OneNet/AliOS+Arduino/ESP32/Raspberry Pi をベースとした IoT 開発テクノロジや、Scala+Hadoop+Spark+Flink などのビッグデータ開発テクノロジを理解しています。 オリジナルタイトル:人工知能ベースのシステムにおける不確実性の定量化、著者:Danny Butvinik |
<<: 金融業界における AI とビッグデータのトップ 10 トレンド
>>: いくつかの文章を入力すると、分子を生成できます。分子を見ると、説明文も生成されます。謎に包まれた Google X により、マルチモーダル AI がブラック テクノロジーになりました。
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
人工知能の存在は仕事や生活だけではなく、感情にも存在します。仕事の後で退屈を感じたら、たまごっちを飼...
この記事の結論から始めましょう。AI と機械学習は、ビデオ信号を 24 時間 365 日リアルタイム...
記事全文を読み始める前に、「ロボットが私たちの仕事を奪っている」といったセンセーショナルなニュースの...
さまざまなアルゴリズムの実装やソフトウェア パッケージがオープン ソースで利用できる世界において、ア...
不動産業界は、住民、建築業者、住宅ローンブローカー、エージェント、請負業者を支援するために人工知能を...
データセットをトレーニング セットに分割すると、モデルを理解するのに役立ちます。これは、モデルが新し...
[[412771]]それは正しい!またフェイフェイ・リーだよ!フェイフェイ・リーについて最後に報道...
こんにちは、ルガです。今日は、人工知能 (AI) エコシステムに関連するテクノロジーについて、Goo...
これはおそらく、マルチラベル分類のための最も実用的なヒントです。ご存知のとおり、バイナリ分類タスクは...
[[311646]] (画像出典: venturebeat)人工知能は既存のいくつかの産業を変革す...
[[341638]] [51CTO.com クイック翻訳] 機械学習を迅速に実装したい組織は、新興の...