ついに誰かが説明可能な機械学習を明らかにした

[[443127]]

ビッグデータの時代において、機械学習は製品の売上向上や人間の意思決定の支援に大きな役割を果たすことができますが、コンピューターは通常、予測を説明しません。

機械学習モデルを使用する場合、一般的に使用されるモデルパフォーマンス評価指標には、精度、適合率、再現率、ROC曲線、コスト曲線などがあります。機械学習モデルのパフォーマンスが良好であれば、そのモデルを信頼して決定の理由を無視できるでしょうか? 答えは「いいえ」です。

モデルのパフォーマンスが高いということは、モデルが十分にインテリジェントで「スマート」であることを意味しますが、それがどのように機能するかを理解するにはそれだけでは不十分です。そのため、モデルをよりよく理解して信頼できるように、モデルに「表現力」を与える必要があります。モデル評価では、単一のパフォーマンス評価に加えて、モデルの「表現力」を表す次元も追加する必要があり、解釈可能性はその 1 つです。

解釈可能性の定義

説明とは、平易な言葉による分析、説明、または提示を指します。モデルの場合、説明可能性とは、モデルを平易な言葉で表現できること、つまり人間が理解できる能力を意味します。具体的には、モデルの予測プロセスを論理的な関係を持つルールに変換する能力です。

解釈可能性は主観的なものであり、説明の程度は人によって異なるため、統一された指標を使用して測定することは困難です。私たちの目標は、機械学習モデルが「人間のように表現し、人間のように考える」ことができるようになることです。モデルの説明が人間の認知や思考モードと一致し、入力から出力までのモデルの予測プロセスを明確に表現できる場合、モデルの解釈可能性は良好であるとみなされます。

「機械学習の課題：ブラックボックスモデルが直面する 3 つの問題」で引用されている小規模ファンドのマーケティングシナリオでは、モデルは顧客が低リスク、低リターンの商品を購入する可能性が高いことを判断できますが、顧客が低リスク、低リターンの商品を購入する傾向がある理由を詳しく説明することはできません。そのため、この顧客に対してよりターゲットを絞ったマーケティング戦略を提案することは不可能であり、マーケティングの結果は芳しくありません。

予測を行う際、説明可能なモデルは製品を推奨するだけでなく、推奨の理由も示す必要があります。たとえば、顧客は大学を卒業したばかりで、まだ比較的若く、財務管理の意識が不足しており、金融知識が比較的弱いため、モデルは低利回りの商品を推奨する場合があります。個人口座に多額のお金があるにもかかわらず、盲目的に高利回りの商品の購入を推奨すると、リスク認識の欠如により損失が増える可能性があります。そのため、いくつかのシンプルな低リスクの金融商品を使用して、顧客にまず金融市場を体験させ、財務管理への関心を高め、一定期間後に高利回りの商品を購入させることができます。

モデルの解釈可能性と「表現力」が高ければ高いほど、モデルの結果を使用して意思決定を行う際に、より優れたマーケティング結果を達成できます。

2. 解釈可能性の分類

解釈可能な機械学習の考え方は、モデルを選択する際に予測精度とモデルの解釈可能性の両方を考慮し、両者の最適なバランスを見つけようとすることです。さまざまな使用シナリオとユーザーに応じて、モデルの解釈可能性を大まかに次のカテゴリに分類できます。

1. 内在的説明可能性と事後的説明可能性

本質的な解釈可能性とは、モデル自体の構造が比較的単純で、ユーザーがモデルの内部構造を明確に把握でき、モデルの結果に説明効果があり、モデルが設計された時点で解釈可能であることを意味します。

図 2-1 に示すように、決定木の出力結果から、2 つの特徴量が異なる値を持つ場合に予測値が異なることが明確にわかります。一般的な本質的に解釈可能なモデルには、ロジスティック回帰、浅い決定木モデル (4 層以下) などがあります。

▲図2-1 決定木の結果

事後解釈可能性とは、モデルの解釈可能性を高め、モデルがトレーニングされた後にモデルによって学習された情報をマイニングするために特定の方法を使用することを指します。

一部のモデルは構造が複雑で、モデル内から結果の推論プロセスをユーザーが理解するのは困難です。モデルの結果には説明的な言語が付属しておらず、通常は予測値のみが提供されます。この場合、モデルは説明可能ではありません。事後解釈可能性とは、モデルがトレーニングされた後に、さまざまな事後分析方法を通じてモデルの解釈可能性を向上させることを意味します。

図 2-2 に示すように、事後分析法を使用すると、異なるモデル認識結果に対して異なる理由を与えることができます。エレキギターはギターのネックに基づいて識別され、アコースティックギターはギターケースに基づいて識別され、ラブラドールは頭と脚に基づいて識別されます。一般的に使用される事後分析方法には、視覚化、摂動テスト、プロキシモデルなどがあります。

▲図2-2 事後説明: a. 元の写真、b. エレキギターであると説明した理由、c. アコースティックギターであると説明した理由、d. ラブラドールであると説明した理由 (出典: 論文「なぜあなたを信頼すべきか?」—あらゆる分類器の予測を説明する)

2. ローカル解釈とグローバル解釈

モデルユーザーの場合、シナリオによって説明の要件が異なります。データセット全体については、全体的な予測を理解する必要があります。また、個人については、特定の個人間の予測の違いを理解する必要があります。

ローカル説明とは、サンプルまたはサンプルのグループの入力値が変化したときに予測結果がどのように変化するかを説明することを指します。

たとえば、銀行のリスク管理システムでは、違法な顧客がどのような特徴を持っているかを調べ、その手がかりをたどって潜在的な違法な顧客を見つける必要があります。口座残高が変わると違反の確率はどのように変化するか。顧客のクレジットカード申請を拒否した後、モデルのローカル説明に基づいて、これらの顧客に拒否の理由を説明することもできます。

図 2-2 は、事後説明と、入力画像に対して行われた説明である部分説明の両方を示しています。

グローバル説明とは、入力から出力までのモデル全体の説明を指します。グローバル説明から、一般的なルールや統計的推論を取得し、各機能がモデルに与える影響を理解することができます。

たとえば、喫煙は肺がんと関連があり、喫煙者が多いほど肺がんになる可能性が高くなります。全体的な説明は、特徴に基づいてターゲットの分布を理解するのに役立ちますが、一般的には入手が困難です。

人間が描ける空間は3次元を超えることはありません。3次元を超えると理解が難しくなります。3次元以上の結合分布を直感的に描くことは困難です。したがって、一般的なグローバルな説明は 3 次元未満のままです。たとえば、加法モデルでは、他の特徴を変更せずに単一の特徴とターゲット変数の関係を観察する必要があります。ツリーモデルでは、各リーフノードに対応するパスを、リーフノードの結果を生成するためのルールとして解釈します。

3. 解釈可能な機械学習の研究方向

解釈可能な機械学習は、モデル評価指標に新たな視点を提供します。モデル設計者は、モデルを設計または最適化する際に、精度と解釈可能性の両方を考慮する必要があります。

図2-3は、解釈可能な機械学習におけるモデル精度とモデル解釈可能性の関係を示しています。これは香港大学の張愛軍教授によって提唱され、学術界で広く流布されています。図2-3の横軸はモデルの解釈可能性を表しています。方向が正であるほど、モデルの解釈可能性が高くなります。縦軸はモデルの精度を表しています。方向が正であるほど、モデルの精度が高くなります。

▲図2-3 説明可能な機械学習：モデルの精度とモデルの解釈可能性の関係（画像提供：香港大学のAijun Zhang博士）

モデル評価の2つの指標に関して、説明可能な機械学習には2つの主要な研究方向があり、以下のように説明されます。

まず、従来の統計モデル（決定木、ロジスティック回帰、線形回帰など）の場合、モデルの解釈性は高いです。モデルを使用すると、モデルの内部構造を明確に確認でき、結果の解釈性も高くなります。

しかし、一般的にこれらのモデルの精度は低く、信号対雑音比が高い（信号が強くノイズが少ない）領域では、フィッティング効果が現在の機械学習モデルほど良くありません。

モデルの解釈可能性を維持することを前提として、モデルの構造を適切に改善し、モデルの柔軟な表現能力を高め、精度を向上させ、モデルを縦軸の正の方向に動かし、本質的に解釈可能な機械学習モデルを形成できます。たとえば、モデルの加法特性を維持し、線形フィッティングから非線形フィッティングに拡張することで、GAMI-Net モデルと EBM モデルはどちらも本質的に解釈可能な機械学習モデルになります。

第二に、現在の機械学習モデル（ニューラルネットワークやディープラーニングなど）の内部構造は非常に複雑で、ニューラルネットワークの各層や各ニューロンを通したデータの変化を観察することが困難です。信号対雑音比が低い（信号が弱くノイズが強い）領域では、ノイズをモデルに当てはめやすく、エラーを見つけるのが難しく、モデルの解釈可能性が低くなります。

モデルの解釈可能性を向上させるために、次の 2 つの方法を使用できます。

ツリーモデルの深さを減らすなど、モデル構造の複雑さを軽減し、解釈可能性と引き換えにモデルの精度を犠牲にします。
モデルの元の精度を維持します。モデルをトレーニングした後、トレーニング後の補助的な属性分析方法と視覚化ツールを使用して、モデルの解釈可能性を取得します。

どちらの方法を使用する場合でも、目標はモデルを水平軸の正の方向に移動して、解釈可能性を高めることです。 LIME や SHAP などの方法は事後分析法です。

説明可能な機械学習の研究は学界と産業界の両方で熱烈な反響を呼び、発表される論文数や実用化の数は年々増加しています。研究の方向性に関係なく、解釈可能な機械学習研究の最終的な目標は次のとおりです。

高レベルの学習パフォーマンスを維持しながら、より解釈可能なモデルを実現します。
モデルをよりよく理解し、信頼し、効果的に使用しましょう。

著者について: Shao Ping、シニアデータサイエンティスト、Suoxinda Holdings の金融 AI 研究所所長。彼は、ビッグデータと人工知能の分野における技術研究開発と産業応用において 10 年以上の経験を持っています。技術的な方向性としては、説明可能な機械学習、ディープラーニング、時系列予測、インテリジェントな推奨、自然言語処理などが含まれます。彼は現在、説明可能な機械学習、推奨システム、銀行のインテリジェントマーケティング、インテリジェントリスク管理の分野で主に技術研究とプロジェクト実践に従事しています。

雲南財経大学の統計学修士である楊建英氏は、シニアデータマイニングエンジニアであり、確固たる信念を持ってデータサイエンスを追求しています。現在は機械学習モデルの解釈可能性に焦点を当てています。

米国のテンプル大学で統計学の修士号を取得し、機械学習アルゴリズムの専門家でもある蘇士達氏は、長年にわたり銀行にビッグデータや人工知能のソリューションや技術サービスを提供してきた。彼の主な研究分野は、説明可能な機械学習と人工知能です。彼は、「説明可能な機械学習に関する研究レポート」や、説明可能な機械学習に関連する多くの記事を執筆しています。

この記事は「解釈可能な機械学習: モデル、方法、実践」から抜粋したもので、出版社の許可を得て公開されています。 (ISBN: 9787111695714)

<<: スマート建設現場: 2021 年に注目すべき 5 つのスマート建設技術

>>: 人工知能を背景にした教育の未来を探る