張晨成: 第四パラダイムインテリジェントリスク管理ミドルプラットフォームアーキテクチャ設計と応用

張晨成: 第四パラダイムインテリジェントリスク管理ミドルプラットフォームアーキテクチャ設計と応用

共有は主に次の 5 つのポイントを中心に行われます。

  • リスク管理センターの設計背景
  • 戦略のフルサイクル管理
  • モデルの完全なライフサイクル管理
  • ビジネスアーキテクチャと機能の細分化
  • 応用事例

01リスク管理プラットフォーム設計背景

まず、大規模なリスク管理システムやリスク管理ミドルプラットフォームの構築は、本質的にはビジネスに奉仕するためのものであるため、ビジネスを中核としたリスク管理ミドルプラットフォームシステムを構築する必要があります。

ビジネスを中核とする大規模なリスク管理システムには、次の 6 つの特性が含まれている必要があります。

  • リアルタイム: リアルタイムの分析と予測を通じて、リスク管理機能が継続的に反復され、リスクのリアルタイムの防止と管理を実現します。
  • 洗練: リスク管理ビジネス ラインの最初から最後までのすべてのリンクを洗練して管理することを指します。
  • 共同予防と管理:顧客に対するリスクの予防と管理には複数の視点が必要であるため、比較的精緻化する必要があります。共同予防と管理とは、リスクの予防と管理を水平的な視点から見ることです。通常、リスク管理ミドルプラットフォームは、複数の事業ラインを総合的に活用するグループ事業となるため、プラットフォームレベルで最大限の予防と管理を実現するために、データと情報を連携させることも非常に重要です。
  • 敏捷性: 不正行為やリスク管理のシナリオでは、通常、迅速な対応が求められます。1 時間または数分でも大きな影響が出る可能性があります。敏捷性によって迅速なリスク管理対応を実現したいと考えています。
  • インテリジェンス: 従来のリスク管理エンジンは、通常、エキスパート ルールと組み合わせて実装されます。専門家のルールと AI アルゴリズムを組み合わせて全体的な予測を行うことが、業界の将来のトレンドです。
  • 統合拡張: 2 つのレベルに分かれており、ビジネス機能の場合は細分化が必要であり、IT システムまたはミドルオフィス システム全体の場合は統合構築が必要です。

上記の傾向に基づいて、私たちは完全なリスク管理システムを構築しました。これは、2 つの文で要約できます。1 つは「Five-in-One Dual-Core」、もう 1 つは「デジタル統合とインテリジェンス」です。

5 つのオールはカバレッジを指します。パノラマ型リスク管理ミドルプラットフォームを構築する際には、包括金融、クレジットカード業務など、異なる子会社の異なる業務ラインを完全にカバーすることを考慮する必要があります。グループの各子会社については、すべての顧客サービスを完全にカバーすることを考慮する必要があります。大規模なグループについては、さまざまなシナリオを完全にカバーすることを考慮する必要があります。チャネルの観点からは、カウンター、モバイルバンキング、オンラインバンキング、WeChatバンキングなどのチャネルを完全にカバーすることも考慮する必要があります。最後に、プロセスの観点からは、前、中、後のプロセスを完全にカバーする必要があります。

デュアルコアとは、ルールエンジンとAIアルゴリズムエンジンを統合した意思決定フローの構築を指します。さらに、デュアルコアをサポートするには、アプリケーション アーキテクチャ レベルでアトミック化とモジュール化を行う必要があります。最後に、最も重要なデータを処理する必要があります。データ部分は主に顧客ポートレートとリスクポートレートの構築で構成されます。ユーザー ポートレート部分では、包括的なポートレートを構築するためにすべてのチャネルを統合する必要があり、リスク ポートレート部分では、すべてのビジネス リスク データを統合する必要があります。

完全なリスク管理システムを構築することによってもたらされる中核的な価値は、リスク意思決定のレベルを向上させることです。 1 つの側面は、閉ループ型リスク管理戦略システムを確立することであり、もう 1 つの側面は、意思決定エンジンと AI アルゴリズムを組み合わせることです。詳細は後ほどお伝えします。

02戦略のフルサイクル制御

まず、人間と機械のコラボレーションという概念があります。専門家のルールと AI アルゴリズムを組み合わせるというアイデアを表現します。従来の意思決定エンジンでは、通常、ルールが最初に考慮されます。ルールには次のような利点があります。

  • シンプルなルールにより、高リスク領域のエンティティをフィルタリングするなど、主要なリスクを直感的にフィルタリングできます。
  • ルールは非常に解釈可能です。たとえば、チェック柄のシャツやバックパックはプログラマーです。
  • ルールを使用すると、判別統計情報を作成しやすくなります。たとえば、単純なルールを使用すると、問題の 50 ~ 60 パーセントをカバーできます。

しかし、ルールカバレッジだけでは不十分であり、この場合は AI モデルを使用する必要があります。機能の利用の観点から見ると、ルールには利用される機能が少ないためです。したがって、モデルは多数の機能を通じて、ロングテールのリスクの高いユーザーを深く掘り下げることができます。さらに、モデルはビッグデータに基づいてマイニングすることができ、データソースも比較的多く存在します。

リスク管理システム全体では、手動学習と機械学習がさまざまなシナリオに適用できます。たとえば、エキスパート マニュアルのルールには次のものが適しています。

  • ビジネス ラインをコールド スタートする場合は、専門家の経験に頼る必要があります。
  • 意思決定や承認などの制度上の問題は、手動ルールの方が適しています。

ルールに加えて、たとえば次のようなものが機械学習に適しています。

  • ルールには、リスクがあると考えられる一定の金額などの推奨閾値を設定する必要があり、機械学習を活用できる。
  • A と B または B と C をどのように組み合わせるかなど、ルールの組み合わせに関する推奨を行う必要がある場合も、機械学習を使用して行うことができます。
  • 機械学習がルールに基づいて実行できる作業や、機械学習自体のグラフ アルゴリズム機能なども活用できます。

クローズドループの観点から見ると、戦略のクローズドループは機械学習のクローズドループと非常に似ています。戦略プロセスは、戦略の策定、テスト、開始、監視、最適化、そして最後に最適化された戦略のテストと開始という閉ループです。機械学習は、まず行動を生成し、次にその行動に関するフィードバックを提供し、これらの行動データとフィードバックデータに基づいてモデルを学習します。モデルが学習された後、オンラインで適用されます。このことから、2 つの円が非常に似ていることがわかります。

次に戦略管理システムを見てみましょう。 (1)戦略構成では、ルールスコアリングカードや決定表、決定フローを作成し、マウスクリックによる可視化やコード開発を通じて構成をサポートします。(2)戦略バージョン管理では、異なる戦略を区別します。(3)戦略テストフェーズでは、一連のABテストを通じて戦略をリリースします。(4)テストリリース後、戦略全体の有効性を監視します。

まず、戦略の要となるのは指標の計算です。指標に基づいていくつかのルールを作成し、その上で独自のリスク管理スコアリングカードや意思決定表を作成できます。機械学習モデルも、指標や特徴の計算から恩恵を受けることができます。ポリシー コンポーネントを定義したら、意思決定フローを起動できます。

指標の定義から判断すると、システムには、平均、サイズ、年齢、性別、ID カードの最初の数桁に基づく計算、一定期間にわたる総消費量など、いくつかの指標を処理するための機能が組み込まれています。

さらに、それを実装するための DSL セットも定義しました。一部は組み込み関数であり、他の部分は組み込み関数が要件を満たせない場合に外部からオンラインへのプラグインのホットロードをサポートします。もう 1 つのより直感的な方法は、定義された DSL を通じて組み込まれていない関数を定義することです。上記の例に示すように、最初にステップ リストを定義し、関数を使用してリストを処理します。図は、式の構文ツリーをトラバースする方法を示しています (現在、単一の式はまだシリアルに計算されていますが、後で並列化によってさらに最適化して実行速度を向上させることができます)。

上記のインジケーターの定義は DSL を通じて実装されます。インジケーターを定義した後、インジケーターのしきい値またはインジケーターの組み合わせを設定します。ここでは視覚的な操作を使用できます。図に示すように、比較的複雑な AND と OR の関係を定義してインジケーターをルールに組み合わせ、さらにルールを組み合わせてルール パッケージを形成して使用します。スコアカードの設定も視覚的に分かりやすい操作になっています。 DSL 定義とポリシー策定が完了したら、ポリシーを組み合わせて意思決定フローを形成できます。

意思決定フロー全体を通じて、異なるタイプのノードが区別されます。入力ノードから始まり、変数に対して簡単な変換を行う変換ノード、ルールノード、機械学習モデルも適用できるノードへと続きます。決定表と転換が定義された後、終了ノードによって最終結果が出力されます。

ポリシーが定義された後、ポリシーが期待どおりであるかどうかを確認するためにポリシーがテストされます。これには、インターフェースの単一テスト、バッチ統合テスト(バッチ履歴データバックテストを使用できます)、チャンピオンチャレンジャー(履歴データを使用してオンラインルールに挑戦し、勝つことができるかどうかを確認します)、オンラインサンドボックステストが含まれます。最後に、ローンチ戦略とオンライン戦略を総合的に評価したテストレポートを取得し、手動でローンチに適しているかどうかを判断できます。

オンラインフェーズでは、グレースケールのリリース プロセスが必要です。このプロセスでは、条件ルールに従ってトラフィックをランダムに調整し、グレースケールリリースを実行します。戦略全体をテストした後、ワンクリックで本番環境にインポートできる便利な戦略パッケージングサービスが提供されます。最後の部分はトラフィックの ABTest です。ここでは、複数のトラフィックの迂回グループの並列 ABTest をサポートし、比較分析を行うことができます。

最後に、戦略の有効性の監視です。これには、ビジネスモニタリング(リスクマップによる融資額など)、統計レポート(ヒット率、傍受率など)、戦略セグメンテーション指標とルールのチェックが含まれ、異常がないか確認します。最後に、異常はマークされ、手動で不正事例として確認されます。ラベル付けの結果は、後続の機械学習アルゴリズムの反復的な最適化にも使用されます。

上記は戦略のライフサイクル管理全体です。

03モデルのフルサイクル制御

次に、モデリングのフルサイクル管理について見てみましょう。

モデリングの観点からは、データの導入、トレーニング セット、検証セット、テスト セットの分割、特徴エンジニアリング、アルゴリズムの選択、ハイパーパラメータの検索、そして最後に評価レポートに分かれています。しかし、顧客側に製品戦略を展開したり、顧客データをもとにカスタマイズされたモデリングを行うことが難しい場合もあるため、ここでは AutoML を使用します。

AutoML には、自動データ結合 (複数の顧客データ テーブルを 1 つの大きな幅広テーブルに処理する)、自動機能エンジニアリング、自動アルゴリズム選択、自動パラメータ調整、そして最後に評価レポートの提供を含む完全なモデリング プロセスが含まれます。さらに、モデリングが完了した後、効果が時間の経過とともに低下し、更新と反復が必要になった場合に備えて、最適化と修正のための完全自己学習と増分オンライン学習の 2 つの方法を提供します。

まず、不正行為防止などのビジネス上の問題がビジネスの観点から定義されます。次に、データ サイエンティストまたは IT がデータを収集し、それがアルゴリズム サイエンティストに引き渡されて特徴エンジニアリングが行われ、その後、モデルのトレーニングと評価が行われます。プロセス全体では、データ、機能、モデルを繰り返し選択する必要があります。オンライン段階では、アルゴリズムとエンジニアリングの問題も発生するため、時間と労力がかかります。 AutoML は、データ収集、特徴量エンジニアリング、モデルトレーニング、モデル評価など、プロセス内のほとんどの作業をカバーするのに役立ちます。

特徴エンジニアリングはどのようにして自動マイニングを実現するのでしょうか?マルチテーブル時間と空間に基づく特徴マイニング アルゴリズムは、次の 3 つのステップに分かれています。

  • 最初のステップは、複数のテーブルを自動的に結合することです。 1 対 1 テーブルの場合は直接スプライスできます。1 対多テーブルの場合は、セカンダリ テーブルで最新のスプライスを検索するか、構成に従って検索してスプライスできます。
  • 2 番目のステップは自動特徴エンジニアリングです。特徴生成には、最も基本的な特徴、一次操作変換、時系列特徴が週末であるかどうかの判断、および離散特徴統計ウィンドウ内の特徴発生回数が含まれます。たとえば、トランザクション フロー テーブルをユーザーのトランザクション時間でグループ化して並べ替え、集計して、1 か月のトランザクション数やトランザクション金額などの派生機能を生成できます。また、性別や教育レベルなどの個別の機能を組み合わせて結合することもできます。
  • 3 番目のステップは機能の選択です。時系列集約特徴量を候補特徴量として、検証により算出された AUC に基づいて候補特徴量から TopK 特徴量を選択します。

04ビジネスアーキテクチャと能力の細分化

ビジネス アーキテクチャの観点から見ると、データ層、プラットフォーム層、アプリケーション層の 3 つの部分に分けることもできます。

  • データ レイヤーでは、銀行内の取引返済データと中国人民銀行の信用調査などの外部データを統合できます。ストレージ関連のニーズには、インメモリ時系列データベース、リレーショナル データベース、グラフ データベース、HDFS などの分散ストレージ データなど、さまざまなデータベースが必要です。
  • プラットフォーム層には、指標の計算と処理を管理する指標センター、意思決定フローを管理する意思決定サービスセンター、およびその下の戦略センターとモデルセンターが含まれます。ポリシー センターは、ポリシーのアセンブリ、バージョン管理などを実行するために使用されます。モデル センターは主に、AutoML の特徴選択、パラメータ調整、その他のモデル関連のタスクを担当します。さらに、関連グラフのグラフコンピューティングを通じてオンラインビジネスを支援するグラフコンピューティングセンターもあります。
  • アプリケーション層は、主に上記のコンポーネントを通じて、トランザクション不正防止などのさまざまなビジネス モジュールをサポートします。

ビジネス機能の細分化に関しては、技術コンポーネントの観点から、インフラストラクチャ層、サービス層、ビジネスモジュール層の 3 つの層に分けることもできます。

  • 一番下はインフラストラクチャ層です。その中で、データの保存とコンテナのスケジューリングがより重要です。コンテナのスケジューリングでは、ネイティブ K8S のスケジューリング機能では機械学習サービスやビッグデータ コンピューティングをサポートするには不十分であるため、K8S に基づいてスケジューリングの最適化を行いました。
  • 真ん中は基本的なサービス層です。これには、前述の DSL や組み込み関数のインジケーター定義などのデータ計算エンジンが含まれます。時間範囲が長いリアルタイム ストリーム機能の場合、計算にはオフライン バッチ タスクを実行する必要があります。次に、オフラインおよびオンラインのサービス管理があります。オフライン タスクには、スケジュールされたバッチ実行、タスクのスケジュール設定、タスクの監視、実行が含まれます。オンライン サービスには、グレースケール リリース、ABTest を支援するトラフィック ゲートウェイ、複数のオンライン サービスに対する K8S のエラスティック スケーリング、ビジュアル サービス オーケストレーション、AutoML モデル管理、データ品質を保証するデータ管理モジュールが含まれます。
  • 最上位層はビジネス モジュール層です。サードパーティデータ、ビジネスデータ、ブラックリストやホワイトリストなど、アップロードや削除に人手による操作が必要な特殊なデータをすべて管理するデータセンターが設けられます。戦略コンポーネントと戦略センターは、ビジュアル インターフェースを通じてこれらのコンポーネントを接続します。シナリオ センターは、トランザクションの不正防止やビジネス監視レポートなどのビジネス シナリオを作成するためのエントリ ポイントです。もう 1 つの重要な機能は、指標のしきい値とルールの組み合わせ機能を提供する Strategy Lab です。

3層の機能分割による機能細分化は、当社製品自体だけでなく、お客様の既存システムとの統合にもメリットをもたらします。

05応用事例

最後に、2つの例を紹介したいと思います。

その 1 つは、リアルタイムの取引詐欺の厳重な防止です。このケースは主にパフォーマンス上の利点を示しています。各ペンの平均処理時間はわずか 6 ミリ秒ですが、TP99 はそれを 20 ミリ秒以内に制御できます。一方、リスク管理機能の面では、特徴次元が従来のリスク管理よりもはるかに大きく、モデルとルールの二重エンジンが使用されます。デュアル エンジンで高いパフォーマンスを実現できる理由は、主に、重要な内部モジュールでもあるインメモリ時系列データベースによるものです。

もう 1 つの例は、500 を超えるルールと 2,000 を超えるリアルタイム計算指標を含む、国営株式会社銀行のオムニチャネル不正防止システム プロジェクトです。ビジネス成果の面では、このシステムは銀行が毎月約 10,000 件の高リスク取引を検出し、傍受するのに役立っています。左は株式会社銀行に接続した後のアーキテクチャです。

<<:  パンデミック中の人工知能技術の5つの主要な応用

>>:  不正使用を防ぐため、DJIはロシアとウクライナへの販売を停止すると発表した。

ブログ    
ブログ    
ブログ    

推薦する

AIの新興企業が胡潤富豪リストに名を連ねる:「CVの4人の小さなドラゴン」の創業者3人がリスト入り

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

618プロモーション期間中のHuiceの加盟店向けサービスは新たな高みに達し、インテリジェントなアップグレードで明らかな優位性を獲得した。

ポスト疫病時代において、オンライン経済は本格化し、電子商取引業界は新たな発展段階に入りました。業界で...

産業用ロボットの急速な発展は社会にどのような影響を与えるのでしょうか?

インテリジェントインダストリー4.0の急速な発展に伴い、ますます多くの業界でロボットが手作業に代わる...

一般開発者もBaidu Brain Industry Application Innovation Challengeに参加して大きな賞金を獲得できる

[51CTO.comからのオリジナル記事] 2018年、人工知能の発展は消費者向け人工知能から企業向...

AI は金融業界がランサムウェアに効果的に対抗するのに役立つでしょうか?

[[430265]]ランサムウェアの脅威は目新しいものではありませんが、依然としてニュースの見出し...

ソフトウェア開発者ガイド: 独自のデータで ChatGPT をトレーニングする

翻訳者 | 李睿レビュー | Chonglou制作:51CTO テクノロジースタック(WeChat ...

Ele.meにおける人工知能の応用

[[212221]] Ele.meについてほとんどの人がテイクアウトを注文したことがあるでしょう。テ...

大規模言語モデル (LLM) の脆弱性トップ 10

人工知能 (AI) の分野では、特に OpenAI が ChatGPT や GPT-4 などの画期的...

作業効率を大幅に向上できるAIツール

AI はワークフローを強化し、反復的なタスクを削減し、出力を増幅します。スタンフォード大学とMITの...

人工知能に対するいくつかの態度: 流行を追跡するために個人データを犠牲にする用意がありますか?

最近、AI に関する調査、研究、予測、その他の定量的評価が相次いで発表され、世界中の企業による AI...

AI はなぜこれほど普及しているのに、実装が難しいのでしょうか?

過去 10 年間で、5G、ビッグデータ、クラウド コンピューティングなどの新興テクノロジーの登場によ...

AIはCOVID-19検査の欠陥を明らかにし、647のAIツールが臨床使用に適していないことが研究で判明

COVID-19パンデミックの発生以来、世界中の研究チームがコロナウイルスの検出や感染の予測に役立つ...

...