教師なし機械学習技術は金融セキュリティの懸念を解決できる

教師なし機械学習技術は金融セキュリティの懸念を解決できる

「テクノロジーがなければ、金融は存在しない。」モバイルインターネット時代の到来により、テクノロジーや金融モデルは絶えず革新していますが、詐欺の手法も絶えず更新されており、専門化、産業化、隠蔽化などの特徴を示しています。最近、世界最大のテクノロジー開発者イベントであるDeveloperWeek 2019で、VR、人工知能、金融テクノロジーの分野で受賞者が選出されました。

教師なし機械学習テクノロジーとは何ですか? また、なぜそれが大きな投資価値があると考えられているのですか? テクノロジーファイナンス活動においてどのような役割を果たすことができますか? 金融取引においてどのような問題を解決できますか?

テクノロジーと金融:詐欺に対抗する革新的なツール

従来の金融とは異なり、インターネット金融業務は主にオンラインで行われ、審査、申請、融資の発行が数秒で完了することが多く、詐欺のリスクも前例のないほど高くなります。統計によると、わが国におけるサイバー犯罪による損失はGDPの0.63%を占め、年間損失額は4000億人民元以上にも上ります。国際的な状況も楽観的ではありません。いくつかの市場調査レポートによると、2016年だけでも、クレジットカード、デビットカード、プリペイドカード、プライベートラベル決済カードによる世界的損失は163億1,000万ドルに達し、保険詐欺(健康保険を除く)による年間損失総額は400億ドルを超えると推定されています。

「技術が進化し続ける中、金融業界に対する脅威や詐欺の手法は以前と同じではなくなりました。犯罪組織は明確な分業体制を持ち、さまざまな高度な技術ツールを習得し、脅迫の手法を絶えず変えています。新たな課題により、金融会社が対処するのはますます困難になっています。」データバイザー中国のゼネラルマネージャーであるウー・ジョン氏は、金融詐欺対策における革新を期待することが業界のコンセンサスになっていると述べた。

「教師なし機械学習は近年になって発展した詐欺防止技術です。現在、国内の詐欺防止金融サービスは主にブラックリストとホワイトリスト、教師あり学習、教師なし機械学習の手法を使用して実施されています。」と、愛思諾信用情報株式会社ゼネラルマネージャーの金段鋒氏は科技日報との独占インタビューで語った。

ブラックリストとホワイトリストは、「フィルター」に似た、最も原始的な不正防止方法と考えられています。例えば、銀行の信用報告システムは、ブラックリストとホワイトリストとして理解できます。クレジットカードの返済を何度も延滞すると、信用「ブラックリスト」に載せられる可能性があります。また、Taobaoで返品保険を購入し、その後何度も商品を返品すると、保険詐欺「ブラックリスト」に載せられる可能性があります。ブラックリストとホワイトリストは、あらゆる不正防止方法の中で最もシンプルですが、更新に時間がかかり、コストもかかります。

異常なユーザーをすべて捕まえることができる

教師あり学習では、ラベルなしデータを予測するためにモデルをトレーニングするために、大量のラベル付きデータが必要です。スパムを例にとると、手動で確認された 5,000 件のスパムメールをモデルに入力すると、モデルはタイトル認識、メール内容の文章分割、キーワード認識などのさまざまな分析方法を通じて、それらの間の内部関係を見つけます。例えば、件名に「福祉」という単語が含まれている場合、スパムである可能性は 90% です。一度に 200 通以上のメールが送信されている場合、スパムである可能性は 60% です。返信率が 10% 未満の場合、スパムである可能性は 70% です...。したがって、モデルが新しいメールを処理するときに、上記のサブ項目を検出し、各サブ項目にパーセンテージを掛けて合計すると、スパムの可能性が得られます。しかし、教師あり学習の欠点は、各モデルに大量のトレーニング データと長いトレーニング時間が必要になることです。

「おそらくモデルはまだトレーニングされておらず、詐欺師たちはすでに詐欺行為を終えて次の標的を探しているのでしょう」とウー・ジョン氏は語った。

教師なし機械学習の主な方法は、クラスタリングとグラフ分析です。金段鋒氏は、教師なし処理ではトレーニングデータやラベルは必要なく、クラスタリングなどの機械学習アルゴリズムモデルを通じてユーザーの共通行動やユーザー間の関係性を発見することで不正行為を検出できると述べた。 「教師なし機械学習を通じてユーザーの一般的な行動を分析することで、変装した異常なユーザーを見つけ出し、全員捕まえることができます。」

クラスタリングとは何ですか? たとえば、ユーザー登録イベントのグループの中で、クラスタリングを使用すると、登録時間が集中している、特定のオペレーティング システム、特定のブラウザー バージョンなど、いくつかの小さなグループに共通の特性があることを見つけることができます。このグループのユーザーは、個別に分析すると正常に見えますが、異常な一貫性が見られる場合は非常に疑わしいものになります。たとえば、午前 2 時から 3 時までの間に、同じブラウザを使用して同じ製品に登録した人々のグループがあり、IP アドレスの最初の 20 桁が同じで、GPS 位置が 1 キロメートル未満であり、登録後に全員がニックネームと性別を変更していました。

今日の金融詐欺はすべてギャングによって実行されている。「全体を細分化し、バッチで複製する」という詐欺の手法に直面して、金端鋒氏は、詐欺防止検出における監視なしアルゴリズムの適用には、早期警告を提供できるという別の利点があると述べた。 「今日の詐欺師は、簡単に発見されないように潜伏期間を設けています。潜伏期間中の詐欺師の行動は一定の規則に従い、一定の一貫性があるため、教師なしアルゴリズムによって捕捉されてしまいます。従来の方法では、脅威が発生する前に詐欺師を検出することは困難です。これが、教師なし機械学習が詐欺対策で優れた成果を上げている重要な理由の 1 つです。」

トラブルが起こる前に予防し、早期に警告を発する

テクノロジーと金融活動において、教師なし機械学習は詐欺の発生を効果的に防止し、ユーザーにタイムリーに警告を発し、口座開設詐欺、不正取引、口座盗難などを防止し、正常な金融活動を確保することができます。

金段鋒氏は例を挙げ、マンモス反詐欺会社は、監視なしの異常検出を基礎として、データを正常傾向、ランダム障害、異常状況の3つの部分に分解し、これに基づいて、設備、ネットワーク、ユーザーの3つのレベルで「数千人の顔」を実現し、ユーザー間の相互接続に基づいてネットワーク図を構築していると述べた。詐欺師はグループで行動することが多く、その行動はネットワーク図の中で非常に一貫性があり、クラスター化されており、通常のユーザーの行動とは明らかに異なります。そのため、クラスター化とグラフィカル分析を使用して詐欺行為を特定します。 「アント・ファイナンシャルやJDファイナンスなどのハイテクインターネット企業も、教師なし機械学習などの技術的手段を通じて金融テクノロジーで優れた成果を上げている。」

不正行為を効果的に防止することに加えて、教師なし機械学習はテクノロジーファイナンスの分野でもさまざまな役割を果たすことができます。例えば、ユーザーポートレートとビッグデータモデルを通じて、ユーザーを正確に見つけ出し、精密なマーケティングを実現できます。個々の投資家が提供するリスク許容度、リターン目標、スタイルの好みなどの要件に応じて、ポートフォリオ最適化などの一連のインテリジェントアルゴリズムと理論モデルを使用して、ユーザーに最終的な投資参考情報を提供し、市場動向に基づいて資産配分の調整を提案します。投資調査には、大量の情報の収集、データ分析、レポート作成などが必要ですが、機械は関連情報を自律的にキャプチャして意思決定を支援し、投資調査レポートを自動的に生成することもできます。ビッグデータ人工知能技術を使用すると、大量の多次元データを使用して、高度に洗練されたリスク管理モデルを作成できます。金融規制を学習して蓄積し、金融機関の実際の状況を組み合わせることで、コンプライアンスの推奨事項が提供されます。機械は、大量の取引データから知識とルールを学習し、異常な行動を発見し、マネーロンダリング行動に対して警告することもできます。

投資予測に広く利用されている

教師なし機械学習技術の応用は、常に深化と拡大を続けています。アイシーノは上場企業である航空宇宙情報株式会社の完全子会社であり、ビッグデータの収集、分析、応用において優れた能力を持ち、税務や事業運営データを中核とした企業信用データベースを構築しています。

金端鋒氏は、実は多くの大企業がユーザーデータ情報を保存した大規模なデータベースを持っていると述べた。教師なし機械学習を通じてユーザーの全体的なデータを分析することで、ユーザーの金融消費習慣、投資嗜好などの変化を発見し、市場分類を自動的に発見し、異なるユーザーグループ向けに異なる金融商品を発売することができる。 「こうすることで、ターゲットを絞って新しい市場を開拓し、盲目的な投資を減らすことができます。」

さらに、顧客の国籍、職業、給与、経験、業界、信用履歴などの情報に基づいて、顧客の信用リスク スコアを決定するために、教師なし機械学習テクノロジーを使用することもできます。このような評価は、顧客にサービスを提供する前に実行することもできるため、融資プロセスが迅速化され、時間のかかる必要な「デューデリジェンス」プロセスが回避されます。

「機械学習の利用により、株価予測は非常に簡単になりました。」金端鋒氏は、機械学習アルゴリズムは上場企業の貸借対照表や損益計算書などの過去のデータを使用して分析し、企業の将来の発展に関連する意味のある兆候を見つけ、投資予測を行うと述べた。

<<:  AIに人間主義の精神を持ち込むことについて、フェイフェイ・リーとビル・ゲイツは今日スタンフォードで何について話したのでしょうか?

>>:  ガートナーレポート: 私たちはデータサイエンスと機械学習ツールの「大爆発」の時代を迎えている

推薦する

AIの実践、Pythonを使って自動運転を体験しよう!

設置環境Gym は、強化学習アルゴリズムの開発と比較のためのツールキットです。gym ライブラリとそ...

AI、ゼロトラスト、エッジの近代化、マルチクラウド: 2024年に注目すべき技術トレンド

実際、ChatGPTによって引き起こされたこの新しいAIの波では、世界的なテクノロジー大手、AIメー...

GNMT - Google のニューラル ネットワーク翻訳システム

1. はじめに2016年9月、Googleはニューラルネットワークベースの翻訳システム(GNMT)を...

1 行のコードで AI モデルの推論速度が 10 倍に向上します。 Reddit の技術共有は「恥知らずな自己宣伝」として揶揄される

Reddit フォーラムでは、さまざまな AI テクノロジーについて頻繁に議論されています。最近、あ...

グラフニューラルネットワークは CV の未来でしょうか?中国科学院ソフトウェア研究所は、ViTを上回る新しいCVモデルViGをリリースした。

コンピュータービジョンのネットワーク構造は新たな革命を迎えようとしているのでしょうか?畳み込みニュー...

AIが写真を見て場所を推測、その精度は90%以上!スタンフォードの最新のPIGEONモデル:予測誤差の40%は25キロメートル未満

インターネット上に何気なく投稿された写真から、どれほどの情報が漏れてしまうのでしょうか?外国人ブロガ...

収集する価値のあるAIツールメモ8つ

緊急時のメモとしても使える、コレクションする価値のあるAI写真を8枚シェアします。最初の RTF フ...

復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

2019年に予想される5つのホットなスタートアップトレンド

最近は大学生があちこちで見かけられ、就職のプレッシャーも高まっています。そのため、多くの人にとって、...

Python は R を抜いて、データ サイエンスと機械学習プラットフォームで最も人気のある言語になるのでしょうか?

最近、kdnuggets はデータ サイエンスと機械学習言語の使用に関するアンケート調査を実施しまし...

人工知能のいくつかの重要な技術をご存知ですか?

今日は人工知能の開発におけるいくつかの重要な技術を紹介します。音声認識からスマートホーム、人間と機械...

2021年にはAI機能を導入する企業がますます増える

[[360047]]今年、ほとんどの企業は、新型コロナウイルス感染症による混乱に対処し、リモートワー...

AI分野 | ゲームのルールを変える画期的なアイデア10選

[[357174]] AI の旅が始まって以来、私は無限の可能性を秘め、輝かしい歴史に足跡を残してき...

マイクロソフトのXiaoIceが第5世代の歌唱システムにアップグレード:人間のアイドルを超える

人工知能が歌うことは珍しくないが、本当に人間の声に近い、あるいは本物と偽物の区別がつかないような「機...