出典: CreditEase Technology Institute の第 1 回テクニカル サロン - ライブ放送 | AI ミドル プラットフォーム: アジャイルでインテリジェントなビジネス サポート ソリューション はじめに: 「データミドルプラットフォーム」の提案と成功した実践により、さまざまな企業が「大きなミドルプラットフォーム、小さなフロント」というコンセンサスの下で独自のミドルプラットフォームプロセスを開始しました。データミドルプラットフォーム、テクノロジーミドルプラットフォーム、ビジネスミドルプラットフォームに代表される一連のテクノロジーは、ビジネスの俊敏性を大幅に高め、組織の有効性を向上させました。同時に、インテリジェント技術の発展に伴い、ビジネスの研究開発におけるAIアプリケーションの割合は徐々に増加していますが、AIモデルのトレーニングの複雑さにより、開発が遅くなり、効率が低下し、ビジネスの柔軟性に深刻な影響を及ぼしています。 この場合、ミドルオフィスの考え方に基づいて、業務における AI 研究開発に特化したサポートを提供し、インテリジェントニーズの迅速な実現と柔軟な試行錯誤機能を提供し、それによって企業のインテリジェントイノベーション能力を強化することは可能でしょうか? AIミドルプラットフォームの構築・実装方法は? 今回のライブ放送では、CreditEase R&DセンターのAI応用チーム責任者であるJing Yuxin博士が、CreditEaseの現在の実際の業務とCreditEaseのミドルオフィス戦略の実施を踏まえて、上記の問題について議論しました。以下はこの共有の記録です。 概要を共有: 1. AIミドルステーションの提案 2. AIミドルステーションの目標と定義 3. AI中間ステーションの実装ルート 4. 事例分析 - インテリジェント投資助言ロボットを例に V. 結論 6. 質疑応答 PPT を取得するには、「元のテキストを読む」をクリックします。 以下はライブビデオです。クリックして再訪できます。所要時間は1時間25分2秒です。WiFi環境で視聴することをお勧めします。 記録を共有する AIミドルプラットフォームの提案
1.1 ミドルプラットフォーム戦略の台頭 ミドルプラットフォーム戦略が提案され、成功裏に実施されて以来、業界は強く反応し、国内企業は独自のミドルプラットフォームプロセスを開始しました。特に、戦略の中核となるデータミドルプラットフォームの構築については、各関係者がそれぞれ独自の解釈と経験を持っています。 しかし、全体的に見ると、業界はミドルプラットフォーム戦略について一定のコンセンサスに達しており、つまり「ミドルプラットフォームは大きく、フロントデスクは小さい」という考え方を提唱しています。ミドルプラットフォームを構築することで、共有サービスを促進し、サービスの再利用率を高め、「煙突型」と「プロジェクト型」のシステム間の統合と連携の障壁を打ち破ることができます。フロントエンド業務の試行錯誤コストを削減し、業務に迅速な革新能力を与え、最終的に企業の組織効率を向上させることができます。 金融、オンライン取引、情報、医療、教育など、業界のミドルプラットフォーム戦略に関する議論には、ビジネスミドルプラットフォーム、テクニカルミドルプラットフォーム、モバイルミドルプラットフォームなど、企業の日常業務のあらゆる側面が含まれています。しかし、データ時代には、企業内の多くの業務がビッグデータ上で実行されます。データの応答性と処理能力がビジネス効率を決定します。したがって、ミドルプラットフォーム戦略の最も重要で出発点は、依然としてデータミドルプラットフォームです。データ ミドル プラットフォームは、組織内のデータ標準の統一を実現し、データの障壁を打ち破り、統一されたデータ エンティティを構築し、外部に統一されたデータ サービスを提供します。これら 3 つの「統合」を通じて、組織内にデータ資産センターが実現され、フロントエンド ビジネスに自動化されたセルフサービス型のアジャイル データ機能出力が提供されます。 自動化の利点は、日常的なデータ操作のコストを大幅に節約できることと、セルフサービス データ管理により、ビジネス ユーザーが独自のニーズに応じてデータを取得および処理し、ビジネス ニーズを柔軟に実現できることです。しかし、従来の「煙突型」データシステムと比較すると、これら 2 つの利点は、ビジネス側がデータ サービスをより使いやすく、使いやすいと感じるだけです。本当に使いやすくしたい場合、またはビジネス側が使いたくなるようにしたい場合は、データ ミドル プラットフォームとその他のミドル プラットフォーム サービスの両方をインテリジェント機能から切り離すことはできません。 1.2 インテリジェントビジネス要件の集中化 インテリジェント ビジネスに対する需要は、次の 2 つの側面から生じます。 一方、データの観点から見ると、利用できるデータが増えるにつれて、貴重な情報を特定し、データの関係性を発見し、データの傾向を把握することがますます困難になります。インテリジェントな方法でビッグデータを管理することによってのみ、ビジネスを改善し、さらには革新することができます。ビッグデータの探索に基づいて、潜在的なデータのつながりや傾向を発見することで、ビジネスの最適化とイノベーションを強力にサポートし、真のデータ駆動型ビジネスを実現できます。したがって、データ センターにはインテリジェントな機能があり、ビジネスに一定のインテリジェントなデータ分析機能を提供できる必要があります。 一方、データに基づくボトムアップ型のインテリジェントドライブに加え、トップダウン型のエンタープライズインテリジェントコンセプトドライブも存在します。近年、多くのインテリジェント技術がますます成熟し、対応するインテリジェント概念も人々の心に深く根付いています。多数の成功したインテリジェント事例により、これらの技術は徐々に業界の主流に受け入れられ、事実上の標準ソリューションにさえなっています。たとえば、電子商取引には推奨事項が必要であり、金融にはリスク管理が必要です。これには、フロントデスクがデータに基づいて提案したインテリジェント目標をR&D担当者が正確かつ迅速に達成できることが必要です。 上の写真は例です。データは Roland Berger から提供されたものです。金融テクノロジー企業として、CreditEase は金融分野におけるインテリジェントなビジネス ニーズに重点を置いています。この図から、金融の分野では、標準化されたインテリジェント アプリケーションを形成するリンクが非常に多くあることがわかります。今日の企業ビジネスの発展において、インテリジェンスが果たす役割がいかに重要であるかがわかります。 ニーズが何であれ、問題は存在します。インテリジェントなビジネス ニーズは多様で異なります。ニーズが発生すると、R&D チームはターゲットを絞ったデータの分析と処理、モデルの構築とトレーニングなどを実行する必要があります。プロセスは複雑で非効率的であり、需要への対応時間が長くなり、ビジネスの俊敏性が低下し、試行錯誤のコストが増加します。これは、ミドルオフィス戦略を背景に、ビジネスロジックに重点を置き、変化に柔軟に対応したいというビジネスフロントエンドの要望と矛盾しており、さらに、インテリジェントアプリケーションの広範な開発により、この矛盾はますます一般的になっています。 その理由は、一方では、インテリジェンスの大規模な台頭がわずか数年で起こったばかりであり、インテリジェント アプリケーションの研究開発はまだ比較的原始的な段階にあり、完全なライフサイクル管理理論と対応する管理フレームワーク ツールが不足しているからです。他方では、ミドル オフィスの機能が、フロントエンドのビジネス研究開発における煩雑で反復的で非効率的なリンクを完全にカバーしていないことを反映しています。 そこで当然、上記の問題を解決するために、既存のデータセンターにさらにインテリジェントな移行を行うことができるのではないか、と考えます。もしそうなら、データ ミドル プラットフォームはどのようなデータ インテリジェンス機能を提供できるか、または提供すべきでしょうか?そうでない場合、ミドルプラットフォーム戦略はどのようにしてインテリジェントなビジネスニーズを機動的にサポートすべきでしょうか? 1.3 データミドルプラットフォームからAIミドルプラットフォームへ まず、データ センターのインテリジェント サポート機能を確認し、次の質問を分析してみましょう。データ センターは、一般的なインテリジェント データ モデルを通じて、現在のビジネス コンテキストにおける多様なインテリジェント ニーズを完全にサポートできますか?答えは、ビジネス インテリジェンス プロセスの複雑さのため、非常に難しいということです。 一般的な機械学習タスクには、回帰、分類、ラベル付け、クラスタリング、推奨などがあります。各アルゴリズム モデルの実装には、データの前処理、機能分析、モデリング、トレーニング、展開などの複数のステップが含まれます。実際のアプリケーションには、複数のモデルが含まれる可能性があります。 データミドルプラットフォームはデータを中心に据えています。そのインテリジェント機能が上記のすべてのリンクをサポートしようとすると、作業負荷が膨大になり、データミドルプラットフォームの本来の目的から逸脱してしまいます。したがって、データミドルプラットフォームにすべてのインテリジェントビジネスサポートを任せるのは不適切です。 詳細には、現在人工知能(AI)がカバーしているコンテンツを分析できます。広義では、人工知能とは、科学的な方法と技術を使用して、人間の知能を模倣、拡張、拡大できる機械システムを開発することを指し、コンピュータサイエンス、数学、哲学、心理学などの複数の分野が含まれます。コンピュータサイエンスの狭義の観点から見ると、人工知能は、外部データを受け入れて処理し、人間のような分析と決定を行うことができるコンピュータシステムを指し、データマイニング、機械学習、ディープラーニング、強化学習などの複数のサブフィールドをカバーしています。特に断りのない限り、本稿で述べる人工知能は後者を指します。 これらの種類のタスクのうち、機械学習、ディープラーニング、強化学習は目標や実装プロセスが比較的類似しているため、通常は総称して機械学習タスクと呼ばれます。この記事でもこの総称を採用しています。データマイニングタスクは機械学習タスクと関連してはいますが、異なるタスクであり、その違いは多くの人々に混乱を引き起こしています。 実際、「データマイニングと予測分析」という書籍の定義によると、「データマイニングとは、大規模なデータセットから有用なパターンや傾向を発見するプロセス」であり、これには、データの前処理、データの探索、データの次元削減、データの統計、相関分析、外れ値分析などのサブタスクが含まれます。これらは、機械学習作業の基礎となります。 一方、データマイニングには、その後のデータクラスタリング、データ予測、データ分類も含まれており、これらは機械学習の研究の一部です。機械学習の活発な発展と優れたパフォーマンスにより、この部分の作業は一般的に機械学習に任されています。 つまり、どちらも人工知能の重要な研究方向であり、企業のビッグデータインテリジェンスプロセスにおける重要なリンクです。これらは相互に関連していますが、焦点が異なります。データマイニングは「洞察」に重点を置いているのに対し、機械学習は「学習」と「予測」に重点を置いています。 上記の分析から、現在のビジネスコンテキストでは、「インサイト」タスクに従事するデータマイニング作業はデータに焦点を当てており、通常は人間の支援なしで自動的に完了できることがわかります。また、データマイニングはデータの予測や分類などのタスクを伴わないため、通常は比較的固定された分析アルゴリズムとモデルを使用するため、この部分の作業は完全に自動化され、セルフサービス化され、データミドルプラットフォームに統合され、固定されたインテリジェントデータモデルサービスとしてビジネスユーザーに提供されます。 一方、「学習」や「予測」などの機械学習タスクは比較的複雑です。 機械学習の実装プロセスは通常、非常に計算集約的です。 使用されるアルゴリズムとモデル構造は同じかもしれませんが、それらはすべてビジネス データに基づいてパーソナライズされたパラメータ トレーニングを必要とします。 トレーニング フェーズは通常、複数回の反復を経ます。 一部の教師なし学習を除き、実装フェーズでは通常、手動のラベル付けの参加が必要になります。 オンライン モデルの動作パフォーマンスは、データの進化に応じて監視および更新する必要があります。 人工知能分野の分類を理解した後、先ほど提起した質問に答えてみましょう。データ ミドル プラットフォームがビジネスで生じるインテリジェントなニーズをサポートする場合、データ ミドル プラットフォームへの移行はどのように行うのでしょうか。言い換えれば、データセンターはこれらのニーズをサポートするためにどのように機能を変革できるのでしょうか? 上図からわかるように、データミドルプラットフォーム自体は、データ中心であること、固定アルゴリズムを持っていること、ある程度の自動化を持っていることなどの特徴を持っています。データミドルプラットフォームでは、ストリーミングコンピューティング機能、バッチコンピューティング機能、データ可視化技術などを最大限に活用して、対応するビジネスニーズをサポートできます。 これらはすべてデータセンターがすでに備えている機能です。 AI プロジェクトの機械学習部分をサポートするためにデータ ミドル プラットフォームも使用する場合、他にどのような機能が必要ですか?上の写真のように、円を描きながら外側に広がります。まず、複雑な特徴エンジニアリングのサポートとモデル トレーニング機能が必要です。次に、データのラベル付け、モデルの展開、パフォーマンス監視機能が必要です。 それぞれの能力は、開発に多くの人材、物的資源、時間を必要とし、内側から外側への能力の拡張とデータ自体との相関関係は、強いものから弱いものへと変化しています。つまり、能力レベルの継続的な拡張に伴い、データミドルプラットフォームは徐々に「データ中心」の目的から逸脱し、データミドルプラットフォームが肥大化して複雑化し、フロントエンドのビジネスニーズとの接続時にさらに複雑な問題を引き起こす可能性もあります。したがって、データ ミドル プラットフォームは、ある程度までインテリジェントなビジネス ニーズをサポートできますが、すべてのインテリジェントなビジネス ニーズをサポートするためにデータ ミドル プラットフォームのみに依存する場合、明らかに最適な選択ではありません。 それで私たちは何をすべきでしょうか? AIミドルプラットフォームとデータミドルプラットフォームを分離します。 上図に示すように、データ ミドル プラットフォームの外部にある複数の機能レイヤーを抽象化して分離し、それらを統合して独立したミドル プラットフォーム レイヤーを形成し、データ ミドル プラットフォームに依存して特定のコラボレーションを実行し、フロント デスクのインテリジェントなビジネス ニーズに共同で対応します。データミドルプラットフォームは主にデータマイニング、データ分析のインテリジェントアルゴリズムとモデルを統合し、新しいミドルプラットフォームは主に複雑な学習予測やその他のインテリジェントニーズの研究開発を担当します。私たちはこの中間プラットフォームを「AIミドルプラットフォーム」と呼んでいます。 上の図は、AIミドルプラットフォームとデータミドルプラットフォームの分離の構造図です。上から順に、ビジネスフロントデスク、AIミドルプラットフォーム、データミドルプラットフォーム、および下部に関連するコンピューティングとストレージリソースがあります。 データ ミドル プラットフォームは、データの標準化、データ エンティティ、データ サービスの統合などの基本機能を提供します。また、インテリジェント データ モデル、相関分析、主成分分析、外れ値分析など、データ処理のインテリジェントなニーズもサポートします。データセンターは主にデータの探索を担当します。 AIミドルプラットフォームは、モデル設計トレーニング、モデル/アルゴリズムライブラリ、再利用アノテーション管理、監視サービスなど、一連の関連するAI密結合機能サポートを提供します。 AIミドルステーションは学習と予測のタスクに従事しています。 ビジネス フロント デスクには、ビジネス インテリジェンスの要求、ユーザー セグメンテーションの要求、パーソナライズされた推奨の要求など、ミドル デスクからのアジャイル サポートを必要とするさまざまな要求が含まれます。 注目すべきは、上図に示した構造は単なる例であるということです。ミドルプラットフォームは主にビジネス指向であり、ビジネスニーズにより機敏に対応します。したがって、ミドルプラットフォームシステムはビジネスに応じて構築する必要があります。たとえば、一部のフロントエンドビジネスではAIミドルプラットフォームを必要とせず、データミドルプラットフォームで直接処理できます。 ここまでで、これまでの質問に答えてきました。ビジネス インテリジェンスのニーズをアジャイルに実装するには、データ センターだけに頼るだけでは不十分ですが、その基盤の上に専用の AI センターを構築して、この機能を提供することができます。ミドルオフィス戦略は、ミドルオフィス変革を実現するために、データミドルオフィスだけに頼ることはできません。アリババのシェアードサービスセンターには、ビジネス、テクノロジー、データなど、複数のレベルのコンテンツも含まれています。各企業は、合理的に抽象化して独自のミドルオフィスサービスモデルを構想し、独自のビジネス構造とプロセスに従って実装する必要があります。 AIミドルステーションの目標と定義
前回の記事では、インテリジェントビジネスニーズとデータミドルプラットフォームの分析を通じて、AIミドルプラットフォームを構築する背景と理由を説明しましたが、AIミドルプラットフォームの目標は何でしょうか?基本的な要件と機能は何ですか?これについては次に詳しく説明します。 2.1 AIタスクの分割と敏捷性の要件 AIミドルプラットフォームは、さまざまなAIタスクを柔軟にサポートし、さまざまなタスクのアジリティプロセスにおけるニーズと問題点を解決する必要があります。現在、企業のインテリジェントなニーズは多様化しており、対応する AI タスクも多種多様になっています。 AI タスクの種類を分類する方法は多数あります。たとえば、タスクの目的に応じて、回帰、分類、クラスタリング、ラベリングなどに古典的に分類できます。 ここでは別の分割方法を採用し、すべてのAI タスクは次の 2 つのカテゴリに分類できると主張します。 1 つは、コンピューター ビジョンや自然言語処理タスクなど、特定のビジネス分野における特定の種類のデータに対して基本的な AI 学習、予測、分析機能を提供する「水平」タスクです。 もう 1 つは、金融分野におけるインテリジェントなリスク管理、電子商取引分野における製品の推奨、より一般的なユーザー ポートレートの構築など、特定のビジネス ニーズに向けられた、比較的専門的でパーソナライズされた「垂直」タスクです。 これら 2 種類の AI タスクについては、両方のタスクを独立して外部に提供することも、相互に混合、統合、組み合わせて AI ソリューションを形成し、より複雑なビジネス シナリオをサポートすることもできます。当社のインテリジェントビジネスアプリケーション構築の中核は、インテリジェント要件を特定の AI タスクに分解してマッピングし、それらを 1 つずつ実装し、最終的にそれらを合理的に整理して組み合わせてタスクの目標を達成することです。 しかし一方で、2 種類のタスクの実装中に求められる敏捷性は異なり、AI ミドル ステーションが提供すべきサービス要件も異なります。相対的に言えば、水平方向のタスクの俊敏性は達成しやすいと言えます。 水平タスクについては、一部のシナリオを除いて、ビジネスニーズを直接解決しないことがよくあります。多くの場合、水平タスクはデータの予備処理を実行するための基本モデルとして使用され、その後、いくつかの垂直タスクを使用してニーズを満たします。これにより、アルゴリズム実装チームには、水平タスク モデルを完全に改良し、その俊敏性を向上させるための十分な時間が与えられます。 ビジネス分野におけるデータの普遍性により、金融ビジネス分野における一般的な自然言語理解モデルなど、一般的に使用されるビジネス分野固有の水平 AI モデルのセットを事前トレーニングできます。このように、このモデルセットを維持および更新するだけで、この分野のインテリジェンス関連のニーズはすべて、いつでもモデルライブラリを再利用できるため、タスクのトレーニング時間を大幅に節約できます。 さらに、あらゆる分野向けの水平AIモデルライブラリを事前トレーニングすることもできるため、新しいビジネス分野に参入した場合でも、この事前トレーニング済みライブラリをベースに、コンピュータービジョン分野のImageNetプロジェクトや、自然言語処理分野でGoogleが立ち上げたBERTテクノロジーなど、その分野の汎用的な水平モデルを迅速に作成することができます。 そのため、水平的な基本AIタスク自体は、モデルの汎用性と再利用性を向上させることで、インテリジェントなビジネスニーズに機敏に対応できます。基本AI共有サービスプラットフォーム(または構築したいAIミドルプラットフォーム)は、便利な再利用可能なソリューション設計と自動拡張構造、完全なモデルライブラリ、アルゴリズムライブラリ管理システム、安定したモデル動作環境を提供する必要があります。 垂直タスクの場合、状況はさらに複雑になります。垂直タスクは要件が広範囲で、ほとんどがカスタマイズされた開発であり、データの種類も多岐にわたります。水平タスクのように一般的なモデルを構築してニーズに応えることは困難です。プロジェクトの開発には特別な手動のラベル付けが必要であり、モデルを繰り返しトレーニングして調整する必要があり、これらすべてに多くの時間と労力がかかります。結局、プロジェクトの時間コストのほとんどがこれらのリンクに費やされ、AIアプリケーションプロジェクトの研究開発が遅れることになります。 さらに重要なのは、現実には、絶えず変化するビジネスに直面して、フロントデスクのインテリジェントアプリケーションに対する最大の要件は、必ずしも最適なパフォーマンスの向上ではなく、迅速な研究開発、迅速なリリース、即時の結果です。多くの場合、パフォーマンスに対して一定の許容度さえも許容できます。明らかに、ほとんどの垂直タスクの開発速度はこの要求を満たすことができず、フロントエンドビジネスの急速な進歩とバックエンドの遅い開発の間に激しい矛盾を生み出しています。 AI サービスを集中化する場合、AI の集中化によって、垂直タスク開発の遅さという最大の問題点を解決できなければなりません。 垂直タスクの問題点の鍵は、R&D プロセスの複雑さにあります。 現在のほとんどの垂直タスク プロジェクトでは、さまざまな要件があるため、アルゴリズム チームは、データの取得、処理、分析、モデリング、ラベル付け、モデルのトレーニング、チューニング、検証、展開、監視、更新などの一連の手順を毎回実行します。 各リンクには、データ アクセス管理、機能エンジニアリング、ラベル付けプロセスへの手動介入、トレーニングとチューニングの繰り返しなど、独自の複雑さがあります。 さらに、データ アナリスト、アルゴリズム エンジニア、アノテーション エンジニア、ビジネス アナリストなど、プロセス全体には多くの役割が関与しており、役割の管理も同様に複雑です。 したがって、このような複雑なタスク問題に対する研究の焦点は、ライフサイクル全体の科学的管理と、R&D プロセスおよび各リンクの最適化にあります。 R&D プロセスの各リンクを分割することで、タスクのスケジュール順序をある程度最適化し、各リンクに関係する役割を明確に識別し、タスクの並列処理と役割のコラボレーションを通じて時間の消費を短縮できます。各リンクまたはローカル リンクを詳細に検討することで、自動化された操作と再利用可能なプロセスを抽象化し、ビジネス応答速度をさらに向上させることができます。 さらに、水平タスクか垂直タスクかに関係なく、どちらにも AI ミドルステーションに対する共通の基本要件がいくつかあります。 まず、インテリジェント モデルにはデータへの統一されたアクセスが必要です。インテリジェントモデルは、トレーニング段階で一定量のトレーニングデータを必要とし、オンラインになった後は本番データに接続する必要があります。その後の監視と更新には、さらに多くのデータが必要になります。しかし、実際には、各プロジェクトのデータソースは一般的に異なります。そのため、R&D担当者は、プロジェクトの状況に基づいて、毎回手動でデータを申請、取得、クリーニング、および前処理する必要があり、効率に大きな影響を与えます。統合データ サービス プラットフォームやデータ ミドル プラットフォームに接続できる場合、このプロセスによって多くの時間と労力が節約されます。 第二に、インテリジェント モデルには、安定したモデル展開および運用プラットフォームと、モデルのパフォーマンスを常に追跡するための対応するモデル監視システムが必要です。もちろん、必要に応じてモデルを継続的に更新およびアップグレードできるように、便利なモデル更新メカニズムも利用可能である必要があります。 繰り返しになりますが、インテリジェント モデルの開発プロセスでは、一連のコンピューティング、ストレージ、およびその他のリソースが必要になります。ほとんどの企業では、多くのプロジェクトにおいて、プロジェクト チームがモデルをトレーニングするために独自のコンピューティング リソースを提供し、その後、環境を構成してプロジェクトをオンラインにするときにデプロイするために運用リソースを申請します。この独立したリソース管理モデルでは、必然的にリソースの使用における不整合や無駄が生じます。コンピューティング リソースを集中管理し、柔軟なコンピューティング リソースのスケジュール機能を提供するには、信頼性の高いリソース管理システムが必要です。 まとめると、前回の記事で述べた2種類のAIタスクの分析に基づいて、AIミドルステーションが何をすべきか、どのような能力を持つべきかをまとめることができます。 2.2 AIプラットフォームの目標と機能 AI プラットフォームは、エンタープライズ インテリジェント アプリケーションの現在の開発における応答の遅さや効率の低さなどの問題を解決することに取り組んでいます。これには以下が含まれますが、これらに限定されません。 「煙突型」の開発、高いプロジェクトコスト、困難な統合、反復的なプロセス、能力蓄積の欠如。 R&D リンクが多く、最適化、コラボレーション、自動化の支援が不足しており、ビジネス対応が遅い。 モデル開発には標準的なガイダンスが欠如しており、サービスインターフェースはわかりにくく、保守と管理は困難です。 統一されたデータ アクセス チャネルの欠如、データ取得の難しさ、一貫性のない標準、およびデータの前処理と機能エンジニアリングの繰り返し。 統一されたモデル操作および監視プラットフォーム、ならびに更新および保守メカニズムの欠如。 基本的なリソースは分散的に管理されており、十分に活用されていないため、無駄が生じています。 上記の問題は広く蔓延しており、現在のアルゴリズム研究開発チームの多くは、アルゴリズムアウトソーシングチームに似ていると言えます。さまざまな業務部門のニーズに応じて独自のポジションを構築し、徐々に目標を達成しています。プロセスは反復的であり、効率は限られています。 AIミドルプラットフォームは、ビジネスニーズに応じて迅速に強力なサポートを提供し、目標を迅速に達成するための強力なAI機能サポートセンターを提供することを目指しています。したがって、 AI ミドルステーションに必要な機能は次のとおりです。 複数のレベルを再利用できます。アルゴリズムとモデル、および再利用可能なサービス パッケージ機能に関する標準化された R&D ガイダンス。 統合されたサービス。動的なオーケストレーションとサービスの組み合わせをサポートするための統合サービス インターフェース仕様。 プロセスロールの最適化。 R&D プロセスの分割と最適化、明確な R&D ロールの定義、タスクの並列処理とロールのコラボレーションのサポート、AI 製品の R&D パイプラインの構築。 自動化された反復。 R&D リンク内および R&D リンク間での自動化された反復と循環の機能を備えています。 データ プラットフォームに接続します。データ センターまたはその他の基本データ サービスに接続して、標準化されたデータにすばやくアクセスしたり、データを前処理したりします。 操作監視。統一されたモデル運用環境と監視機能、およびモデル更新メカニズムを提供します。 リソースの管理と制御。コンピューティング リソース、ストレージ リソースなどを含む統合リソース管理により、柔軟なリソース スケジューリングがサポートされます。 上記の機能を組み合わせて、 AI ミッドステーションの探索的な定義を示します。 AIミドルプラットフォームは、完全なインテリジェントモデルの全ライフサイクル管理プラットフォームとサービス構成システムであり、データプラットフォームサービスに基づいて、インテリジェントサービスの共有と再利用、インテリジェントサービスのR&Dに関連する役割の管理、R&Dプロセスの標準化と自動化を通じて、フロントエンドビジネスにパーソナライズされたインテリジェントサービスを迅速に構築する機能を提供します。 AI中間ステーションの実装ルート 前回の記事では、AIミドルステーションの背景、機能、定義を紹介しました。このセクションでは、AIミドルステーションの実装ルートに焦点を当てます。 3.1 AIプラットフォームの主な構成要素 上図は、AI 製品開発のライフサイクルを示しています。ビジネスニーズが発生すると、ビジネスの理解、モデルの学習、データ処理、運用監視という 4 つの主要なステップがあります。 これら 4 つのステップとミドル プラットフォーム管理が、AI ミドル プラットフォームの主なコンポーネントを構成します。 ビジネス理解、ビジネスニーズに基づいた実装計画の設計、サービスオーケストレーション、一般的なソリューションテンプレートの管理。 データの取得、データの準備および分析を含むデータ処理。 モデル学習には、特徴エンジニアリング、モデルトレーニング、モデル評価、再利用可能なモデルライブラリとアルゴリズムライブラリの管理が含まれます。 運用監視には、自動モデル展開と運用、パフォーマンス監視、外部サービス インターフェイス管理が含まれます。 さらに、AIミドルプラットフォームの役割、権限、リソースの統一的な制御を容易にするために、 ミドルプラットフォーム管理モジュールも設置しました。 3.2 プラットフォームから中間プラットフォームまでの建設 データミドルプラットフォームを構築する場合、一般的にプラットフォームからミドルプラットフォームへと進化する戦略を採用しますが、AIミドルプラットフォームの構築でも同様です。 プラットフォームからミドルプラットフォームへの移行プロセスでは、トレーニングプラットフォーム、展開/運用プラットフォーム、監視プラットフォーム、アノテーションプラットフォーム、モデリングプラットフォーム、データ処理プラットフォームなど、一般的な機械学習プラットフォームを参照する必要があります。 既存のプラットフォームをベースにAIミドルプラットフォームの構築を完了することができます。モデリングプラットフォームは、ビジネスの理解とモデル学習の段階で使用できます。これは、既存のプラットフォームに基づいてAIミドルプラットフォームの構築を完了できることを示しています。 上記の写真は、AI中央ステーションの機能マップです。 企業であろうとAIトレーニングチームであろうと、それらはすべて、データアクセス、高性能コンピューティングリソース、環境リソースなどのインフラストラクチャから始まります。 次に、安定性を確保することに基づいて、プロセスを自動化するためのモデルトレーニング追跡機能、アルゴリズムフレームワークサポート機能などを含むトレーニングツールを取得します。 トレーニングツールのサポートにより、共通のビジネスとリンクを収集および中央に構成して、構成可能なモデル/サービス構造、再利用可能なモデルアルゴリズムなどを含むAIプラットフォームを形成して、標準化されたAI R&Dプロセスを形成することができます。 AI Middleプラットフォームは、実際に既存の機能を統合および接続して、サービスオーケストレーションと共有機能、ソリューションの再利用性、フルプロセス管理機能などを含むライフサイクル管理を実現し、基準に加えて効率の改善を達成し、高効率の目標を達成します。 上記の図は、AIミドルウェア機能をそれぞれコンポーネントとプラットフォームにマッピングし、色を使用してそれらを区別して対応します。 ここでは、中央のプラットフォームのサポートのニーズに応じて、その他の機能を構築する必要があります。 3.3 AIミドルプラットフォームプロセスとアーキテクチャ 上記の図は、フロントエンドのビジネスニーズから始まり、 AI中央プラットフォームの5つのコンポーネントに従ってAIミドルプラットフォームの構築に必要な主要な機能コンポーネントをリストします。 ビジネス理解の部分には、ソリューションテンプレート管理、ソリューション設計、サービスオーケストレーション、サービス共有などが含まれます。 データ処理の部分には、データ表示、データアクセス、データ分析、データラベル付けなどが含まれます。 モデル学習部分には、サービス設計、機能処理、モデルトレーニング、モデル追跡、モデルライブラリ、アルゴリズムライブラリなどが含まれます。 操作監視部品には、特定の製品パッケージング、自動展開、パフォーマンス監視、アクセスインターフェイス管理、モデルの更新、リリーステストなどが含まれます。 中間オフィスの管理部品には、役割の許可、リソース管理、テナント管理、プロセス制御が含まれます。 上記の機能コンポーネントをAIプロジェクトのライフサイクルにマッピングすると、上記の図に示す全体的な動作プロセスが得られます。 ビジネス要件から始めて、ソリューションテンプレートの参照、ソリューション設計、サービスオーケストレーション、サービス共有などを含むビジネスを理解します。他のサービスを再利用する必要がある場合は、ここでアクセスして構成できます。 データ処理パーツはデータセンターを介して完成し、データを上向きに参照し、モデルトレーニングと監視サポートを下向きに提供します。 モデルトレーニングパーツは、自動化された反復プロセスであるため、比較的複雑なサイクルを形成します。 カプセル化部分には、外部アクセスインターフェイスの監視や提供などの関数が含まれます。 ミドルオフィス管理は、下部に建設サポートを提供します。 以下では、各部品の操作プロセスを詳細に説明します。 ビジネス理解センター ビジネス理解センターの運用プロセスを上の図に示します。 ビジネスのニーズが来たら、最初にデータ処理センターからデータ分析と参照を取得し、データサンプルを収集して視覚化サポートを提供します。 次に、ソリューションを選択します。再利用可能なソリューションテンプレートはありますか? 「はい」とは、ソリューションを直接再利用し、データを変更することを意味します。 次のステップは、ソリューションをさまざまなサービスに分解し、サービスを合理的かつ効果的に調整することです。ここでは、どのサービスが再利用できるかを検討する必要があります。 最後に、3つの側面が出力されます。データ処理センターへの出力は、モデルトレーニングセンターへの出力です。 ビジネス理解センターの運用プロセスには、主に3つの役割が含まれます。 ビジネスアナリスト、関連するソリューションの設計とサービスオーケストレーションの分析。 データアナリストは、データの提案とソリューション設計の提案を提供します。 アルゴリズムエンジニアは、サービスオーケストレーション、サービス間のデータインターフェイスなどを検討します。 データ処理センター データ処理センターの動作プロセスを上の図に示します。 ビジネス処理センターからデータ要件と仕様を取得し、データアクセスを介してデータセンターに接続します。 データ分析、データ表示、およびデータセンターに基づいた関数の視覚化を提供します。 データプレゼンテーションを介して参照を取得し、データに注釈を付けます。 データアクセスを操作し、データミドルプラットフォームに戻り、データを再処理します。 最後に、外部出力には3つの側面があります。モデル学習センターへのモデルトレーニングデータを参照してください。 データ処理センターの操作プロセスには、主に4つの役割が含まれます。 データアナリストは、すべての主要な側面について知識を持つ必要があります。 ビジネスアナリストとアルゴリズムエンジニアは、主にデータプレゼンテーションに焦点を当てています。 注釈エンジニアは、主にデータアノテーションに関与しています。 モデル学習センター モデル学習センターは、この部分の動作プロセスを上記の図に示します。 ビジネス理解センターからモデルサービスタスク、データ処理センターからのトレーニングデータ、およびオペレーション監視センターからのパフォーマンス修正情報を受け取り、サービス設計を実施します。サービスを設計する際には、いくつのモデルを考慮する必要がありますか?シリーズでモデルを接続する方法は?アルゴリズムライブラリとモデルライブラリに再利用可能なアルゴリズムとモデルはありますか? サービスプロセス設計が完了した後、機能処理が実行されます。 エンコードとトレーニングのためのモデルに機能を入力します。 モデル評価のために、モデルトレーニング結果をモデル追跡関数コンポーネントに入力します。 反復後、最適なトレーニングモデルは操作監視センターに出力され、データ操作はデータ処理センターに出力されます。 操作監視センター オペレーション監視センターはビジネスユーザーに直接関連しており、運用およびメンテナンス担当者はモデルの更新とパフォーマンス監視を担当しています。この部分の動作プロセスは、上の図に示されています。 データ処理センターから生産データを受信し、アクセスインターフェイスを介して出力を処理し、データ処理センターに書き戻します。 モデル学習センターから訓練されたモデルサービスを受け取り、ビジネス理解センターから製品パッケージガイダンスを受け取り、製品サービスをパッケージ化、展開、公開、およびテストします(既存の製品の更新である場合、最初にモデル更新メカニズムを使用して既存のモデルを開始および停止します。 インタラクションデータはアクセスインターフェイスに提供され、アクセスインターフェイスがパフォーマンス監視が見つかった場合、問題が発行され、問題がモデル学習センターに供給されます。 AIミドルプラットフォーム階層アーキテクチャ AIミドルプラットフォームの階層アーキテクチャは、上記の図に示されています。 中央の部分は、上から下までの3つの主要なセクションに分かれています。右側の操作モニタリングは、均一にカプセル化されており、左側の外部アクセスインターフェイスを提供します。 ケース分析 - インテリジェントな投資顧問ロボット
上記の記事は、このセクションの実装ルートの比較的詳細な紹介を提供します。このセクションでは、Yixinの内部インテリジェント投資アドバイザリーロボットの実用的なケースに基づいて、実際のビジネスのインテリジェントなニーズをどのように解決できるかを分析します。 (Smart Investment Advisor Robotは比較的大きなソリューションであるため、ここでは適切に抽象化され、削減されています。) 4.1インテリジェントな投資顧問ロボット Smart Investment Advisorsは、人工知能アルゴリズムを使用して、自動化された資産ポートフォリオの割り当て推奨事項とウェルスマネジメントサービスをオンラインで提供します。たとえば、 CrediteaseのSmart Wealth Management製品であるToumi Raは、ユーザーが科学的資産の配分をインテリジェントな方法で行い、それによって資産管理方法をアップグレードするのに役立ちます。 Smart Investment Advisory Robotsに関与するAIサービスとデータ: チャットボットなどのインテリジェントな相互作用。 顧客ベースを既に持っているカスタマーポートレート。 製品プールを選別し、現在、既存のウェルスマネジメント製品プールから最高のパフォーマンス製品を選択して、当社のウェルスマネジメント製品プールは、各期間でより良いパフォーマンスで選択した製品を自動的に選択できます。 リスク分析は、金融分野でのインテリジェントなアプリケーションとして特に重要です。 資産配分、Yixinは現在、資金、株式、不動産など、多くの種類の資産を持っています。また、これには、包括的な考慮のリスク要因を含む科学的、合理的、定量的分析が必要です。 投資商品が推奨されます。個人情報、リスク分析、資産配分などを参照してください。ユーザー向けの最適化されたリターン製品を推奨するために、ユーザーのポートレートに参照してください。 Intelligent Investment Advisory Robotの特性を理解した後、AI Middleプラットフォームの運用プロセスに基づいて、このケースの実装を詳細に調べます。 4.2ケースの実装 ビジネスの理解 ビジネス理解プロセスでは、最初にビジネスプランがどのように見えるかを考慮する必要がありますか?再利用できますか?再利用可能なソリューションがあると仮定すると、データに直接アクセスできます。新しいソリューションを設計する必要があります。 上の写真の右側にある設計マップに示されているように、データインターフェイスの構成とデータソース/ロール構成を考慮する必要があります。たとえば、ソリューションのデータインターフェイスは何ですか?どのサービスが関係していますか?返す方法は?各構造に関連する文字は何ですか?等 最も重要なことは、どのサービスが再利用可能かを考慮することです。会社内にチャットボットがあると仮定して、顧客を受け取ってスマートチャットの機能を引き受けることができます。上記のサービスはすべて再利用でき、リスク分析サービスとその後の投資製品推奨サービスを新たに構築する必要があります。 再利用可能なサービスと新しく作成されたサービスが明確になった後、各チームは並行して開発でき、これはすぐに次の段階に入り、開発の効率を向上させます。 モデル学習 前の段階の実践を続け、リスク分析サービスの実際のモデル設計とトレーニングを実施します。 ソリューションの設計と設計の入力は、上記の右側の構造に示されていますユーザーポートレートのデータを処理し、モデルに入力するためにここに追加されました。データをマージして出力するために、以下に新しいモデルも作成されます。 このモデルは、視覚的に自動的にトレーニングおよび追跡できます。モデルのオーケストレーションは、 エンジニアに自動的に送信されます。 最適なモデルを選択して、監視センターに公開できます。 操作監視 操作監視は、主にインターフェイス構成を含むサービスとソリューションをカプセル化、テスト、およびリリースします。単一のサービスでテストできます。または、ソリューション全体を一緒にテストできます。 サービスが開始された後、上記の図に示すように、視覚的なサポートと関連する統計レポートを提供することにより、パフォーマンス全体が合理的に監視されます。 データ処理 以前のパーツは、データ処理パーツに関連しています。究極の目標は、モデルトレーニング中のデータへのアクセス、ファイル、データベース、その他のデータストレージシステムなどの中間誘導トレーニングデータをサポートすることです。 上の写真の右側にあるYixinのDBU、Wormhole、Moonbox、Davinciなどのオープンソースツールは、誰もがデータミドルプラットフォームをよりよく構築するのに役立ちます。 要約する
上記のセクションでは、AIミドルプラットフォームの生成の背景、目標、定義、および実装ルートを紹介します。 AIミドルプラットフォームの構築は、既存のテクノロジー、機能、プラットフォームを再利用でき、アジャイルなインテリジェントなビジネスサポートソリューションです。 AIミドルプラットフォームは、データ/ビジネスインテリジェンスの開発の製品であり、手動フローを自動モデルに置き換えて、リソースと人件費を削減します。 AIプラットフォームの機能構築は、データプラットフォーム/ミドルプラットフォームに基づいており、フロントエンドのビジネスニーズに直面し、ビジネスニーズに対応する能力を向上させます。 AIミドルプラットフォームの構築における究極の目標は、テクノロジーを沈殿させ、プロセスを最適化し、リソースを統合し、コストを削減し、この目標を達成することです。 プラットフォームから中央のプラットフォームまで、ビジネスへの段階的な前進は段階的なプロセスであり、一晩で達成することはできません。企業が中和の戦略の実装を実装するための最も重要なことは、サービスの共有、リソースの統合、コストの削減、効率の改善を目的として、ビジネスの現実と特定のR&D条件に基づいてビジネスニーズを満たす中間体系と方法論を確立することです。 Q&A
Q1:AI中央のプラットフォームは、ニーズの重要性を評価するためにどのような次元から必要ですか?多くのビジネスニーズがあり、再利用可能なAIモデルを設計する方法は? A:評価の一部は、ビジネス分析の専門家との合理的な議論を提出する際に、プロジェクトの優先順位を決定するために、需要分析の専門家となります。 AIモデルの再利用可能な設計は、主にビジネスからそれを体験できます。ここでさまざまなレベルから簡単に説明しましょう。言うまでもなく、アルゴリズムレベルは主に単一のモデルの機能的な粒度を考慮しています。モデルが複雑すぎて複雑な機能を使用することをお勧めします。さらに、モデルの機能的普遍性も注意が必要です。サービスレベルの再利用は、比較的簡単に識別し、チャットボット、顧客のリスクコントロールなど、比較的固定された独立したシナリオサービスです。ソリューションはすでに比較的固定された製品であるため、ソリューションレベルの再利用はありません。 Q2:これらのプラットフォームは実装されていますか?ビジネス改善への影響は何ですか? A:それは部分的に実装されており、R&D速度は絶えず改善されており、エンジニアはトラブルがなく、効率が高く、ビジネスを出力するためのよりインテリジェントな製品があります:) Q3:AIミドルプラットフォームは外の世界に出力し、ローカライズされた展開をサポートしていますか? A:AIミドルプラットフォームが成熟した後、ツールの形でいくつかの機能を一般にリリースすることを検討します。 Q4:フロントデスクとミドルデスクに不明確な分業の問題はありますか? A:R&Dプロセスには、フロントデスクがR&D計画を決定する場合、残りのデータ機能とAI機能のデザインとインタラクション管理のみが責任を負います。ビジネスチームの違いは、2つの間にある唯一の人の役割を反映しています。要するに、フロントデスクとミドルデスクの間の分裂は、企業の中期戦略の重要な部分であるだけでなく、組織構造と人事責任で統一する必要があります。 [この記事は、51CTOコラム組織Yixin Technology Collegeのオリジナル記事とWeChat Publicアカウント「Yixin Technology College(ID:CE_TECH)」のオリジナル記事です。 この著者の他の記事を読むにはここをクリックしてください |
<<: AからZまで、人工知能が世界を変える26のキーワード
>>: AIの未来はブロックチェーンの未来とつながっているのでしょうか?
ディープラーニング (DL) は、再帰型ニューラル ネットワーク、長期短期記憶、畳み込みニューラル ...
2 つの正の整数が与えられたら、その最大公約数を求めます。これは、コードを書く学生なら誰でも遭遇した...
人工知能 (AI) はモノのインターネット (IoT) の世界に革命をもたらし、IoT の人工知能 ...
9月22日、IDCコンサルティングの公式WeChatアカウントによると、2023年下半期以降、ますま...
レノボとブラジルのレシフェにある先端研究システムセンター(CESAR)は、聴覚障害者向けに手話を「翻...
無人ドローンや機械学習が一般的になる前、ジェームズ・キャメロンは1984年に自身の夢のプロジェクトで...
敵対的攻撃の概念は、Goodfellowら[6]によって初めて提唱されました。近年、この問題はますま...
2023年も終わりに近づいています。過去1年を振り返ると、ChatGPTの登場が世界的なAIブーム...
この記事では、機械学習に最適なソフトウェアについて説明します。これらのソフトウェアは、ML コードを...
人工知能は、多くの企業にとってコンテンツマーケティングと管理の効率化に大きな役割を果たしています。 ...
COVID-19 パンデミックの影響で、2020 年末までに推定 60% の企業がワークロードをクラ...
11月3日、Google ResearchとDeepMindは最新の気象モデルMetNet-3を共同...
データ品質の低さは、人工知能 (AI) および機械学習 (ML) テクノロジの実際のパフォーマンスを...