WOT2019 検索推奨アルゴリズムフォーラム: さまざまな分野における AI ベースの検索推奨の実用化

6月21日、WOT2019グローバルテクノロジーサミットとグローバル人工知能テクノロジーサミットが北京JWマリオットホテルで盛大に開催されました。このサミットは、人工知能分野の一般的な技術、応用分野、企業のエンパワーメントという3つの主要テーマを中心に展開されます。各テーマには、機械学習の実践、ナレッジグラフ技術、AIスマート製造、スマートセキュリティ、スマートファイナンス、スマートビジネスイノベーション、スマート産業エンパワーメントなどを網羅した4つの特別セッションがあります。合計12の特別セッションと42のトピックが共有され、議論されます。 6月21日午後、総合技術テーマサミットが正式に開幕しました。機械学習の実践、検索推奨アルゴリズム、ナレッジグラフ技術、NLP、音声認識に関する4つの特別セッションが同時に開催されました。10名を超える講師がゲストに素晴らしい技術情報を共有しました。

現在、人工知能をベースにした検索推奨アルゴリズムが徐々に優位になりつつあります。自社のビジネスデータの特性をどのように組み合わせて適切なディープレコメンデーションと検索アルゴリズムを設計するか、また同時にアルゴリズムの安定した動作を確保するための合理的なアーキテクチャを設計するかが、検索レコメンデーションアルゴリズム特別セッションの主な焦点です。 6月21日午後の検索推薦アルゴリズムサブフォーラムでは、第四パラダイムの推薦業務アルゴリズムチームリーダーである程暁成氏、立志FMの推薦システムアーキテクトである荘正中氏、金山西山居ゲームのAI技術専門家である黄紅波氏が、さまざまな応用シーンからさまざまな分野における検索推薦アルゴリズムの実用的応用と実装事例を詳細に解説した。

Cheng Xiaocheng: 最新の推奨システムを構築する上での難しさは何ですか?

フォーラムの最初の講演者として、フォースパラダイムのレコメンデーションビジネスアルゴリズムチームの責任者である程暁成氏が「現代のレコメンデーションシステムを構築する上で克服すべき困難とは」というテーマで基調講演を行いました。彼は、現在のレコメンデーションシステムが、ユーザーの増加、商業的実現、ユーザーエクスペリエンスなど、多様な目標を同時に達成する方法を紹介しました。また、レコメンデーションシステムの各モジュールの開発状況と、各リンクでプロジェクトを実施する際の困難についても詳しく説明しました。

レコメンデーションシステムがビジネス効率を向上できることは、多くの実証があります。コンテンツ閲覧のシナリオでは、レコメンデーションシステムによって製品のトラフィックと収益が大幅に増加したケースが数多くあります。推奨システムが開発され成熟するにつれて、商用アプリケーションでは推奨システムに高い要件が課されるようになりました。

程暁成氏は、レコメンデーションは比較的敷居の高い技術であり、ゼロから始めるのは難しいと述べた。しかし、クラウドサービスによるレコメンデーションシステムは、他の企業がレコメンデーションビジネスを迅速に展開し、コンバージョンと収益を向上させるのに役立つ可能性がある。彼は、より高度なシステムに推奨事項を作成するには、3 つの次元に分割する必要があると考えています。1 つ目は、ビジネス次元からコアアルゴリズムを検討することです。2 つ目は、アルゴリズム次元から目標をどのように達成するかを検討することです。3 つ目は、エンジニアリング実装次元からコアコンテンツが何であるかを検討することです。

続いて、程暁成氏はビジネス用語から始め、レコメンデーションシステムの構築プロセスを詳しく紹介しました。

程暁成氏は、推奨を必要とするシナリオや製品のほとんどは、トラフィック収益化のビジネスモデルにまで遡ることができ、それはトラフィックとビジネス目標の2つの部分に分かれていると述べました。トラフィックの観点からは、何人の人が製品を使用し、どのくらいの期間使用しているかを指します。ビジネス目標の観点からは、トラフィックに基づいてどれだけの収益が生成されるかを指します。程暁成氏は、トラフィック収益化はファネルとして捉えることができると強調した。上位層には大量のデータが必要であり、大量のデータがあって初めて、より早く結果を達成できる。次に、良い製品を作り、ユーザーの行動に基づいて正確なコンテンツをプッシュし、製品エクスペリエンスを向上させ、製品の成長に注力する必要があります。これら 2 つの手順を完了したら、製品の収益化を検討する必要があります。そのためには、有料プロジェクトを最適化し、アルゴリズム機能を広告シナリオにエクスポートして、クリックスルー率やコンバージョン率などを向上させる必要があります。

アルゴリズムの観点から見ると、リコール、モデル化、介入は、最も基本的な 3 段階の推奨プロセスです。推奨とは、ユーザーに適した推奨期間を選択して 1 つの画面に表示することを指します。モデルとは、アルゴリズムエンジニアが業務に基づいて一連のアルゴリズムモデルを確立し、業務ごとに異なるアルゴリズムモデルを使用することを指します。最後に、ビジネスのあらゆる側面に介入を実施する必要があります。

程暁成氏は、成功する推奨システムには、まず測定・定量化できる明確な目標が必要であり、次に推奨される素材が十分に豊富であること、そして最後に製品指標と最適化について一定レベルの理解が必要であると述べた。彼は、方法論的観点から、アルゴリズムは実験科学であるため、最適化のための推奨事項は経験を尊重する必要があることを強調しました。優れたプロジェクトでは、すべてのアイデアは観察によって提案された仮説から生まれ、その仮説に基づいて最適化戦略が考案されます。この戦略が本当に効果的であるかどうかは、最終的に検証する必要があります。したがって、理想的で効率的な環境とは、複数または数十の実験を同時にオンラインで実行できる環境です。

荘正中：Lizhi APPのUGC推奨システムの探索と実践

次に、Lizhi FMの推薦システムの設計者であるZhuang Zhengzhong氏が「Lizhi APPのUGC推薦システムの探求と実践」と題した基調講演を行いました。彼はまず、Lizhi の推奨コンセプトと、コンテンツ理解、ユーザー理解、アルゴリズムモデル、インタラクション設計という 4 つの主要な関心事を紹介しました。次に、Lizhi 推奨システムの主なアーキテクチャ、オーディオ推奨システムの構築で遭遇した困難と対処戦略、オーディオコンテンツの特徴を抽出して新しいサウンドを発見するメカニズムを紹介しました。

荘正中氏は、音声をコミュニケーションの媒体とするUGCプラットフォームとして、同社はプラットフォーム推奨の概念を3つの側面から理解していると述べた。1つはユーザーに世界を聞かせること、2つ目はユーザーの声の才能を発見すること、3つ目はユーザーがより簡単に声を表現できるようにすることだ。ユーザーが世界の音を聞くのを助けるという例を挙げると、実際にはユーザーとコンテンツの間に接続を確立することです。推奨システムはポイントツーポイントのグラフとして、ユーザーはノードとして見ることができます。推奨システムが行う必要があるのは、より多くのユーザーノードをより多くのコンテンツノードに接続し、同時にユーザーノードがオーディエンスを生成できるようにして、ノードの数とノード間の長さを増やすことです。このプロセスでは、推奨アルゴリズムは推奨システムの中間のリンクとなります。

声優の発掘に関しては、ユーザーがプラットフォームを利用して自分自身や自分の才能を披露できるようにすることが重要です。毎日多くの新規ユーザーが生成されるため、リソースの割り当てとユーザーのニーズの問題を解決する必要があります。したがって、推奨アルゴリズムは、プラットフォーム全体のメリットを最大化するために、固定リソースを最も合理的な方法で割り当てる必要があります。これがアルゴリズムが行うことです。

その後、荘正中は、理志の実践のいくつかを組み合わせ、オーディオ処理、新しいアプリケーションの探索、音の価値の発見という 3 つの側面から、理志が推奨したいくつかの実践と経験を深く解釈しました。アルゴリズムの面では、Lizhi はロングテールの新しいコンテンツをより公平に発見できるようにすることに注力していると彼は述べた。多くの推奨アルゴリズムはロングテール機能が貧弱で、ヒート効果が強いため、システムのマシュー効果が継続的に強化され、トップアンカーに大きく依存することになるからだ。そのため、コンテンツには動的な重み付けが提案されている。コンテンツの理解と新しいコンテンツの発見に関しては、まずさまざまなアルゴリズムを使用して音声認識を実行し、次にコンテンツを分類し、検索を容易にするためにさまざまなキーワードを設定します。最後に、コンテンツを再定義して、どのようなシナリオやオーディエンスに適しているかを判断します。

荘正中氏によると、Lizhiは2つのシステムを使用して新しいコンテンツの品質を分析します。1つはホストの価値システムです。すべてのユーザーの行動フィードバックはホストに反映され、ホストを評価します。2つ目はファンネルモデルを作成し、ファンネルモデルを作成して、ファンネルモデルを使用してファンネルモデルを作成し、ファンネルモデルを使用して ...

Lizhi の発見システム (つまり推奨システム) は、まずコンテンツ分析とトラフィックテストを実行し、次に異なるトラフィックテストチャネルを構成することによってさまざまなエンジンに公開し、各エンジンが同時にアルゴリズムを提供すると理解されています。アルゴリズムの品質を判断する指標は 2 つあります。1 つは CTR が平均値に達しているかどうか、もう 1 つはコンテンツを評価することです。もちろん、これらはすべてデータ分析によってサポートされているため、データのリアルタイム性が保証されるかどうか、目的のデータが収集できるかどうか、データの正確性が保証されるかどうかはすべて、コンテンツベースの推奨アルゴリズムに基づいています。

最後に、荘正中氏は、新しいプログラムの制作過程からレコメンデーションアルゴリズムの実装プロセスを詳細に紹介し、強化学習を使用してユーザーの興味の探索に対処するExplore＆Exploitアルゴリズム、ロングテールリコールにDSSMを使用する試み、パラメータ次元削減を伴うFFMソートアルゴリズム、製品操作戦略+機械学習の融合モデルソートなど、いくつかの典型的なレコメンデーション戦略の紹介に焦点を当てました。荘正中氏は、推薦システムの最終的な目標はアンカーに希望を感じさせ、ユーザーが新しいコンテンツを発見できるようにすることであり、最終的にはコンテンツの品質とシステムの多様性を測定し、それがLizhi推薦システムの公平性の指標となると述べた。

黄紅波：「建王3プッシュコラム」プロジェクトにおける推薦システムの実装

フィナーレのゲストスピーカーとして、金山西山居ゲームズのAI技術専門家である黄紅波氏が、「Jian Wang 3 Promotion」プロジェクトにおける推奨システムの実装経験を共有しました。同氏は、ゲームエンターテインメントもレコメンデーションシステムの重要な応用シーンの一つであると語った。「Jian Wang 3プロモーションコラム」は「Jian Wang 3」プレイヤーが好むエンターテインメントの集いの場であり、公式情報、興味深いコンテンツ、プレイヤーのソーシャルインタラクション、クリエイティブ分析、専門ツール、ゲームビデオと補助ツールを統合し、リアルタイムの専門競技データを提供する、ゲームの相互運用性のためのソーシャルサービスAPPである。

黄紅波氏は、特徴選択、オフライン計算、オンライン予測の3つの段階に焦点を当て、各個人にパーソナライズされたメッセージ推奨を行う方法を共有しました。彼は、「Jian Wang 3 Push Column」プロジェクトの実装経験を組み合わせ、推奨システムのアーキテクチャとプロセスを詳細に説明し、さまざまな一般的な問題と解決策をまとめました。

「Jian Wang 3 推薦コラム」の推薦システム構築プロセスは、ユーザーが AI インタラクティブインターフェースに入った後、クリックやコメントごとにユーザーの行動が記録され、オンラインとオフラインの行動を含め、ユーザーの行動がデータセンターに保存され、データの保存と統合が行われます。その後、オンラインとオフラインのデータが一連の専門アルゴリズムを通じて計算され、最後に計算結果が並べ替えられます。黄紅波氏は、プッシュ列推奨システムのアーキテクチャは、マルチモデル共同スコア正規化戦略に従うと述べた。序文によれば、正規化とは、すべての値を同じ間隔に圧縮し、データが同じ比較可能な間隔で比較されるようにし、逆の順序で並べ替えて、最終結果を取得することを意味します。

プッシュコラム推薦システム構築プロセスを通じて、Jian Wang 3のクリック率は53％増加し、閲覧率は11％増加し、いいね数は15％に達し、コメント数は4％に達し、コレクション数は22％に達しました。

黄鴻波氏はスピーチの最後に、不均一なリコール結果の問題と解決策を共有することに焦点を当てました。リコール結果の不均衡は、主にリコールが多すぎることとリコールが少なすぎることによるものだと彼は述べた。「Jian Wang 3 Push Column」の解決戦略は、マルチモデルの組み合わせを使用することです。各モデルにはデータレベルの結果があり、データレベルの結果の交差クリック率は比較的高いため、マルチモデルの組み合わせスコア正規化戦略を通じて並べ替えと補充を行うことができます。リコールが多すぎる場合は、スコアに応じて後ろから前に向かって削除することができます。リコール数が少なすぎる場合、根本的な原因はモデルの品質にあります。この場合、リコールアルゴリズムを増やしてパラメータを拡張し、増分ディメンションなどを使用してリコールアルゴリズムを小さいものから大きいものに増やし、リコール数を補充してから、ソート戦略を使用してソートし、目的の結果を得ることができます。

<<: 教育を強化するための人工知能の新たな方向性とは?

>>: GAN は教師なし表現学習に使われており、その効果は今でも驚くべきものです...