WOT2019 検索推奨アルゴリズムフォーラム: さまざまな分野における AI ベースの検索推奨の実用化

WOT2019 検索推奨アルゴリズムフォーラム: さまざまな分野における AI ベースの検索推奨の実用化

6月21日、WOT2019グローバルテクノロジーサミットとグローバル人工知能テクノロジーサミットが北京JWマリオットホテルで盛大に開催されました。このサミットは、人工知能分野の一般的な技術、応用分野、企業のエンパワーメントという3つの主要テーマを中心に展開されます。各テーマには、機械学習の実践、ナレッジグラフ技術、AIスマート製造、スマートセキュリティ、スマートファイナンス、スマートビジネスイノベーション、スマート産業エンパワーメントなどを網羅した4つの特別セッションがあります。合計12の特別セッションと42のトピックが共有され、議論されます。 6月21日午後、総合技術テーマサミットが正式に開幕しました。機械学習の実践、検索推奨アルゴリズム、ナレッジグラフ技術、NLP、音声認識に関する4つの特別セッションが同時に開催されました。10名を超える講師がゲストに素晴らしい技術情報を共有しました。

現在、人工知能をベースにした検索推奨アルゴリズムが徐々に優位になりつつあります。自社のビジネスデータの特性をどのように組み合わせて適切なディープレコメンデーションと検索アルゴリズムを設計するか、また同時にアルゴリズムの安定した動作を確保するための合理的なアーキテクチャを設計するかが、検索レコメンデーションアルゴリズム特別セッションの主な焦点です。 6月21日午後の検索推薦アルゴリズムサブフォーラムでは、第四パラダイムの推薦業務アルゴリズムチームリーダーである程暁成氏、立志FMの推薦システムアーキテクトである荘正中氏、金山西山居ゲームのAI技術専門家である黄紅波氏が、さまざまな応用シーンからさまざまな分野における検索推薦アルゴリズムの実用的応用と実装事例を詳細に解説した。

Cheng Xiaocheng: 最新の推奨システムを構築する上での難しさは何ですか?

フォーラムの最初の講演者として、フォースパラダイムのレコメンデーションビジネスアルゴリズムチームの責任者である程暁成氏が「現代のレコメンデーションシステムを構築する上で克服すべき困難とは」というテーマで基調講演を行いました。彼は、現在のレコメンデーションシステムが、ユーザーの増加、商業的実現、ユーザーエクスペリエンスなど、多様な目標を同時に達成する方法を紹介しました。また、レコメンデーションシステムの各モジュールの開発状況と、各リンクでプロジェクトを実施する際の困難についても詳しく説明しました。

レコメンデーション システムがビジネス効率を向上できることは、多くの実証があります。コンテンツ閲覧のシナリオでは、レコメンデーション システムによって製品のトラフィックと収益が大幅に増加したケースが数多くあります。推奨システムが開発され成熟するにつれて、商用アプリケーションでは推奨システムに高い要件が課されるようになりました。

程暁成氏は、レコメンデーションは比較的敷居の高い技術であり、ゼロから始めるのは難しいと述べた。しかし、クラウドサービスによるレコメンデーションシステムは、他の企業がレコメンデーションビジネスを迅速に展開し、コンバージョンと収益を向上させるのに役立つ可能性がある。彼は、より高度なシステムに推奨事項を作成するには、3 つの次元に分割する必要があると考えています。1 つ目は、ビジネス次元からコア アルゴリズムを検討することです。2 つ目は、アルゴリズム次元から目標をどのように達成するかを検討することです。3 つ目は、エンジニアリング実装次元からコア コンテンツが何であるかを検討することです。

続いて、程暁成氏はビジネス用語から始め、レコメンデーションシステムの構築プロセスを詳しく紹介しました。

程暁成氏は、推奨を必要とするシナリオや製品のほとんどは、トラフィック収益化のビジネスモデルにまで遡ることができ、それはトラフィックとビジネス目標の2つの部分に分かれていると述べました。トラフィックの観点からは、何人の人が製品を使用し、どのくらいの期間使用しているかを指します。ビジネス目標の観点からは、トラフィックに基づいてどれだけの収益が生成されるかを指します。程暁成氏は、トラフィック収益化はファネルとして捉えることができると強調した。上位層には大量のデータが必要であり、大量のデータがあって初めて、より早く結果を達成できる。次に、良い製品を作り、ユーザーの行動に基づいて正確なコンテンツをプッシュし、製品エクスペリエンスを向上させ、製品の成長に注力する必要があります。これら 2 つの手順を完了したら、製品の収益化を検討する必要があります。そのためには、有料プロジェクトを最適化し、アルゴリズム機能を広告シナリオにエクスポートして、クリックスルー率やコンバージョン率などを向上させる必要があります。

アルゴリズムの観点から見ると、リコール、モデル化、介入は、最も基本的な 3 段階の推奨プロセスです。推奨とは、ユーザーに適した推奨期間を選択して 1 つの画面に表示することを指します。モデルとは、アルゴリズム エンジニアが業務に基づいて一連のアルゴリズム モデルを確立し、業務ごとに異なるアルゴリズム モデルを使用することを指します。最後に、ビジネスのあらゆる側面に介入を実施する必要があります。

程暁成氏は、成功する推奨システムには、まず測定・定量化できる明確な目標が必要であり、次に推奨される素材が十分に豊富であること、そして最後に製品指標と最適化について一定レベルの理解が必要であると述べた。彼は、方法論的観点から、アルゴリズムは実験科学であるため、最適化のための推奨事項は経験を尊重する必要があることを強調しました。優れたプロジェクトでは、すべてのアイデアは観察によって提案された仮説から生まれ、その仮説に基づいて最適化戦略が考案されます。この戦略が本当に効果的であるかどうかは、最終的に検証する必要があります。したがって、理想的で効率的な環境とは、複数または数十の実験を同時にオンラインで実行できる環境です。

荘正中:Lizhi APPのUGC推奨システムの探索と実践

次に、Lizhi FMの推薦システムの設計者であるZhuang Zhengzhong氏が「Lizhi APPのUGC推薦システムの探求と実践」と題した基調講演を行いました。彼はまず、Lizhi の推奨コンセプトと、コンテンツ理解、ユーザー理解、アルゴ​​リズム モデル、インタラクション設計という 4 つの主要な関心事を紹介しました。次に、Lizhi 推奨システムの主なアーキテクチャ、オーディオ推奨システムの構築で遭遇した困難と対処戦略、オーディオ コンテンツの特徴を抽出して新しいサウンドを発見するメカニズムを紹介しました。

荘正中氏は、音声をコミュニケーションの媒体とするUGCプラットフォームとして、同社はプラットフォーム推奨の概念を3つの側面から理解していると述べた。1つはユーザーに世界を聞かせること、2つ目はユーザーの声の才能を発見すること、3つ目はユーザーがより簡単に声を表現できるようにすることだ。ユーザーが世界の音を聞くのを助けるという例を挙げると、実際にはユーザーとコンテンツの間に接続を確立することです。推奨システムはポイントツーポイントのグラフとして、ユーザーはノードとして見ることができます。推奨システムが行う必要があるのは、より多くのユーザーノードをより多くのコンテンツノードに接続し、同時にユーザーノードがオーディエンスを生成できるようにして、ノードの数とノード間の長さを増やすことです。このプロセスでは、推奨アルゴリズムは推奨システムの中間のリンクとなります。

声優の発掘に関しては、ユーザーがプラットフォームを利用して自分自身や自分の才能を披露できるようにすることが重要です。毎日多くの新規ユーザーが生成されるため、リソースの割り当てとユーザーのニーズの問題を解決する必要があります。したがって、推奨アルゴリズムは、プラットフォーム全体のメリットを最大化するために、固定リソースを最も合理的な方法で割り当てる必要があります。これがアルゴリズムが行うことです。

その後、荘正中は、理志の実践のいくつかを組み合わせ、オーディオ処理、新しいアプリケーションの探索、音の価値の発見という 3 つの側面から、理志が推奨したいくつかの実践と経験を深く解釈しました。アルゴリズムの面では、Lizhi はロングテールの新しいコンテンツをより公平に発見できるようにすることに注力していると彼は述べた。多くの推奨アルゴリズムはロングテール機能が貧弱で、ヒート効果が強いため、システムのマシュー効果が継続的に強化され、トップアンカーに大きく依存することになるからだ。そのため、コンテンツには動的な重み付けが提案されている。コンテンツの理解と新しいコンテンツの発見に関しては、まずさまざまなアルゴリズムを使用して音声認識を実行し、次にコンテンツを分類し、検索を容易にするためにさまざまなキーワードを設定します。最後に、コンテンツを再定義して、どのようなシナリオやオーディエンスに適しているかを判断します。

荘正中氏によると、Lizhiは2つのシステムを使用して新しいコンテンツの品質を分析します。1つはホストの価値システムです。すべてのユーザーの行動フィードバックはホストに反映され、ホストを評価します。2つ目はファンネルモデルを作成し、ファンネルモデルを作成して、ファンネルモデルを使用してファンネルモデルを作成し、ファンネルモデルを使用して ...

Lizhi の発見システム (つまり推奨システム) は、まずコンテンツ分析とトラフィック テストを実行し、次に異なるトラフィック テスト チャネルを構成することによってさまざまなエンジンに公開し、各エンジンが同時にアルゴリズムを提供すると理解されています。アルゴリズムの品質を判断する指標は 2 つあります。1 つは CTR が平均値に達しているかどうか、もう 1 つはコンテンツを評価することです。もちろん、これらはすべてデータ分析によってサポートされているため、データのリアルタイム性が保証されるかどうか、目的のデータが収集できるかどうか、データの正確性が保証されるかどうかはすべて、コンテンツベースの推奨アルゴリズムに基づいています。

最後に、荘正中氏は、新しいプログラムの制作過程からレコメンデーションアルゴリズムの実装プロセスを詳細に紹介し、強化学習を使用してユーザーの興味の探索に対処するExplore&Exploitアルゴリズム、ロングテールリコールにDSSMを使用する試み、パラメータ次元削減を伴うFFMソートアルゴリズム、製品操作戦略+機械学習の融合モデルソートなど、いくつかの典型的なレコメンデーション戦略の紹介に焦点を当てました。荘正中氏は、推薦システムの最終的な目標はアンカーに希望を感じさせ、ユーザーが新しいコンテンツを発見できるようにすることであり、最終的にはコンテンツの品質とシステムの多様性を測定し、それがLizhi推薦システムの公平性の指標となると述べた。

黄紅波:「建王3プッシュコラム」プロジェクトにおける推薦システムの実装

フィナーレのゲストスピーカーとして、金山西山居ゲームズのAI技術専門家である黄紅波氏が、「Jian Wang 3 Promotion」プロジェクトにおける推奨システムの実装経験を共有しました。同氏は、ゲームエンターテインメントもレコメンデーションシステムの重要な応用シーンの一つであると語った。「Jian Wang 3プロモーションコラム」は「Jian Wang 3」プレイヤーが好むエンターテインメントの集いの場であり、公式情報、興味深いコンテンツ、プレイヤーのソーシャルインタラクション、クリエイティブ分析、専門ツール、ゲームビデオと補助ツールを統合し、リアルタイムの専門競技データを提供する、ゲームの相互運用性のためのソーシャルサービスAPPである。

黄紅波氏は、特徴選択、オフライン計算、オンライン予測の3つの段階に焦点を当て、各個人にパーソナライズされたメッセージ推奨を行う方法を共有しました。彼は、「Jian Wang 3 Push Column」プロジェクトの実装経験を組み合わせ、推奨システムのアーキテクチャとプロセスを詳細に説明し、さまざまな一般的な問題と解決策をまとめました。

「Jian Wang 3 推薦コラム」の推薦システム構築プロセスは、ユーザーが AI インタラクティブ インターフェースに入った後、クリックやコメントごとにユーザーの行動が記録され、オンラインとオフラインの行動を含め、ユーザーの行動がデータ センターに保存され、データの保存と統合が行われます。その後、オンラインとオフラインのデータが一連の専門アルゴリズムを通じて計算され、最後に計算結果が並べ替えられます。黄紅波氏は、プッシュ列推奨システムのアーキテクチャは、マルチモデル共同スコア正規化戦略に従うと述べた。序文によれば、正規化とは、すべての値を同じ間隔に圧縮し、データが同じ比較可能な間隔で比較されるようにし、逆の順序で並べ替えて、最終結果を取得することを意味します。

プッシュコラム推薦システム構築プロセスを通じて、Jian Wang 3のクリック率は53%増加し、閲覧率は11%増加し、いいね数は15%に達し、コメント数は4%に達し、コレクション数は22%に達しました。

黄鴻波氏はスピーチの最後に、不均一なリコール結果の問題と解決策を共有することに焦点を当てました。リコール結果の不均衡は、主にリコールが多すぎることとリコールが少なすぎることによるものだと彼は述べた。「Jian Wang 3 Push Column」の解決戦略は、マルチモデルの組み合わせを使用することです。各モデルにはデータレベルの結果があり、データレベルの結果の交差クリック率は比較的高いため、マルチモデルの組み合わせスコア正規化戦略を通じて並べ替えと補充を行うことができます。リコールが多すぎる場合は、スコアに応じて後ろから前に向かって削除することができます。リコール数が少なすぎる場合、根本的な原因はモデルの品質にあります。この場合、リコールアルゴリズムを増やしてパラメータを拡張し、増分ディメンションなどを使用してリコールアルゴリズムを小さいものから大きいものに増やし、リコール数を補充してから、ソート戦略を使用してソートし、目的の結果を得ることができます。

<<:  教育を強化するための人工知能の新たな方向性とは?

>>:  GAN は教師なし表現学習に使われており、その効果は今でも驚くべきものです...

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「トランスフォーマー チャレンジャー」マンバはMacBookでも動く! GitHub は半日で 500 以上のスターを獲得しました

「トランスフォーマーの挑戦者」MambaがMacBookで実行できるようになりました!誰かが Git...

SaaSベースのAIトレーニングがゲームチェンジャーとなる理由

機械学習アプリケーションが増加するにつれて、多くの人が機械学習トレーニング データを使用する利点を理...

構造化データのためのテキスト生成技術の研究

1. テキスト生成入門まず、現段階で人気のテキスト生成について紹介します。 1.人工知能の発展段階人...

機械学習を実装するには?

機械学習の実装は、AI を活用した製品やサービスの成功にとって重要なステップです。 MLOps が企...

2018 年後半のディープラーニング プロジェクトをお見逃しなく!

[[252582]]ビッグデータダイジェスト制作翻訳者:fuma、Ni Ni、Jiang Baos...

AI を活用した検索と推奨はどれほど強力でしょうか?

著者 | ユン・チャオユーザーと情報の間には、検索か推奨のいずれかが存在します。百度の執行副社長であ...

人間をより人間らしくし、機械に触覚を与えましょう!電子皮膚の専門家4人の最新の成果のレビュー

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

HanSight 万小川: 国内のセキュリティベンダーはセキュリティ人工知能を推進すべき

[51CTO.com より引用] RSA カンファレンスは、世界の IT セキュリティ動向のバロメー...

...

マスク氏は、将来は人間よりもロボットの数が多くなると述べ、テスラは自動運転技術を共有する用意があると述べた。

7月6日、本日開幕した世界人工知能会議で、マスク氏は会議に直接出席しなかったものの、インターネット...

チューリング賞受賞者のヤン・ルカン氏:今後数十年間の AI 研究の最大の課題は「予測世界モデル」

ディープラーニングの大規模な応用の後、人々はさらなる技術的進歩をもたらすことができる真の汎用人工知能...

グラフィカルな説明 | Linux メモリリサイクル LRU アルゴリズム

[[421791]]メモリは、オペレーティング システムにとって非常に重要なリソースです。オペレーテ...

2Dラベルのみを使用してマルチビュー3D占有モデルをトレーニングするための新しいパラダイム

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...