テキスト推奨は、推奨システムの応用シナリオとして、商業的に実装されて成功しています。最もよく知られているテキスト推奨システムは、Toutiao のニュース推奨です。 Tencent News や NetEase News などの他のニュースポータルも、テキスト推奨を自社製品の不可欠な部分とみなしています。
テキスト推奨はニュース推奨だけでなく、質問と回答の推奨など他の製品をサポートするためにも使用できます。海外では、テキストレコメンデーションを主な事業としている企業もあります。例えば、大手ウェブサイト向けのテキストレコメンデーションサービスの提供を専門とするOutbrainという会社があります。 次に、テキストレコメンデーションの成功事例を5つ、時系列で見ていきます。 1. Google ニュース推奨システム 2010 年に Jiahui Liu らが発表した論文「クリック行動に基づくパーソナライズされたニュース推奨」は、テキスト推奨の分野における古典的な論文です。著者は、Google ニュースの推奨システムを非常にシンプルな方法で設計しました。システムが採用する方法は、単純な協調フィルタリングと SVD 分解と、ユーザーの個人およびグループの好みに関する履歴統計情報を組み合わせたものです。この方法は、一方では推奨自体の問題を解決し、他方ではニュースにおけるマシュー効果の問題を解決します。 2. ニューヨークタイムズの推薦システム ニューヨーク・タイムズの推奨システムは、プリンストン大学とマイクロソフトの研究者によるテキスト推奨に関する研究から生まれました。 2011 年、Chong Wang らは論文「Collaborative Topic Modeling for Recommending Scientific Articles」で Collaborative Topic Regression モデルを提案しました。このモデルは協調フィルタリングとトピックモデリングを組み合わせたもので、確率グラフモデルを図 1 に示します。 図1. 協調トピック回帰確率グラフモデル 協調トピック回帰とその後の研究開発作業により、ニューヨークタイムズのニュース推奨システムは成功を収めました。 3. Baidu Knows Q&A 推奨システム 2012 年と 2014 年に、Baidu はそれぞれ ACM RecSys と ACM SAC に 2 つの論文を発表し、Baidu Zhidao の質問応答推奨システムの構築方法を説明しました。 Baidu Zhidao の推奨システムは、線形モデルと非線形モデルを組み合わせたハイブリッド モデルを採用し、自然言語処理におけるキーワード抽出などの技術を活用しています。 図2. Baidu Zhidao Q&A推奨システムのアーキテクチャ Baidu Zhidao の質問と回答の推奨システムの鍵となるのは、線形モデルの特徴エンジニアリングと自然言語処理の関連技術です。 4. 協調型ディープラーニング 2015 年、Hao Wang 氏らは、データ マイニングに関するトップ カンファレンスである KDD で、「Collaborative Deep Learning for Recommender Systems」と題する記事を発表しました。著者らは、協調フィルタリングとスタック型ノイズ除去オートエンコーダーを組み合わせて、テキスト推奨のためのハイブリッドモデルを設計しました。混合モデルの確率的グラフィカルモデルを図 2 に示します。 図2. 協調型深層学習のための確率的グラフィカルモデル 5. GRUベースのディープテキストモデル 2016 年、Trapit Bansal らは ACM RecSys カンファレンスで「Ask the GRU: Multi-task Learning for Deep Text Recommendations」と題する論文を発表し、GRU ベースのテキスト推奨モデルを提案しました (図 3 を参照)。 図3. GRUテキスト推奨モデルに基づくディープニューラルネットワーク構造 テキスト推奨は推奨システムの重要な分野です。さまざまな機械学習と自然言語処理技術を使用し、ニュースや質問応答などの分野で広く使用されています。近年のディープラーニングの台頭により、新しい人工知能技術もテキスト推奨の開発に貢献しています。 Toutiaoが成長し発展するにつれ、多くのニュースメディアのウェブサイトもテキスト推奨の重要性を認識するようになり、Baidu、Tencent、NetEaseなどの企業は関連分野への人材と物的資源への投資を増やしています。製品の革新と技術の進歩により、テキスト推奨は私たちの生活にさらなる驚きと利便性をもたらすでしょう。
恒昌立通ビッグデータ部門の責任者である王昊氏は、ユタ大学で修士号を取得しています。百度、新浪、網易、豆瓣などの企業で長年の研究開発と技術管理の経験があり、機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析、コンピューターグラフィックス、視覚化などの技術を得意としています。 TVCG、ASONAMなどの国際会議やジャーナルに5本の論文を発表。彼の学部論文は、IEEE SMI 2008 国際会議で最優秀論文賞を受賞しました。 |
<<: 人工知能ブームの背景にある産業チェーンのレイアウト分析
>>: 人工知能がメディア業界に破壊的変化をもたらし、10の新たな雇用を生み出す
最近、アリババ・タオバオ・テクノロジーと上海交通大学画像通信・ネットワーク工学研究所(IGI)による...
人工知能 (AI) システムは近年急速に普及しており、特に 2023 年には大規模言語モデル (LL...
継続的に学習することで向上していくことは、現代の AI の大きなセールスポイントの 1 つです。しか...
2020年、中国のスマート音声市場規模は113.96億元に達し、前年比19.2%増加した。中国のスマ...
最初のトレンドは、すべてのIT大手がAIクラウドサービスに多額の投資を行うことです。AI-aaS、つ...
Angel は、パラメータ サーバーの概念に基づいた分散型機械学習フレームワークであり、機械学習アル...
人工知能は商業ビルを変革し、エネルギー使用に関してよりスマートなものにしています。周囲に誰もいないと...
[[382785]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...
人工知能 (AI) には、問題を理解し解決する神秘的な力があると考える人もいます。人工知能は人々の日...