転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

この記事では、主にクロスドメインの推奨事項について詳しく紹介します。内容は以下のとおりですが、これらに限定されません。

  • 転移学習

  • クロスドメイン推奨

  • クロスドメインレコメンデーションのやり方

    • その他のコールドスタート方法

  • 参照できる論文は何ですか?

1. 転移学習

以下の内容は、[推奨システムにおけるマルチタスク学習 - Lu Mingdong]を参考に修正して紹介したものです。詳細については、https://lumingdong.cn/multi-task-learning-in-recommendation-system.html をご覧ください。

1.1 転移学習の概要

転移学習(TL)は機械学習の研究分野です。既存の問題に対するソリューション モデルを保存し、それを他の異なるが関連する問題に活用することに重点を置いています。たとえば、自動車を識別するために使用される知識 (またはモデル) は、トラックを識別する能力を向上させるためにも使用できます。

ML 対 TL

転移学習は、これらの孤立した学習方法を解決するために設計されています。転移学習では、以前にトレーニングされたモデルの知識 (特徴、重みなど) を使用して新しいモデルをトレーニングしたり、他のタスクから取得した知識を実装して関連する問題を解決したり、データが少ない新しいタスクなどの問題を解決したりすることもできます。

1.2 転移学習はどのような問題を解決できますか?

  • ビッグデータとラベルの少なさの矛盾: データは大量にあるものの、その多くはラベルが付いていません。これらのデータには教師なしモデルを適用するのがベストですが、教師ありモデルを使用する場合はあまり使いやすくありません。手動でラベル付けすると、時間がかかり、労力がかかります。

  • ビッグデータと弱いコンピューティングの矛盾: 一般の人々は膨大な量のデータとコンピューティング リソースを所有することはできません。したがって、タスクを完了するには、画像認識でトレーニング済みのモデルを微調整するなどのモデル移行を使用する必要があります。

  • 普遍的なモデルとパーソナライズされたニーズとの矛盾: 同じタスクであっても、特定のプライバシー設定など、モデルがすべての人のパーソナライズされたニーズを満たすことは難しいことがよくあります。これには、さまざまな人々の間でモデルを適応させることが必要です。

  • 特定のアプリケーションの要件(コールドスタートなど)

転移学習にはさらに 3 つの重要な問題があります。

  • 何を転送するか: 転送する事前知識をどのように選択するか。すべてのソース ドメインをターゲット ドメインに転送できるわけではありません。たとえば、テキスト分類の経験的知識を画像分類に転送することは明らかに不適切です。したがって、転送するソース ドメインとターゲット ドメインを選択するときは、2 つが関連しているかどうか、つまりユーザーであるかアイテムであるかを判断する必要があります。

  • いつ転送するか: いつ転送でき、いつ転送できないか?場合によっては、知識の移転は知識の向上よりも悪い結果になることがあります (「ネガティブな移転」とも呼ばれる問題)。私たちの目標は、転移学習を通じて対象タスクのパフォーマンスや結果を向上させることであり、低下させることではありません。 (ネガティブな転嫁は避けましょう)

  • 転移方法: 転移学習を実行するにはどうすればよいでしょうか?ドメインやタスク間で知識を実際的に移転する方法を特定する必要があります。問題は、既存のアルゴリズムやさまざまな技術をどのように改善するか(移行方法を設計する)である。

1.3 転移学習の基本概念

転移学習には、ドメインとタスクという 2 つの非常に重要な概念があります。

ドメイン:学習の主体となるデータの特徴と特徴分布

  • ソースドメイン: 既存の知識のドメイン

  • 対象ドメイン: 学習するドメイン

タスク:目的関数と学習の結果である学習結果から構成されます。

ドメインに応じて、次の 2 つのシナリオが考えられます。

  • 異なる特徴空間

    たとえば、テキスト分類タスクでは、中国語テキストと英語テキストの特徴空間は異なります。

    画像認識タスクでは、顔画像と鳥の画像の特徴空間は異なる

  • 周辺確率分布は異なる

    たとえば、テキスト分類タスクでは、テキストはすべて中国語の特徴空間にありますが、政治やエンターテイメントなど、さまざまなトピックについて議論しています。

    画像認識タスクでは、画像はすべて鳥の特徴空間ですが、1 つは街中で撮影された鳥であり、もう 1 つは自然の中で撮影された鳥です。

タスクに応じて、次の 2 つのシナリオが考えられます。

  • 異なるラベルスペース

    たとえば、テキスト分類タスクでは、1 つのラベルはニュース カテゴリ ラベルであり、もう 1 つのラベルはテキスト センチメント ラベルです。

    顔認識タスクでは、1 つのラベルは性別、もう 1 つのラベルは名前です。

  • 条件付き確率は異なる

    たとえば、ソース データ カテゴリとターゲット データ カテゴリが不均等に分散されています。この状況は非常に一般的であり、オーバーサンプリング、アンダーサンプリング、SMOTE などの方法で対処できます。

    一般に、異なるラベルは異なる条件付き確率分布をもたらします。これは、2 つの異なるタスクが異なるラベル空間を持ちながら、まったく同じ条件付き確率分布を持つことはまれであるためです。

いくつかの論文では、ドメインとタスクを 1 つのデータセットに組み合わせています。クロスデータセットは、ドメインまたはタスクを指します。

1.4 転移学習の分類

特徴空間別

  • 同質TL: ソースドメインとターゲットドメインの特徴空間は同じである

  • 異種転移学習(TL):ソースドメインとターゲットドメインの特徴空間が異なる

移行シナリオ別

移行シナリオ別

上の図を参照すると、転移学習の方法は、使用される従来の機械学習アルゴリズムに応じて次のカテゴリに分類できます。

  • 帰納的転移学習: このシナリオでは、ソース ドメインとターゲット ドメインは同じですが、ソース タスクとターゲット タスクは互いに異なります。このアルゴリズムは、ソース ドメインからの帰納的バイアスを活用して、ターゲット タスクの改善に役立てようとします。ソースドメインにラベル付きデータが含まれているかどうかに応じて、帰納的転移学習は、マルチタスク学習自己学習に似た 2 種類の方法にさらに分けられます。

  • トランスダクティブ転移学習: ソースドメインとターゲットドメインは異なりますが、学習タスクは同じです。このシナリオでは、ソース タスクとターゲット タスクの間にいくつかの類似点がありますが、対応するドメインは異なります。通常、ソース ドメインにはラベル付けされたデータが多数ありますが、ターゲット ドメインにはラベル付けされたデータが存在しません。トランスダクティブ転移学習は、特徴空間や周辺確率の設定に応じて、さらにいくつかのサブカテゴリに分類できます。

  • 教師なし転移学習: ソース ドメインとターゲット ドメインの両方にラベルがありません。このシナリオは、ターゲット ドメイン内の教師なしタスクに重点を置いた帰納的転移学習に似ています。

次の表は、さまざまなシナリオと分野での上記の転移学習戦略の比較をまとめたものです。

さまざまなシナリオと分野における転移学習戦略の比較

移行内容別:

  • インスタンス転送: 一般的に、理想的なシナリオは、ソース ドメインの知識をターゲット タスクで再利用できることです。しかし、ほとんどの場合、ソース ドメイン データを直接再利用することはできません。ただし、ソース ドメインの一部のインスタンスをターゲット データで再利用すると、結果が改善されます。帰納的転移については、Dai 氏とその協力者による AdaBoost の改善作業のように、ソース ドメインのトレーニング例を使用してターゲット タスクを改善する研究がいくつか行われています。

  • 特徴表現転送: このタイプの方法は、ソース ドメインからターゲット ドメインに適用できる適切な特徴表現を識別することにより、ドメインの違いを最小限に抑え、エラー率を下げることを目的としています。ラベル付きデータの可用性に応じて、特徴表現ベースの転送では教師あり学習または教師なし学習を使用できます。

  • パラメータ転送: このタイプの方法は、関連するタスクのモデルがいくつかのパラメータまたはハイパーパラメータの事前分布を共有するという仮定に基づいています。ソースタスクとターゲットタスクの両方を同時に学習するマルチタスク学習とは異なり、転移学習では、ターゲットドメインに追加の重みを適用して全体的なパフォーマンスを向上させることができます。

  • リレーショナル知識転送: 前の 3 つの方法とは異なり、リレーショナル知識転送は、非独立かつ同一に分散された (iid) データ、つまり各データ ポイントが他のデータ ポイントと関連しているデータを処理することを目的としています。たとえば、ソーシャル ネットワーク データには、関係知識に基づく転移学習技術が必要です。

次の表は、さまざまな移行コンテンツの分類とさまざまな移行学習戦略の関係を明確にまとめたものです。

異なる転移コンテンツの分類と異なる転移学習戦略の関係

さて、以上が転移学習の紹介です。これを読めば、きっと自分なりの理解が得られると思います。

2. クロスドメイン推奨

では、クロスドメイン推奨とは何でしょうか?一言でまとめると、転移学習を推奨システムに適用すると、クロスドメイン推奨と呼ばれます。

クロスドメイン紹介の目的は、一般的に次のとおりです。

  • コールド スタート: たとえば、ある企業には、ユーザー グループが大きく重複しているが、項目が異なる 2 つの APP ビジネスがあります。ビジネス A のユーザーが初めてビジネス B にアクセスしたとき、リテンション率とコンバージョン率を向上させる効果的な推奨を行うにはどうすればよいでしょうか。クロスドメイン推奨は、コールド スタートに新しいアイデアを提供しますが、非常に制限があります。企業が 1 つのビジネスしか持っていないシナリオに適用するのは困難です。

  • 情報の繭から抜け出す: 同じビジネスに基づく推奨は、すべてユーザーの行動に基づいてマイニングされるため、ユーザーの興味を狭めることがよくあります。クロスドメインの推奨を使用すると、元の快適ゾーンから抜け出すことができ、推奨システムのバランス、多様性、新規性が向上します。

  • データのスパース性を減らし、精度を向上: これも 2 つの異なるビジネス シナリオに当てはまります。新規ビジネスまたはいずれかのビジネスでは、何らかの理由でデータが比較的スパースです。クロスドメインの推奨事項を導入することで、データが充実します。

  • ユーザーの好みを強化する: 新規ユーザーの好みは弱いため、クロスドメインの推奨を使用してユーザーの好みを強化できます。

3. クロスドメインレコメンデーションのやり方

3.1 頻繁なパターンマイニングに基づく

ドメイン A とドメイン B でのユーザーの共起行動を取得し、共起ペア <itemA、itemB> を構築し、共起数が特定の値より大きい場合は有効であるとみなします。最後に、ドメイン A のアイテムに「類似」するドメイン B のアイテムのリストを取得できます。

または、itemA と itemB の相関関係を計算する場合、計算式は次のようになります。

で:

  • はアイテムの共起数、はアイテムに対してアクションを起こしたユーザーの数、はアイテムに対してアクションを起こしたユーザーの数です

  • ユーザーの総数を示します

3.2 クラスターの人気

  • ドメイン A アイテムの埋め込みを取得します。userID の埋め込みベクトルは、ユーザーの最近の行動のアイテム シーケンスを平均化することによって取得されます。

  • ドメイン A 内のユーザーをクラスター化し、各クラスター内で最も人気のあるユーザーを取得します。

  • ユーザーがドメインBにアクセスすると、人気のある

クラスタリングには必ずしも埋め込みは必要なく、属性に基づいて実行することもできます。

3.3 属性ラベルベースのマッピング

ユーザー アクセス シーケンスでソース ドメインとターゲット ドメインの属性ラベルが共存することによって属性マッピングを構築するには、次の 2 つの方法があります。

  • 統計的手法に基づいてソースドメイン属性とターゲットドメイン属性間の相関関係を計算する

  • word2vecは、属性シーケンスを通じて属性埋め込みを生成します。

例えば、ユーザーの属性クリックシーケンスデータは

  • ユーザー1: cate1、cate2、cate2、tag1、cate2、tag2、...

  • ユーザー1: cate3、cate4、tag1、cate2、tag3、...

統計的手法に基づく計算

分子に(cate1, tag1)(cate2, tag2)(cate3, tag1)...を含むユーザーの数を数えます。

分母にcate1、cate2、...、tag1、tag2を含むユーザーの数を数え、相関関係を計算します。

Word2vecベースのアプローチ

word2vecとskip-gramを元にセッションを日ごとに分け、cateとtagの埋め込みを計算します。

3.4 FMに基づく

論文を参照できます: 2014_Cross-Domain Collaborative Filtering with Factorization Machines

その原理と実際の応用を紹介する別の記事が後日公開されます。フォロー大歓迎!

3.5 潜在因子マッピング

参考論文: クロスドメイン推奨: 埋め込みとマッピングのアプローチ

  • ソースドメインとターゲットドメインのユーザーとアイテムの埋め込みをそれぞれ構築する

  • ソースドメインとターゲットドメインのユーザー埋め込みのマッピング関数fを構築する

  • マッピング関数fを使用して、ソースドメインのユーザー埋め込みをターゲットドメインのユーザー埋め込みとして表し、埋め込みの類似性に基づいてリコールを実行します。

参考記事: 論文 | 埋め込みとマッピングに基づくクロスドメイン推奨手法

3.6 DNNに基づく

マルチビュー DSSM
詳細については、次の論文を参照してください: DSSM セマンティック マッチングから Google のツインタワー ディープ モデル リコールまで、および広告シナリオにおけるツインタワー モデルについての考察

4. 参考文献は何ですか?

クロスドメインレコメンデーションは業界でも注目されており、多くの論文が発表されています。ここでは代表的な論文をいくつか紹介します。公式アカウントの[クロスドメインレコメンデーション論文]に返信することで入手できます。

  • 2014_因数分解マシンによるクロスドメイン協調フィルタリング

  • 2015_潜在ベクトル分布の共有によるユーザーやアイテムを共有しないクロスドメイン推奨

  • 2016_推奨システムにおけるクロスドメインユーザーモデリングのためのマルチビューディープラーニングアプローチ

  • 2016_WRAP-ソーシャル メディアと電子商取引の接続-He-2018

  • 2017_CCCFNet - クロスドメインレコメンデーションシステムのためのコンテンツブースト協調フィルタリングニューラルネットワーク

  • 2017_多層グラフのクラスタリングによるクロスドメイン推奨

  • 2017_クロスドメイン推奨事項 - 埋め込みとマッピングのアプローチ

  • 2018_近隣ベースの機能マッピングによるコールドスタートユーザー向けのクロスドメイン推奨

  • 2018_ディープドメイン適応によるクロスドメインレコメンデーション

  • 2019_DDTCDR- ディープデュアル転送クロスドメイン推奨事項

  • 2019_インタードメイン構造を利用した簡単な転移学習

  • 2019_電子商取引における商品推奨のためのドメイン認識型アテンションネットワークによる転移学習

  • 2020_MiNet - クロスドメインクリックスルー率予測のための混合興味ネットワーク

5. 参考文献

  • https://lumingdong.cn/multi-task-learning-in-recommendation-system.html#%E8%BF%81%E7%A7%BB%E5%AD%A6%E4%B9%A0

  • https://xmzzyo.github.io/2020/04/12/クロスドメイン推奨/

<<:  トランスフォーマーベースの効率的で低遅延のストリーミング音声認識モデル

>>:  2025年にはL3自動運転が普及する。まだ手動で運転しているのですか?

ブログ    
ブログ    
ブログ    

推薦する

Google検索は非常に勤勉で、そのコアアルゴリズムは毎日変化しています

Googleの検索事業責任者アミット・シンガル氏は最近、Google+に記事を掲載し、過去1年だけで...

なぜソートするのですか?ソートアルゴリズムのパフォーマンスを向上させる方法

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

...

Java プログラミング スキル - データ構造とアルゴリズム「循環リンク リストとジョセフ問題」

[[386837]]ジョセフ問題1、2、...n と番号が付けられた n 人が輪になって座り、番号...

...

GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発

AIの世界はどのようなものになるのでしょうか?研究者たちは何十年もの間、これに困惑してきましたが、近...

Kubernetes 上で生成 AI アプリケーションをデプロイするためのステップバイステップ ガイド

翻訳者 |李睿レビュー | Chonglou今日の急速に変化するテクノロジーと市場環境では、人工知能...

...

現在人工知能が適している5つの分野

調査会社IDCが最近発表した「世界の人工知能支出ガイド」によると、世界の人工知能予算は今後4年間で倍...

...

素人でもわかるポピュラーサイエンス:これは自然言語処理と呼ばれるものです

[[208394]] 1. 自然言語処理とは何ですか?簡単に言えば、自然言語処理(NLP)とは、コン...

XNOR-NETテクノロジー詳細解説:AIテクノロジーがモバイル端末に搭載され、新時代が到来

[[187849]]この時代、人間の生活はスマートデバイスから切り離すことはできません。持ち歩く携帯...

趙傑:面接では(純粋な)アルゴリズムの質問が見られる

今朝、外出中に、タブレットでZuo Erduo Haoziの新しい記事「純粋アルゴリズムの面接の質問...

安全な生産を守り、ロボット、IoTなどの技術サポートを提供します。

近年、世界的な工業化の加速を背景に、製造業、建設業、化学業などの産業を中心に労働災害や死亡者数が増加...