【ビッグガイがやってくるエピソード7】スマートショッピングガイド対話ロボットの実践

[51CTO.com からのオリジナル記事] 現在の電子商取引業界は比較的成熟しており、さまざまな形態を呈しています。エンドユーザーにより良いサービスを提供し、それによって業務と企業の効率を向上させる方法は、すべての電子商取引企業が直面しなければならない問題です。このような状況で、スマートなショッピングガイド対話ロボットが登場しました。「ビッグネームがやってくる」の今回のエピソードのゲストスピーカーは、Smart One の CTO、Mo Yu 氏です。彼のスピーチのタイトルは「スマートショッピングガイド会話ロボットの実践」です。彼は、スマートショッピングガイド会話ロボットの背後にある技術的な詳細と、実際の研究開発プロセスの概要と考察について詳しく説明しました。

インテリジェントショッピングガイド対話ロボットの応用シナリオ

スマートショッピングガイド会話型ロボットはどのようなシナリオで使用する必要がありますか?夜間に買い物をするときに、ユーザーが人間のカスタマーサービスを見つけるのは困難です。このとき、スマートショッピングガイドロボットは、電子商取引の顧客の取引量を増やす上で非常に重要な役割を果たします。 Double 11や618などの大規模なプロモーション期間中、数十倍、数百倍に増加するトラフィックに対処するために数か月前から手動のカスタマーサービスを準備していますが、効率とリソースの投資は満足できるものではありません。このようなときに、スマートショッピングガイド対話ロボットが役立ちます。

下の図に示すように、会話型ロボット全体の大まかなアーキテクチャは背景にある。

インテリジェント会話ロボットは、さまざまな電子商取引クライアントを通じてユーザーメッセージを受信すると、直接回答できる場合は自動的に返信します。能力を超える場合は、手動のカスタマーサービスに分配します。インテリジェント対話ロボットがユーザーの質問に自動的に回答するプロセスは次のとおりです。まず、対話管理プラットフォームがメッセージを受信し、コンテキストに基づいてユーザーの意図を理解し、インテリジェントショッピングガイドロボットに配信します。インテリジェントショッピングガイドロボットからのフィードバックを受け取った後、中央制御モジュールが最終的な仲裁を行い、結果をユーザーにフィードバックします。プロセス全体は単純に見えますが、技術的な実装は簡単ではありません。

スマートショッピングガイド会話ロボットの技術的詳細

インテリジェントショッピングガイドロボットは、質問回答ロボット、タスクロボット、推奨ロボットの 3 つの部分で構成されています。質疑応答ロボットは主に、複数回の対話を経ずに解決できる問題を解決し、タスクロボットの基礎となります。タスクロボットは、ユーザーとの複数回のやり取りを通じて、ユーザーが特定のニーズを解決するのを支援します。これは、質疑応答ロボットよりも一歩進んだものです。レコメンドロボットはタスク型ロボットと質疑応答型ロボットをベースに構築されており、ユーザーと積極的に対話する点が特徴です。

質問応答ロボット

質問と回答のロボットは、一般的に、数万、数十万、あるいはそれ以上の既知の一致する質問と回答のデータを格納する質問と回答のデータベースに基づいて構築されます。ユーザーが入力した質問がデータベース内の質問と同じ意味を持つ場合、対応する回答がユーザーにフィードバックされます。質問応答ライブラリに基づく質問応答ロボットは、通常、ルール、統計学習、事前トレーニング済みモデル、および小規模サンプル学習に基づく技術的ソリューションを使用します。

ルールベースと統計的学習

ユーザーメッセージにキーワードが含まれ、正規表現に一致し、ルールエンジンに準拠している場合、意図が正確に識別され、対応する回答がフィードバックされます。この方法はシンプルで制御可能ですが、意味の理解が欠けており、保守が容易ではありません。

統計学習に基づくソリューションには、SVM やディープセマンティックモデルなどのラベル付きデータが必要です。これらのモデルには、手動で設計された機能、ディープ機能、ワンホット (スパース表現)、埋め込み (密な表現) が含まれます。ルールベースの方法と比較して、統計学習ベースのソリューションはより多くのセマンティクスを学習できますが、多くのドメイン知識とドメイン関連の注釈付きデータが必要になるという欠点があります。

事前学習済みモデルと小規模サンプル学習に基づく

データ注釈がない場合は、事前トレーニング済みモデルと小規模サンプル学習のどちらかを選択できます。 2018年には、BERTをベースにしたファインチューニングがリリースされ、意味的類似性を含む多くの問題に対する最良の結果が更新されました。

各質問と回答のデータベースのデータが非常に小さく、各インテントシナリオに項目が数個しかない場合は、小さなサンプルベースの学習方法を使用してみることができます。

質問応答ライブラリに基づく質問応答ロボットに加えて、ナレッジグラフに基づくもう 1 つの非常に重要な質問応答ロボットがあります。

ナレッジグラフに基づく

ユーザーが尋ねる質問のほとんどは製品や活動に関連しており、これらの質問は基本的にナレッジグラフとしてモデル化できます。電子商取引の分野では、製品データとアクティビティデータは 2 つの非常に重要なデータソースです。すべての業界データがデータベースに保存されると、ほとんどのユーザーの質問に問い合わせて回答することができます。

下図に示すように、知識グラフと質問応答モデルの構築

顧客独自の構造化データ、ページから抽出した半構造化データ、ユーザーコメントなどの非構造化データは、ナレッジグラフの3つの主要なデータソースです。ナレッジグラフはこれに基づいて構築され、ナレッジグラフでクエリを実行した後、対応するストレージエンジンに配置されます。一部のデータを頻繁にクエリする必要がある場合は、リレーショナルデータベースに配置することもできます。ユーザーからのリクエストを受信すると、構文解析を実行して文をクエリ形式に変換したり、質問の核心部分を抽出してクエリを実行したりできます。

タスクロボット

会話型インタラクションシステムはタスクロボットの中核であり、意味理解、会話管理、テキスト生成などのモジュールが含まれています。次の図は、一般的に使用され、比較的成熟したフレームワークを示しています。

セマンティック理解は、ドメイン分類、意図認識、スロット値抽出の 3 つの部分にさらに分けられます。まず、ユーザーの質問がどのドメインに属するかを判断し、次にユーザーの意図を理解し、ユーザーの意図を識別した後、スロット値を抽出します (対応する意図シナリオに関連する重要なパラメータを取得します)。

意図認識

意図認識は非常に重要なモジュールです。意図認識が失敗したり、間違っていたりすると、その後のやり取り全体が非常に奇妙に見えてしまいます。次の図は、意図認識のための包括的なソリューションを示しています。

この組み合わせソリューションでは、パラメータモデルベースの意図認識が主な方法であり、コンテキスト、ルール、KNN ベースの意図認識が補完されます。従来の機能とディープモデル機能を使用して、ラベル付けされたデータに基づくモデルを融合し、モデルを分類器として扱い、出力を特定の意図のシナリオに属します。各インテントには関連するスロット値またはパラメータがあります。エンティティ抽出は、次の図に示すように、主にルールとシーケンス注釈の組み合わせに基づいています。

ルールスキームは、住所、電子メールアドレス、製品リンク、その他のデータなど、比較的規則的または閉じたコレクションに適しています。ルールでサポートできない一部のオープンセットでは、シーケンスラベル付けを使用できます。感情分析は、ユーザーの感情がどのようなものか、それが肯定的か否定的か、変化したかどうかなど、意味理解の範疇にも入ります。

ダイアログ管理

ダイアログ状態の管理自体は非常に複雑なタスクです。ユーザーがインタラクション設計プロセスに完全に従わない場合、意図の逸脱が発生する可能性があります。下の図に示すように、対話型のインタラクションにはシンプルなプロセスが設計されています。

ユーザーの質問が曖昧で、ユーザーの意図を理解した後、ユーザーが当初の予測の範囲を超えた追加の質問をした場合、このような状況にはどのように対処すればよいでしょうか。ここでは、エンドユーザーとインテリジェントに対話するために、構成可能な対話型対話システムが適用されます。会話型インタラクションシステムは、顧客記述言語の定義に応じて、必要なロボットの会話構成をサポートできます。

現在、会話型インタラクション設計システムは、設計と実装の分離を実現できます。技術的な研究開発により会話型インタラクションシステムが改善される一方で、ショッピングガイドやドメインの専門家はカスタマイズされたロボットを簡単に構成できます。

推奨ロボット

パーソナライズされた推奨事項がなぜ必要なのでしょうか?理由は 2 つあります。まず、会話型のインタラクションは情報の取得には役立ちますが、情報の提示には役立ちません。次に、会話型のインタラクションにはきめ細かいパーソナライゼーションが必要です。電子商取引のシナリオでは、実際のやり取りの非常に大きな割合で推奨ロボットが使用されます。一部の店舗では、顧客サービスリクエストの約 20% に製品リンクまたは推奨リクエストが含まれています。

従来の推奨システムと比較して、会話型インタラクティブ推奨システムは、会話シナリオに自然に存在するより豊富な情報、つまり明示的なフィードバックを組み合わせることができ、時間 (朝、昼、夕方/曜日)、場所、感情、環境 (ビジネス状況) などのより多くのコンテキストを考慮することができます。スマートショッピングガイドの推奨方法は、一般的に、人気推奨、関連推奨、アクティブ推奨、インタラクティブ推奨の 4 種類に分けられます。

次に、比較的複雑なインタラクティブなレコメンデーション手法を中心に紹介します。次の図はその一例です。

粉ミルクの推奨を例にとると、従来の推奨はユーザーポートレートに基づいており、すべての SKU から最も売れる可能性の高い製品を選択して推奨します。相互推奨とは、まず特定の商品を推奨し、その後さらにコミュニケーションをとって両者が情報を交換できるようにすることです。このように、ユーザーが販売者の情報を知ると同時に、販売者もユーザーの好みを知ることで、情報の非対称性が軽減され、両者間の理解の違いが補われ、ユーザーへのサービスが向上します。このパートでは、具体的な事例をもとに、インタラクティブなレコメンデーションのプロセスとモデリングについて詳しく説明します。視聴するには、(http://aix..com/activity/10015.html) をクリックしてください。

実際の研究開発プロセスにおける要約と考察

会話型ロボットの分野は非常に広く、多くの新しい技術が絶えず開発されています。会話型テクノロジーを使用してビジネス上の問題を解決する過程で、あらゆる規模の問題に遭遇することになります。共有すべき主なポイントは次のとおりです。

まず、製品設計とテクノロジーの境界です。製品設計とテクノロジーの境界とのバランスに注意を払い、テクノロジーで問題を解決しながら、巧みな製品設計と製品プロセスの相互作用を通じてテクノロジー要件を減らし、顧客エクスペリエンスを向上させる方法を検討することが重要です。

2番目は、完全な自動化と人間と機械のコラボレーションです。ロボットの場合、ユーザーは常にその動作や能力が人間と同等であることを期待します。現実には、完全な自動化を実現することは困難です。人間と機械の協調アプローチを採用することによってのみ、ユーザーはより良い体験を得ることができます。完全な自動化が必要な場合は、人と機械のやりとりをスムーズにするために、インタラクティブな推奨方法を導入する必要があります。

3 番目は、ユーザーエンゲージメントと構成の容易さです。ロボットの設定に参加したお客様は、ロボットを飼い慣らす達成感を味わうことができます。ただし、使いやすさの観点から構成を慎重に検討する必要があり、顧客が不安に感じないように複雑になりすぎないようにする必要があります。

4番目は、制御可能性とインテリジェンスです。電子商取引のシナリオでは、実際の商用対話システムは制御可能かつインテリジェントである必要があります。いつ制御可能でいつインテリジェントであるかを決定する際には、多くのトレードオフを行う必要があります。たとえば、推奨されるインタラクション戦略は強化学習に基づいており、よりスマートであればあるほど良いでしょう。ただし、対話システム戦略全体、モジュールの最適化、調停ロジック、インタラクションプロセスなどの側面については、構成やインタラクション設計を通じて、より制御可能にする必要があります。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]