人工知能教師向けの類似質問の作成

人工知能教師向けの類似質問の作成

類似の質問とは何ですか? また、なぜ類似の質問を書く必要があるのですか?

類似質問はロボット教育を改善するための手段です。類似質問は、元のコーパスと同様に、ロボット学習の対象であり、モデルトレーニングの材料を提供します。

[[442545]]

類似の質問は、ユーザー ログ、業界データの再利用、インターネットからのクロール関連の質問だけではロボットのトレーニングを完了できない場合に使用する最も基本的かつ最も厳しい手段です。

つまり、元のコーパスのアーカイブ化が完了すると、顧客から尋ねられた元の質問と、対応するシナリオに分類された対応する回答を取得できるようになります。しかし、実際のトレーニングプロセスでは、特定のタイプのシナリオが元のコーパスでカバーされていないことが判明する場合があります。このとき、これまでのサービス経験とビジネスシナリオに基づいて、これらの不足しているシナリオのコーパスの質問と回答のペアを補足する必要があります。

欠落しているシナリオコーパスの質問と回答のペアを補足する場合は、次の原則に注意する必要があります。

  • 実際のビジネスシナリオと組み合わせる必要があります。
  • ユーザーの考えに合わせて補足する必要があります。

ビジネスシナリオを単に要約するだけでは十分ではありません。たとえば、返品シナリオには音声チャットがないため、「返品処理」ではなく、「返品するにはどうすればよいですか?」「商品を返品するにはどうすればよいですか?」「商品を返品したいのですが、どうすればよいですか?」などのユーザーフレンドリーな質問方法で記述する必要があります。

ロボットの正しい動作ロジックは、顧客からのさまざまな質問を一般的な標準的な質問に一致させることです。したがって、アーカイブされたコーパスの標準化は、本質的には、クライアントの元のコーパスを標準コーパスに変換するプロセスです。

類似の質問を書く利点は次のとおりです。

  • 操作は簡単で、製品システムで編集および追加して送信するか、EXCEL を使用して一括操作およびインポートするだけです。
  • すぐに機能します。ロングテールの FAQ の質問を教育するために同様の質問を手動で作成すると、ロボットがすぐに包括的な教育レベルに到達できるようになります。

もちろん、同様の質問の書き方には次のような欠点もあります。

  • 作業負荷が大きい。一般的に、オンラインビジネス向けの FAQ は数百、数千あり、そのほとんどはロングテールの質問です。これらすべてを手動で類似の質問を追加して学習させると、作業負荷が膨大になります。
  • 制限: 類似の質問の書き方は人によって異なります。同じ FAQ に対して、人によって異なる類似の質問を思いつく場合があります。一般的に、手動で作成された類似の質問では、実際のユーザーの無限の質問をカバーすることはできません。

したがって、類似の質問をより適切に記述し、効率を向上させるために、類似の質問は次の原則と仕様に従うことができます。

1. 質問と回答のペアの意味に基づいて、この知識ポイントに関する顧客の相談をシミュレートし、この知識ポイントを使用して同様の文章で尋ねられた質問に回答します。

たとえば、会社の給与水準はいくらですか?

シミュレーションユーザーは、「御社の給与はいくらですか?」や「御社の福利厚生は何ですか?」などの質問をすることができます。

2. 口語的な言葉を使い、固定されたテンプレートの使用は避けてください。

たとえば、会社の給与水準はいくらですか?

口頭での質問としては、「採用活動をしていると聞きましたが、給与は高いですか?」などがあります。

3. キーワードは異なる方法で尋ねる必要があり(一般的に、文中の内容語の意味は機能語の意味よりも大きく、n,v >> adj >> adv >> 様相助詞)、尋ね方を変えながら文の構造を変える必要があります。

たとえば、会社の給与水準はいくらですか?

この質問と回答のキーワードは「給与」と「レベル」です。キーワードは「御社の福利厚生はどのようなものですか?」や「給与状況について知りたいです」などに変更することができます。

4. 意味が類似する 2 つの質問と回答のペアについては、類似の質問を追加するときに、区別する特徴語を強調するように注意する必要があります。

例: モバイルバンキングを使用して送金する方法と、公式ウェブサイトで送金する方法

「モバイル バンキング」と「公式 Web サイト」は、これら 2 つの質問と回答のペアを意味的に区別する特徴であり、データを書き込むときに強調する必要があります。

5. 回答を使用して知識ポイントの理解に役立て、同様の異なる質問をすることはできますが、回答のみに基づいて質問を作成し、標準的な質問の意味から逸脱することはできません。

たとえば、報告電話番号は何ですか? 回答: 報告ホットライン: XXXXX。また、カスタマーサービス番号955XXに電話してフィードバックを送ることもできます。

回答に基づいて、「010-58289XXX は報告電話番号ですか?」のような質問をすることができます。

また、類似の質問に答える際には、顧客から尋ねられた同じ質問を単に何度も言い換えるのではなく、顧客が実際に尋ねるシナリオに基づいて補足する必要があることにも留意することが重要です。

のように:

  • 遠隔出金の手数料はいくらですか?
  • 遠隔出金の手数料はいくらですか?
  • 他の場所からお金を引き出す場合の手数料はいくらですか?
  • 他の場所からお金を引き出す場合、手数料はかかりますか?

その代わり:

  • 出張中ですが、出金手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?

これは同様の質問を補足する正しい方法です。

市外引出の場合、市外=他の場所、引出=お金を引き出すことです。顧客サービスの観点から、文言の一貫性と標準化を確保するために、通常は「市外」と「引出」と言いますが、顧客は「市外」と「引出」と言うことがよくあります。このような状況に対応するために、類似の質問を補充する必要があります。文中の類似の質問を補充するだけでなく、文中のキーワードに対して同義語や類似語を補充する必要があります。具体的な補充方法は、各カスタマーサービスセンターロボットの背景設定要件に応じて実行する必要があります。たとえば、一部のロボットは、ビジネスシナリオコーミングで同義語と類似語の補充を別途行います。つまり、ビジネスシナリオの入力では、トレーナーが同義語のトレーニングシナリオ単語を補充する必要があります。一部のロボットは辞書として独立して存在し、キーワードを独立して補充できます。

同様の質問を補足する場合、次の問題が発生する可能性があります。

  1. 類似の質問を補足する作業量は膨大です。
  2. 類似の質問は人によって異なります。固定された人だけが類似の質問を完了できるようにすると、固定された考え方が形成されやすく、最終的な類似の質問の使いやすさが低下します。
  3. 同じ質問に対して類似の質問は無数にあり、ユーザーが実際に尋ねる類似の質問を完全に網羅することは困難です。

いくつかの提案:

解決策1: 大量の元の顧客ログを読み、同様の質問を書く

トレーナーは、類似の質問を書く前に、元のクライアントのログを大量に読み、自分の考えをクライアントの考えに当てはめて、クライアントの質問をシミュレートする必要があります。これは、書かれた類似の質問がクライアントの質問と最も一致するようにするためです。

ソリューション 2: カスタマー サービス センターの人間とカスタマー サービス ロボットの質問知識コンテスト (限定範囲)

カスタマーサービスセンターを動員し、多数の手動カスタマーサービススタッフに類似問題知識コンテストを開催してもらい、多数の手動カスタマーサービススタッフが類似問題の作成プロセスに参加できるようにします。作成する前に、類似問題の作成の原則と仕様を明確にし、誤った類似問題の書き方の例を提供する必要があります。

解決策3: ルール言語は同様の問題をカバーする

プログラミングのルールを使用して、「天気の状況を確認したい」などの同様の質問に対する正規表現を記述します。正規表現を使用して書かれた同様の質問は次のようになります: ${date}${city}の天気[予報|状態|ステータス]を[聞いてください|確認してください|教えてください]。[どのように|どのように|良いですか]。

解決策4: 類似質問自動生成システムを開発する

類似の質問を書く上記の方法はすべて、トレーナーによる手動操作に依存しています。では、類似の質問を書くのにロボットを利用できるようになるのでしょうか? 答えはイエスですが、コストを考慮する必要があります。

<<:  ロボティック プロセス オートメーション (RPA) を構築するための基本知識とベスト プラクティス

>>:  アリババDAMOアカデミーが2022年のトップ10テクノロジートレンドを発表:人工知能が風力・太陽光発電の送電網接続の問題を解決する可能性

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

拡散+超解像モデルの強力な組み合わせ、Googleの画像ジェネレーターImagenの背後にある技術

近年、マルチモーダル学習は、特にテキストと画像の合成や画像とテキストの対照学習の分野で大きな注目を集...

玩具におけるIoTとAIの統合が世界のスマート玩具市場の成長を促進

IoT が広く普及したことにより、さまざまな目的のためのスマートな接続型ガジェットの開発が促進され...

2022 AIOPS のトレンドと予測: 知っておくべきことすべて

人工知能、機械学習、自動化などの高度なテクノロジーの登場により、最先端のビジネスシナリオは大きな変化...

...

AIが伝統的な製造業のデジタル進化を促し、国内のスマート工場は活力に満ち溢れている

モノのインターネット、ビッグデータ、人工知能などの最先端技術と伝統的な製造業の統合はますます深まり、...

アルゴリズムエンジニアも35歳でこのハードルにぶつかるのでしょうか?

[[327792]]はじめに: この質問は、実はほとんどのプログラマーに当てはまります。国内のイン...

人間とコンピュータのインタラクション技術の現状と進化 将来、私たちはどのように機械とコミュニケーションをとるのでしょうか

コンピューターやその他の機械は、生産性を高め、より多くのことを学び、お互いのつながりを保つことを可能...

...

Cacti パーセンタイル監視アルゴリズム

Cactiパーセンタイル監視アルゴリズムcacti のテンプレート自体はハードディスクの使用サイズし...

AIが高収入の仕事を生み出すと同時に仕事を代替できる理由

自動化、特に人工知能とロボット工学の進歩が、今日の労働者にとって問題となるかどうか。この議論は毎日繰...

CommScope Insights: データセンターが AI をより迅速かつコスト効率よく活用する方法

人気のSF小説で「機械知能の台頭」が描かれる場合、通常はレーザーや爆発などのシーンが伴います。それほ...

機械学習の導入を成功させるための3つのヒント

人工知能の時代において、機械学習、自然言語処理 (NLP)、認知検索技術が急速に導入されているのは当...