人工知能教師向けの類似質問の作成

人工知能教師向けの類似質問の作成

類似の質問とは何ですか? また、なぜ類似の質問を書く必要があるのですか?

類似質問はロボット教育を改善するための手段です。類似質問は、元のコーパスと同様に、ロボット学習の対象であり、モデルトレーニングの材料を提供します。

[[442545]]

類似の質問は、ユーザー ログ、業界データの再利用、インターネットからのクロール関連の質問だけではロボットのトレーニングを完了できない場合に使用する最も基本的かつ最も厳しい手段です。

つまり、元のコーパスのアーカイブ化が完了すると、顧客から尋ねられた元の質問と、対応するシナリオに分類された対応する回答を取得できるようになります。しかし、実際のトレーニングプロセスでは、特定のタイプのシナリオが元のコーパスでカバーされていないことが判明する場合があります。このとき、これまでのサービス経験とビジネスシナリオに基づいて、これらの不足しているシナリオのコーパスの質問と回答のペアを補足する必要があります。

欠落しているシナリオコーパスの質問と回答のペアを補足する場合は、次の原則に注意する必要があります。

  • 実際のビジネスシナリオと組み合わせる必要があります。
  • ユーザーの考えに合わせて補足する必要があります。

ビジネスシナリオを単に要約するだけでは十分ではありません。たとえば、返品シナリオには音声チャットがないため、「返品処理」ではなく、「返品するにはどうすればよいですか?」「商品を返品するにはどうすればよいですか?」「商品を返品したいのですが、どうすればよいですか?」などのユーザーフレンドリーな質問方法で記述する必要があります。

ロボットの正しい動作ロジックは、顧客からのさまざまな質問を一般的な標準的な質問に一致させることです。したがって、アーカイブされたコーパスの標準化は、本質的には、クライアントの元のコーパスを標準コーパスに変換するプロセスです。

類似の質問を書く利点は次のとおりです。

  • 操作は簡単で、製品システムで編集および追加して送信するか、EXCEL を使用して一括操作およびインポートするだけです。
  • すぐに機能します。ロングテールの FAQ の質問を教育するために同様の質問を手動で作成すると、ロボットがすぐに包括的な教育レベルに到達できるようになります。

もちろん、同様の質問の書き方には次のような欠点もあります。

  • 作業負荷が大きい。一般的に、オンラインビジネス向けの FAQ は数百、数千あり、そのほとんどはロングテールの質問です。これらすべてを手動で類似の質問を追加して学習させると、作業負荷が膨大になります。
  • 制限: 類似の質問の書き方は人によって異なります。同じ FAQ に対して、人によって異なる類似の質問を思いつく場合があります。一般的に、手動で作成された類似の質問では、実際のユーザーの無限の質問をカバーすることはできません。

したがって、類似の質問をより適切に記述し、効率を向上させるために、類似の質問は次の原則と仕様に従うことができます。

1. 質問と回答のペアの意味に基づいて、この知識ポイントに関する顧客の相談をシミュレートし、この知識ポイントを使用して同様の文章で尋ねられた質問に回答します。

たとえば、会社の給与水準はいくらですか?

シミュレーションユーザーは、「御社の給与はいくらですか?」や「御社の福利厚生は何ですか?」などの質問をすることができます。

2. 口語的な言葉を使い、固定されたテンプレートの使用は避けてください。

たとえば、会社の給与水準はいくらですか?

口頭での質問としては、「採用活動をしていると聞きましたが、給与は高いですか?」などがあります。

3. キーワードは異なる方法で尋ねる必要があり(一般的に、文中の内容語の意味は機能語の意味よりも大きく、n,v >> adj >> adv >> 様相助詞)、尋ね方を変えながら文の構造を変える必要があります。

たとえば、会社の給与水準はいくらですか?

この質問と回答のキーワードは「給与」と「レベル」です。キーワードは「御社の福利厚生はどのようなものですか?」や「給与状況について知りたいです」などに変更することができます。

4. 意味が類似する 2 つの質問と回答のペアについては、類似の質問を追加するときに、区別する特徴語を強調するように注意する必要があります。

例: モバイルバンキングを使用して送金する方法と、公式ウェブサイトで送金する方法

「モバイル バンキング」と「公式 Web サイト」は、これら 2 つの質問と回答のペアを意味的に区別する特徴であり、データを書き込むときに強調する必要があります。

5. 回答を使用して知識ポイントの理解に役立て、同様の異なる質問をすることはできますが、回答のみに基づいて質問を作成し、標準的な質問の意味から逸脱することはできません。

たとえば、報告電話番号は何ですか? 回答: 報告ホットライン: XXXXX。また、カスタマーサービス番号955XXに電話してフィードバックを送ることもできます。

回答に基づいて、「010-58289XXX は報告電話番号ですか?」のような質問をすることができます。

また、類似の質問に答える際には、顧客から尋ねられた同じ質問を単に何度も言い換えるのではなく、顧客が実際に尋ねるシナリオに基づいて補足する必要があることにも留意することが重要です。

のように:

  • 遠隔出金の手数料はいくらですか?
  • 遠隔出金の手数料はいくらですか?
  • 他の場所からお金を引き出す場合の手数料はいくらですか?
  • 他の場所からお金を引き出す場合、手数料はかかりますか?

その代わり:

  • 出張中ですが、出金手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?
  • 海外でお金を引き出す場合の手数料はいくらですか?

これは同様の質問を補足する正しい方法です。

市外引出の場合、市外=他の場所、引出=お金を引き出すことです。顧客サービスの観点から、文言の一貫性と標準化を確保するために、通常は「市外」と「引出」と言いますが、顧客は「市外」と「引出」と言うことがよくあります。このような状況に対応するために、類似の質問を補充する必要があります。文中の類似の質問を補充するだけでなく、文中のキーワードに対して同義語や類似語を補充する必要があります。具体的な補充方法は、各カスタマーサービスセンターロボットの背景設定要件に応じて実行する必要があります。たとえば、一部のロボットは、ビジネスシナリオコーミングで同義語と類似語の補充を別途行います。つまり、ビジネスシナリオの入力では、トレーナーが同義語のトレーニングシナリオ単語を補充する必要があります。一部のロボットは辞書として独立して存在し、キーワードを独立して補充できます。

同様の質問を補足する場合、次の問題が発生する可能性があります。

  1. 類似の質問を補足する作業量は膨大です。
  2. 類似の質問は人によって異なります。固定された人だけが類似の質問を完了できるようにすると、固定された考え方が形成されやすく、最終的な類似の質問の使いやすさが低下します。
  3. 同じ質問に対して類似の質問は無数にあり、ユーザーが実際に尋ねる類似の質問を完全に網羅することは困難です。

いくつかの提案:

解決策1: 大量の元の顧客ログを読み、同様の質問を書く

トレーナーは、類似の質問を書く前に、元のクライアントのログを大量に読み、自分の考えをクライアントの考えに当てはめて、クライアントの質問をシミュレートする必要があります。これは、書かれた類似の質問がクライアントの質問と最も一致するようにするためです。

ソリューション 2: カスタマー サービス センターの人間とカスタマー サービス ロボットの質問知識コンテスト (限定範囲)

カスタマーサービスセンターを動員し、多数の手動カスタマーサービススタッフに類似問題知識コンテストを開催してもらい、多数の手動カスタマーサービススタッフが類似問題の作成プロセスに参加できるようにします。作成する前に、類似問題の作成の原則と仕様を明確にし、誤った類似問題の書き方の例を提供する必要があります。

解決策3: ルール言語は同様の問題をカバーする

プログラミングのルールを使用して、「天気の状況を確認したい」などの同様の質問に対する正規表現を記述します。正規表現を使用して書かれた同様の質問は次のようになります: ${date}${city}の天気[予報|状態|ステータス]を[聞いてください|確認してください|教えてください]。[どのように|どのように|良いですか]。

解決策4: 類似質問自動生成システムを開発する

類似の質問を書く上記の方法はすべて、トレーナーによる手動操作に依存しています。では、類似の質問を書くのにロボットを利用できるようになるのでしょうか? 答えはイエスですが、コストを考慮する必要があります。

<<:  ロボティック プロセス オートメーション (RPA) を構築するための基本知識とベスト プラクティス

>>:  アリババDAMOアカデミーが2022年のトップ10テクノロジートレンドを発表:人工知能が風力・太陽光発電の送電網接続の問題を解決する可能性

ブログ    

推薦する

エッジ vs. クラウド: どちらの AI インフラストラクチャを選択すべきか?

エッジコンピューティングは最近ホットな話題です。近年最もエキサイティングな技術革新として称賛され、そ...

ロボットは人間の笑顔を真似することができますが、この笑顔はいつも...

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Pythonでグラフを描いてニューラルネットワークを理解する

Python 中国語コミュニティ (ID: python-china)人工ニューラル ネットワーク ...

機械学習をプログラマーにとってより身近なものにする方法

導入人々は長い間、人工的に生成されたコンテンツを理解するためにアルゴリズムを手動でコーディングしよう...

私の国の医薬品人工知能市場は急速な成長期に入っている

3月23日から26日まで、2021年重大健康産業(重慶)博覧会と第6回双品会が重慶で開催されました。...

「アンティーク」GPUでもDeepSeekと同じGRPOを実行できます。ビデオメモリは1/10しか必要とせず、コンテキストは10倍に増加します

オープンソースの微調整ツール Unsloth が新しいテクノロジーを携えて戻ってきました。前回のアッ...

Google のような大企業を辞めた後、彼らはどうやって次の仕事を見つけるのでしょうか?

今年上半期、中国と米国のインターネット・テクノロジー企業は、程度の差はあれ、レイオフや人員削減を経験...

...

全人代副代表の馬化騰氏は8つの書面提案を提出し、ブロックチェーンや人工知能など17の質問に答えた。

[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...

OpenAIを去った偉人カパシ氏は「教え始めた」。おなじみのミニコードスタイルのまま、新しいプロジェクトが日々増えている。

偉大なカルパシー氏はOpenAIを辞任し、当初は1週間の休暇を取ると脅していた。写真しかし、瞬く間に...

...

たった 10 行のコードでディープラーニングを実行できますか? PaddlePaddleフレームワークの高レベルAPIでAIを簡単に操作しよう

高レベルAPIとはディープラーニングは、人工知能時代の中核技術として、近年、学術界と産業界の両方でま...

2021 年の優れた 5 つの人工知能フレームワーク

この記事では、上位 5 つのフレームワークとライブラリを実際のアプリケーションとともに紹介したいと思...

「顔認識」はあなたの「顔」を盗む

3月15日にも、別の悪徳業者が監視カメラで摘発されたが、消費者の関心を最も集めたニュースは「顔情報の...