愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

AppleがSiriを発表してから7年、そしてジェフ・ベゾスがスタートレックにインスピレーションを得てAlexaを立ち上げてから3年が経った。

実際、人工知能をベースにしたインタラクティブなインターフェースは数十年前から登場しています。 1966 年、MIT のジョセフ・ワイゼンバウム教授は、今日の会話型 AI の原型として広く認められている ELIZA を発表しました。

数十年後、アンドリュー・レナードは Wired のレポートで、「ロボットは大きな存在になるだろう」と宣言し、そのようなテクノロジーはすぐに「CD の最安値を探したり、母のために花を摘んだり、モザンビークの最新動向をレポートし続けたりするのを手伝ってくれるようになるだろう」と述べた。この記事は 1996 年に発表されたため、使用された例はずっと時代遅れの CD だった。

[[201016]]

現在、Slack、Starbucks、Mastercard、Macy’s などの企業は、顧客サービス、コネクテッド ホーム、オンラインでの花の注文など、さまざまな分野で会話型インターフェースを使用するようになっています。

このテクノロジーの価値や将来性に懐疑的な方は、2019 年の Gartner の予測をご覧ください。市場調査会社は、仮想パーソナル アシスタントが「ユーザーとデバイスのやり取り方法を変え、生活のあらゆる場面に浸透する」と考えています。

すべての会話型 AI が同じように作成されるわけではありませんし、そうあるべきでもありません。会話型 AI には、仮想パーソナル アシスタント (Alexa、Siri、Cortana、Google Home) とプロフェッショナル アシスタント (X.ai、Skipflag) が含まれます。これらは、一連のルール エンジンに基づいて開発することも、機械学習技術を使用することもできます。使用例は、特定の単純なタスク (Taco Bell の TacoBot) から一般的な広範囲のサービス (Alex、Siri、Cortana、Google Home) まで多岐にわたります。

多くの組織は、パートナーが提供するテクノロジーに依存しながら、個人または職場の環境で会話型インターフェースを導入することを検討しています。しかし、テクノロジー以外にも考慮すべき点はまだたくさんあります。これを「ハウツー ガイド」と呼ぶのはまだ早いですが、会話型 AI を試用または導入することを検討する際に組織が考慮すべき事項をいくつか挙げます。

1. 明確な答えがある小さな領域から始める

「それは製品やブランドに関することです」と、Slack の開発者関係担当ディレクターのアミール・シェバト氏は言う。「『ボットを作っている』と考えるのではなく、『どんなサービスを提供するのか』と考えるべきです」

それを超えて、シェバット氏らは、大量のデータで緩和または解決できる困難な問題を探すことが最善の出発点だと主張している。成功するボットはすべて同じことをすべきだと言っているわけではありませんが、重要なのは、明確な答えがある小さな領域から始めて、ユーザーが楽しめるとは思っていないようなエクスペリエンスを設計することです。

2. 目標がインタラクションパターンを決定する

一部の会話は音声によるやり取りに適しています。たとえば、車を運転しているときや、自宅で暖房をつけているときなどです。しかし、銀行残高を尋ねるような状況では、正確な個人情報をテキストで入力する必要があるかもしれません。しかし、ユーザーがボットと対話できるようにする方法は他にもあります。次の図は、成功した相互作用の 2 つの例を示しています。

「ロボットは話したりタイプしたりすることしかできないという誤解をまだ多くの人が抱いている」とマイクロソフトのクリス・マリンズ氏は語った。実際、ロボットはさまざまな方法(または形式)で人々と対話したり、情報を伝達したりできます。

  • 音声(Alexa、Siri、Google Home)
  • タイピング(チャットアプリのボット)
  • キーボードサポートを通じてヒントを提供し、入力オプションを絞り込む
  • 視覚情報を表示するカード

「最も成功するケースでは、これらのモデルのハイブリッドが勝利するでしょう」とマリンズ氏は言います。「音声は、ある場合には最適です。しかし、タイピングは、別の場合には最適です。そして、時にはカードやキーボードのサポートを使用したいこともあります。会話モデルを決定することは、解決するのが非常に難しい問題であり、まだ誰もそれを正しく理解できていません。」

3. 慎重な計画と複数の背景の明確な選択

顧客が小売業者に「近くの店で電動ドリルを見つけられる場所はどこですか?」のような質問をした場合、開発者は顧客の所在地を考慮する必要があります。彼女は店内にいますか? 携帯電話を使用していますか、それとも自宅のコンピューターを使用していますか? 開発者は複数のシナリオとエクスペリエンスを設計する必要があります。

このプロセスは、スコープ設定プロセス中にさまざまなインタラクション モードを想定する必要があるため、困難です。 「人間とのやりとりは非常に複雑で、会話のパターンを判断するのは難しい」とマリンズ氏は語った。最良の結果を達成するには、プロジェクト チームが最初から選択を行う必要があります。

4. 継続的なインタラクションには、コンテキストの継続的な理解が必要です。

「ビヨンセのレモネードを再生して」や「銀行残高を確認して」といった単一のコマンドを理解することは一つのことですが、人間とチャットボット間のやり取りをプログラムすることは別のことです。このため、人間とロボットの間の複数のインタラクション(「ターン」)は非常に複雑で開発が難しく、コンテキストを完全に理解する必要があります。

以下の画像は、単純な支払いのやり取りに内在する複雑さを示す Kasisto の例です。

ラウンド1:

  • ユーザーは Kai (チャットボット) に Emily に 5 ドルを支払うように依頼します。
  • カイは、ユーザーの連絡先リストにエミリーという名前の人が 2 人いることを発見し、どちらのエミリーなのかを尋ねました。

第2ラウンド:

  • ユーザーは話題を変えて、自分の口座にいくらお金が残っているかを尋ねました。
  • カイはそれに応えて、「どこまで話してたっけ?」と言い、エミリーに5ドル払うという当初の話題を続けた。

一見すると、これは非常に単純なやり取りのように見えますが、エンジニアリングの観点からは、コンテキストと言語に対する深い理解が必要です。

  • まず、Kai はユーザーの目的 (この場合は、誰かに支払うこと) を認識して追跡する必要があります。
  • 次に、カイは誰に支払うかを決めなければなりません。ユーザーに Emily という名前の友人が 2 人いることが判明した場合、問い合わせを通じて具体的な支払い対象を決定する必要があります。
  • 3番目に、カイは、独立して現れる「ノイビグ」という単語が、前の会話の内容を指し、エミリー・ノイビグに支払うことを意味することを理解する必要があります。
  • 4 番目に、Kai は「私の口座にはいくらお金がありますか?」という文の意味を解釈し、これが完全に新しい要求であり、前の 2 つのやり取りとは異なることを理解する必要があります。
  • 最後に、この新しい要求に答え、会話を続けて元の要求(エミリーに 5 ドルを支払う)を完了する必要があります。

この会話は、目的の明確化、応答の絞り込み、深い専門知識がすべてチャットボット開発にとって重要である理由を示しています。自然な方法で表現されたユーザーの意図を理解することは複雑ですが、効果的なエクスペリエンスを提供したい場合には重要だからです。

5. EQはIQと同じくらい重要

優れた知性と明確なユーザー意図は、ボットの成功の唯一の要素ではありません。感情を感知し、適切な言葉と口調を選択することも、快適な会話体験を確保するための鍵となります。その結果、多くの研究室やスタートアップ企業が、写真、音声、テキスト、ビデオを通じて感情状態を検出できるソフトウェアを開発しています。 。

SRIインターナショナルの音声技術研究研究所は、音声信号を通じて話者の感情を感知できると主張するSenSay Analyticsプラットフォームを開発した。これは、ユーザーが混乱しているかどうかを把握して、対話できる人間を提供する方法、およびユーザーが受け入れやすいかどうかを把握して、関連するコンテンツを提供する方法です。

6. ブランディングの機会は小さいが効果的

ブランディングはロボットの成功の重要な要素です。ボットの実行が不十分だと評判が損なわれる可能性がありますが、強力なブランドの存在はボットの成功にもつながります。 「会話型インターフェースでブランド化できる機会は比較的少ないと思います」とAdobeのLars Trieloff氏は言う。「ですから、日常的なやりとりでブランドを活用しましょう。1つのことを本当にうまくやり遂げ、まさに顧客が望んでいるものであることを確認してください。」

会話型インターフェースの活用はまだ初期段階にあり、道のりはまだまだ長いです。しかし、会話型 AI、つまり人間と機械のやり取りをよりよく模倣できるプログラムは、今後も存在し続けるでしょう。今は原始的に思えるかもしれませんが、データ サイエンス、自然言語技術、機械学習、その他のテクノロジの進歩により、最終的には、よりスムーズな人間とコンピューターのインタラクションに必要な環境が構築されるでしょう。

会話によるやりとりは、人間同士のやりとりと同等かそれ以上になるでしょうか? やりとりの種類によっては、機械を介して行うことが決して容易ではないかもしれません。しかし、いくつかの用途では、それは可能かもしれません。私たちは多くの革新を目にしてきましたが、それはまだ表面をなぞったに過ぎません。

未来学者でクリエイティブストラテジストのモニカ・ビエルスキテ氏が言うように、確かなことが一つあります。「私たちはスクリーンのない未来に突入しています。」彼女は「将来、全世界が私たちのデスクトップになるだろう」と予測しています。

<<:  2017年世界ロボット会議エクスプレス:無人スーパーマーケットロボットがデビュー

>>:  トラフィックを30%削減し、鮮明度を向上: MITが新しいAIビデオキャッシュアルゴリズムを提案

推薦する

商品化への探究を深めよう!ジェネレーティブAIが1兆ドル市場への道を開く

2023年10月17日(本日)、百度のシンプル検索はアップグレードを発表し、大規模モデルを通じて再構...

...

オープンソース「AI史上最も重要な非公開会議」!マスク氏、ザッカーバーグ氏、その他のテクノロジー界の巨人が集まり、AIの将来について議論した

昨日、現地時間午前10時、AI業界のリーダーたちがワシントンに集まり、シューマー上院議員が主催するA...

...

...

スタンフォード大学の研究によると、AIチャットボットChatGPTのパフォーマンスは非常に不安定であることが判明

9月7日、スタンフォード大学の新たな研究により、人気の生成型人工知能(AI)チャットボット「Chat...

より賢い人工知能が人間に取って代わるのはもうすぐなのでしょうか?

人工知能の発展により、機械ははるかに賢くなりました。コンピュータプログラムさえ設定しておけば、多くの...

人工知能の主要技術:強化学習(RL)

人工知能技術はますます急速に進歩しており、それぞれのサブテクノロジーが生み出す価値もますます顕著にな...

マスク氏が自動運転を「ザッカーバーグの家へ行く」ライブ放送、45分間で手動介入は1回のみ:FSD V12は「ベータ版」ではなくなる

マスク氏は実際にテスラを運転して「ザッカー氏の家」まで行き、その全過程は編集なしで生放送された。しか...

...

...

2021年に人工知能の倫理的問題、社会的価値、影響について読むべき8冊の本

[[387639]]人工知能に関するこれらの 8 冊の本は、AI に関連する倫理的問題、AI が雇用...

Ctrip における Flutter マップのベスト プラクティス

著者についてCtrip のシニア モバイル開発エンジニアである Leo は、クロスエンド テクノロジ...

...