愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

AppleがSiriを発表してから7年、そしてジェフ・ベゾスがスタートレックにインスピレーションを得てAlexaを立ち上げてから3年が経った。

実際、人工知能をベースにしたインタラクティブなインターフェースは数十年前から登場しています。 1966 年、MIT のジョセフ・ワイゼンバウム教授は、今日の会話型 AI の原型として広く認められている ELIZA を発表しました。

数十年後、アンドリュー・レナードは Wired のレポートで、「ロボットは大きな存在になるだろう」と宣言し、そのようなテクノロジーはすぐに「CD の最安値を探したり、母のために花を摘んだり、モザンビークの最新動向をレポートし続けたりするのを手伝ってくれるようになるだろう」と述べた。この記事は 1996 年に発表されたため、使用された例はずっと時代遅れの CD だった。

[[201016]]

現在、Slack、Starbucks、Mastercard、Macy’s などの企業は、顧客サービス、コネクテッドホーム、オンラインでの花の注文など、さまざまな分野で会話型インターフェースを使用するようになっています。

このテクノロジーの価値や将来性に懐疑的な方は、2019 年の Gartner の予測をご覧ください。市場調査会社は、仮想パーソナルアシスタントが「ユーザーとデバイスのやり取り方法を変え、生活のあらゆる場面に浸透する」と考えています。

すべての会話型 AI が同じように作成されるわけではありませんし、そうあるべきでもありません。会話型 AI には、仮想パーソナルアシスタント (Alexa、Siri、Cortana、Google Home) とプロフェッショナルアシスタント (X.ai、Skipflag) が含まれます。これらは、一連のルールエンジンに基づいて開発することも、機械学習技術を使用することもできます。使用例は、特定の単純なタスク (Taco Bell の TacoBot) から一般的な広範囲のサービス (Alex、Siri、Cortana、Google Home) まで多岐にわたります。

多くの組織は、パートナーが提供するテクノロジーに依存しながら、個人または職場の環境で会話型インターフェースを導入することを検討しています。しかし、テクノロジー以外にも考慮すべき点はまだたくさんあります。これを「ハウツーガイド」と呼ぶのはまだ早いですが、会話型 AI を試用または導入することを検討する際に組織が考慮すべき事項をいくつか挙げます。

1. 明確な答えがある小さな領域から始める

「それは製品やブランドに関することです」と、Slack の開発者関係担当ディレクターのアミール・シェバト氏は言う。「『ボットを作っている』と考えるのではなく、『どんなサービスを提供するのか』と考えるべきです」

それを超えて、シェバット氏らは、大量のデータで緩和または解決できる困難な問題を探すことが最善の出発点だと主張している。成功するボットはすべて同じことをすべきだと言っているわけではありませんが、重要なのは、明確な答えがある小さな領域から始めて、ユーザーが楽しめるとは思っていないようなエクスペリエンスを設計することです。

2. 目標がインタラクションパターンを決定する

一部の会話は音声によるやり取りに適しています。たとえば、車を運転しているときや、自宅で暖房をつけているときなどです。しかし、銀行残高を尋ねるような状況では、正確な個人情報をテキストで入力する必要があるかもしれません。しかし、ユーザーがボットと対話できるようにする方法は他にもあります。次の図は、成功した相互作用の 2 つの例を示しています。

「ロボットは話したりタイプしたりすることしかできないという誤解をまだ多くの人が抱いている」とマイクロソフトのクリス・マリンズ氏は語った。実際、ロボットはさまざまな方法（または形式）で人々と対話したり、情報を伝達したりできます。

音声（Alexa、Siri、Google Home）
タイピング（チャットアプリのボット）
キーボードサポートを通じてヒントを提供し、入力オプションを絞り込む
視覚情報を表示するカード

「最も成功するケースでは、これらのモデルのハイブリッドが勝利するでしょう」とマリンズ氏は言います。「音声は、ある場合には最適です。しかし、タイピングは、別の場合には最適です。そして、時にはカードやキーボードのサポートを使用したいこともあります。会話モデルを決定することは、解決するのが非常に難しい問題であり、まだ誰もそれを正しく理解できていません。」

3. 慎重な計画と複数の背景の明確な選択

顧客が小売業者に「近くの店で電動ドリルを見つけられる場所はどこですか?」のような質問をした場合、開発者は顧客の所在地を考慮する必要があります。彼女は店内にいますか? 携帯電話を使用していますか、それとも自宅のコンピューターを使用していますか? 開発者は複数のシナリオとエクスペリエンスを設計する必要があります。

このプロセスは、スコープ設定プロセス中にさまざまなインタラクションモードを想定する必要があるため、困難です。「人間とのやりとりは非常に複雑で、会話のパターンを判断するのは難しい」とマリンズ氏は語った。最良の結果を達成するには、プロジェクトチームが最初から選択を行う必要があります。

4. 継続的なインタラクションには、コンテキストの継続的な理解が必要です。

「ビヨンセのレモネードを再生して」や「銀行残高を確認して」といった単一のコマンドを理解することは一つのことですが、人間とチャットボット間のやり取りをプログラムすることは別のことです。このため、人間とロボットの間の複数のインタラクション（「ターン」）は非常に複雑で開発が難しく、コンテキストを完全に理解する必要があります。

以下の画像は、単純な支払いのやり取りに内在する複雑さを示す Kasisto の例です。

ラウンド1:

ユーザーは Kai (チャットボット) に Emily に 5 ドルを支払うように依頼します。
カイは、ユーザーの連絡先リストにエミリーという名前の人が 2 人いることを発見し、どちらのエミリーなのかを尋ねました。

第2ラウンド:

ユーザーは話題を変えて、自分の口座にいくらお金が残っているかを尋ねました。
カイはそれに応えて、「どこまで話してたっけ？」と言い、エミリーに5ドル払うという当初の話題を続けた。

一見すると、これは非常に単純なやり取りのように見えますが、エンジニアリングの観点からは、コンテキストと言語に対する深い理解が必要です。

まず、Kai はユーザーの目的 (この場合は、誰かに支払うこと) を認識して追跡する必要があります。
次に、カイは誰に支払うかを決めなければなりません。ユーザーに Emily という名前の友人が 2 人いることが判明した場合、問い合わせを通じて具体的な支払い対象を決定する必要があります。
3番目に、カイは、独立して現れる「ノイビグ」という単語が、前の会話の内容を指し、エミリー・ノイビグに支払うことを意味することを理解する必要があります。
4 番目に、Kai は「私の口座にはいくらお金がありますか?」という文の意味を解釈し、これが完全に新しい要求であり、前の 2 つのやり取りとは異なることを理解する必要があります。
最後に、この新しい要求に答え、会話を続けて元の要求（エミリーに 5 ドルを支払う）を完了する必要があります。

この会話は、目的の明確化、応答の絞り込み、深い専門知識がすべてチャットボット開発にとって重要である理由を示しています。自然な方法で表現されたユーザーの意図を理解することは複雑ですが、効果的なエクスペリエンスを提供したい場合には重要だからです。

5. EQはIQと同じくらい重要

優れた知性と明確なユーザー意図は、ボットの成功の唯一の要素ではありません。感情を感知し、適切な言葉と口調を選択することも、快適な会話体験を確保するための鍵となります。その結果、多くの研究室やスタートアップ企業が、写真、音声、テキスト、ビデオを通じて感情状態を検出できるソフトウェアを開発しています。。

SRIインターナショナルの音声技術研究研究所は、音声信号を通じて話者の感情を感知できると主張するSenSay Analyticsプラットフォームを開発した。これは、ユーザーが混乱しているかどうかを把握して、対話できる人間を提供する方法、およびユーザーが受け入れやすいかどうかを把握して、関連するコンテンツを提供する方法です。

6. ブランディングの機会は小さいが効果的

ブランディングはロボットの成功の重要な要素です。ボットの実行が不十分だと評判が損なわれる可能性がありますが、強力なブランドの存在はボットの成功にもつながります。「会話型インターフェースでブランド化できる機会は比較的少ないと思います」とAdobeのLars Trieloff氏は言う。「ですから、日常的なやりとりでブランドを活用しましょう。1つのことを本当にうまくやり遂げ、まさに顧客が望んでいるものであることを確認してください。」

会話型インターフェースの活用はまだ初期段階にあり、道のりはまだまだ長いです。しかし、会話型 AI、つまり人間と機械のやり取りをよりよく模倣できるプログラムは、今後も存在し続けるでしょう。今は原始的に思えるかもしれませんが、データサイエンス、自然言語技術、機械学習、その他のテクノロジの進歩により、最終的には、よりスムーズな人間とコンピューターのインタラクションに必要な環境が構築されるでしょう。

会話によるやりとりは、人間同士のやりとりと同等かそれ以上になるでしょうか? やりとりの種類によっては、機械を介して行うことが決して容易ではないかもしれません。しかし、いくつかの用途では、それは可能かもしれません。私たちは多くの革新を目にしてきましたが、それはまだ表面をなぞったに過ぎません。

未来学者でクリエイティブストラテジストのモニカ・ビエルスキテ氏が言うように、確かなことが一つあります。「私たちはスクリーンのない未来に突入しています。」彼女は「将来、全世界が私たちのデスクトップになるだろう」と予測しています。

<<: 2017年世界ロボット会議エクスプレス：無人スーパーマーケットロボットがデビュー

>>: トラフィックを30%削減し、鮮明度を向上: MITが新しいAIビデオキャッシュアルゴリズムを提案

機械学習の世界的ゴッドファーザーであるトム・ミッチェルは、スクワールAIラーニングに入社すると発表した。

愚かではないチャットボットを構築したいですか? 6つの実用的なガイドラインをご紹介します

機械学習の世界的ゴッドファーザーであるトム・ミッチェルは、スクワールAIラーニングに入社すると発表した。

Python 機械学習の実践: クレジットカード詐欺検出

ロボット品質教育を普及させる時が来た

2020 年の予測: AI セキュリティの 10 のトレンド

組み込みアルゴリズム CRCチェックアルゴリズム

ロボット革命はビジネス環境を変えている

GoogleがAIトレーニングを高速化する新手法を提案、GPUのアイドル時間を圧縮して3倍以上高速化

NTRU 1.2 リリース Java 用 NTRU 暗号化アルゴリズムライブラリ

ディープラーニングを使った顔認証

進化する決定木: 機械学習が生物学からヒントを得るとき

推薦する

自分のIQに挑戦してみませんか？ 10 種類の機械学習アルゴリズムを理解してデータサイエンティストになろう

コードの 80% が数秒で生成されます。 AIアーティファクトCopilotがアップグレードされ、5年後には何百万人もの開発者がコードを書けるようになる

スマートフォンの代替品？元アップルデザイナーが699ドルの人工知能ブローチ「AI Pin」を発売

DeepMap COO 羅偉氏との独占インタビュー：自動運転の時代に、スタートアップは高精度地図の分野でどのように躍進できるのか？

爆発的なソラの背後にある技術、拡散モデルの最新の開発をレビューする記事

パスワードを忘れたことが引き起こすアルゴリズム思考

テレンス・タオ：私の数学的経験に基づくと、室温超伝導LK-99とその再現は非常に刺激的です

美団点評におけるディープラーニングの応用

機械学習における欠損値に対処する9つの方法

機械学習と脳科学が次の10年間の教育発展をリードする

機械学習が交通と物流に革命を起こす4つの方法

Alibaba Cloudが「Tongyi Lingma」AIプログラミングツールをリリース、VS CodeやJetBrainsなどの主流IDEをサポート

どのような状況で Redis のメモリオーバーフローが発生しますか?解決策は何ですか?