編集者注: チャットボットは目新しいものではありません。Facebook や Microsoft などの多くの主要プラットフォームには独自のチャットボットがあります。しかし、チャットボットの開発はボトルネックに遭遇したようです。この記事の著者である Riza C. Berkan 博士は、チャットボット分野で直面している問題を技術的な観点から解決する方法について論じています。 会話型AI(チャットボット)には、(1)言語スキル(2)知識獲得(3)会話行動という3つの側面の問題が関係しています。 これら 3 つは強く相関していますが、人間の脳は、別々の実験や異なる期間でこれらの利点を得るために異なる神経領域を使用する可能性があります。 したがって、プロセス全体のコンピュータ モデルを開発するには、個別の処理と分散アプローチも必要になります。 ディープラーニングは、機能すると思われるモデルを提供します。 ただし、多数のデータ要件に対応するために、すべてのデータを単一のスキーマに統合します。 これは、読書による学習方法とも矛盾しています。ディープラーニングとは異なり、新しい記事を読むたびに言語スキルを再学習するわけではありません。言語と知識を別々に扱い、後者が前者と混ざることなく成長できるようにすることは可能でしょうか? もし可能であれば、この半独立性をどのようにシミュレートできるでしょうか? Deep Cloning Method (DCM) という新しい手法を紹介します。 これらの技術的な詳細は独自のもの(特許出願中)ですが、このアプローチには実験する価値のある他の多くのバリエーションが存在する可能性があります。 ディープクローン DCM は、会話型 AI 専用に設計された新しい機械学習手法です。 「ディープ」という用語は、その多層構造のアーキテクチャに由来しています。 「クローニング」という用語は、知識を元のドメインから会話システムに転送すること(ドキュメントをチャットのトランスクリプトに変換すること)を指します。 DCMは(1)言語能力と(2)知識獲得を分離しますが、(3)会話行動を別々に扱うことはありません。 DCM は人間の脳の読み取りプロセスにヒントを得たもので、学習は言語実験 (教師あり) ではなく、直接読み取り (教師なし) を通じて行われます。 DCM は、与えられたコンテンツを文ごとに処理し、各文を概念に分解し、大規模なネットワークを通じてこれらの概念が互いにどのように関連しているかを学習します。 いくつかのサンプル チャットボットはこのアプローチを使用して開発されており、編集を通じてのみ DCM が読み取れるコンテンツを入力できます。 ディープクローニングとディープラーニングの比較は次のとおりです。 神経構造 DCM の核となる革新は、人工言語ニューロンの概念です。 このアイデアは生物学からヒントを得たもので、脳の特定の領域には、他の領域が画像や他の感覚に敏感であるのと同様に、言語入力に敏感なニューロンが含まれていることが知られています。 さらに、言語に敏感なニューロンも、言語の役割と互換性のある異なる構造を持つ可能性があります。 一方、ディープラーニングではどのアプリケーションでも同じニューロンが使用され、典型的なニューロンを下の図に示します。さまざまなネットワークのニューロン モデルにはバリエーションがありますが、いずれも自然言語処理に関係する特定の役割とは関係がありません。 これらのニューロンには、入力層から伝播されるデジタル入力が必要です。 したがって、この操作が適切に機能するためには自然言語を数値に変換する必要があり、このアプローチによっては、この変換が無意味になる可能性があります。 DCM では、分解プロセスを通じて 6 つの異なるニューロン タイプが識別されました。 黒いニューロンはコンテンツ(文章)を表し、赤いニューロンはイベントの概念を表し、青いニューロンはオブジェクト(会話のトピック)を表します。緑色のニューロンは各文の種類(次元)を表し、最終的には黒色のニューロンが質問に答えるのに役立ちます。 ネットワーク構造 DCM ネットワークは、各文を読み取り、特定のルールセットに従って接続を行うことで成長します。 最初のルールは、類似したニューロンの接続を繰り返すことです。 このルールの唯一の例外は、コンテンツ トラッキングに従う黒ニューロンです。 2 番目のルールは、イベントとオブジェクトの接続 (赤から青) です。 ネットワークの成長は、システムによって読み取られるコンテンツの量に正比例します。 全体を読んだ後、最終的なネットワークは複数のレイヤー、複数のネットワーク (高速道路と呼ばれる) になります。 基本的に主要な高速道路は 4 つあります (黒、赤、青、オレンジ)。 最終的なネットワークはさらに処理され、繰り返されるニューロンが個々のニューロンに圧縮されました。 この最終プロセスでは、各イベント コンセプトが多数の機器に接続されたイベント ベースのオントロジーが生成されます。 リコールプロセスでは、特定の質問 (または文) に最も一致する概念を見つけるために 4 つの高速道路を通過する必要があります。推論を通じて質問の答えとして最後の黒いニューロンを見つけます。 要約する ディープラーニングとディープクローニングの比較は次のとおりです。
ディープクローニングに必要なデータはコンテンツ知識のみですが、ディープラーニングでは言語検出と長いトレーニングサイクルのために大量のデータが必要になる場合があります。 |
<<: フロントエンドの面接でよく聞かれるアルゴリズムに関する質問
>>: テックネオテクノロジーサロン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
今日のデータセンター業界は、AI テクノロジーの急速な普及、ムーアの法則の減速、そして厄介な持続可能...
機械学習への関心は過去 10 年間で爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエン...
2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...
AI が人間の活動に取って代わるかどうかについての議論が激化するにつれ、データ サイエンティストは ...
技術の複雑さが年々増すにつれ、科学的な革新と発見への扉がより多くの分野に開かれています。現在の問題は...
[[214541]] 2017 年は、ウォール ストリート ジャーナル、フォーブス、フォーチュンなど...
米国のメリーランド大学の研究者4人が、GoogleのキャプチャシステムReCaptchaを解読できる...
皆さんご存知のとおり、2013年以来、我が国は世界最大の産業用ロボットの需要と応用市場となっています...
最も注目されているテクノロジー企業OpenAIと世界一の富豪マスク氏との壮大な戦いは新たなレベルに達...