ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

[[200112]]

編集者注: チャットボットは目新しいものではありません。Facebook や Microsoft などの多くの主要プラットフォームには独自のチャットボットがあります。しかし、チャットボットの開発はボトルネックに遭遇したようです。この記事の著者である Riza C. Berkan 博士は、チャットボット分野で直面している問題を技術的な観点から解決する方法について論じています。

会話型AI（チャットボット）には、（1）言語スキル（2）知識獲得（3）会話行動という3つの側面の問題が関係しています。これら 3 つは強く相関していますが、人間の脳は、別々の実験や異なる期間でこれらの利点を得るために異なる神経領域を使用する可能性があります。したがって、プロセス全体のコンピュータモデルを開発するには、個別の処理と分散アプローチも必要になります。

ディープラーニングは、機能すると思われるモデルを提供します。ただし、多数のデータ要件に対応するために、すべてのデータを単一のスキーマに統合します。これは、読書による学習方法とも矛盾しています。ディープラーニングとは異なり、新しい記事を読むたびに言語スキルを再学習するわけではありません。言語と知識を別々に扱い、後者が前者と混ざることなく成長できるようにすることは可能でしょうか? もし可能であれば、この半独立性をどのようにシミュレートできるでしょうか?

Deep Cloning Method (DCM) という新しい手法を紹介します。これらの技術的な詳細は独自のもの（特許出願中）ですが、このアプローチには実験する価値のある他の多くのバリエーションが存在する可能性があります。

ディープクローン

DCM は、会話型 AI 専用に設計された新しい機械学習手法です。「ディープ」という用語は、その多層構造のアーキテクチャに由来しています。「クローニング」という用語は、知識を元のドメインから会話システムに転送すること（ドキュメントをチャットのトランスクリプトに変換すること）を指します。 DCMは（1）言語能力と（2）知識獲得を分離しますが、（3）会話行動を別々に扱うことはありません。 DCM は人間の脳の読み取りプロセスにヒントを得たもので、学習は言語実験 (教師あり) ではなく、直接読み取り (教師なし) を通じて行われます。 DCM は、与えられたコンテンツを文ごとに処理し、各文を概念に分解し、大規模なネットワークを通じてこれらの概念が互いにどのように関連しているかを学習します。いくつかのサンプルチャットボットはこのアプローチを使用して開発されており、編集を通じてのみ DCM が読み取れるコンテンツを入力できます。ディープクローニングとディープラーニングの比較は次のとおりです。

神経構造

DCM の核となる革新は、人工言語ニューロンの概念です。このアイデアは生物学からヒントを得たもので、脳の特定の領域には、他の領域が画像や他の感覚に敏感であるのと同様に、言語入力に敏感なニューロンが含まれていることが知られています。さらに、言語に敏感なニューロンも、言語の役割と互換性のある異なる構造を持つ可能性があります。

一方、ディープラーニングではどのアプリケーションでも同じニューロンが使用され、典型的なニューロンを下の図に示します。さまざまなネットワークのニューロンモデルにはバリエーションがありますが、いずれも自然言語処理に関係する特定の役割とは関係がありません。これらのニューロンには、入力層から伝播されるデジタル入力が必要です。したがって、この操作が適切に機能するためには自然言語を数値に変換する必要があり、このアプローチによっては、この変換が無意味になる可能性があります。

DCM では、分解プロセスを通じて 6 つの異なるニューロンタイプが識別されました。黒いニューロンはコンテンツ（文章）を表し、赤いニューロンはイベントの概念を表し、青いニューロンはオブジェクト（会話のトピック）を表します。緑色のニューロンは各文の種類（次元）を表し、最終的には黒色のニューロンが質問に答えるのに役立ちます。

ネットワーク構造

DCM ネットワークは、各文を読み取り、特定のルールセットに従って接続を行うことで成長します。最初のルールは、類似したニューロンの接続を繰り返すことです。このルールの唯一の例外は、コンテンツトラッキングに従う黒ニューロンです。 2 番目のルールは、イベントとオブジェクトの接続 (赤から青) です。ネットワークの成長は、システムによって読み取られるコンテンツの量に正比例します。

全体を読んだ後、最終的なネットワークは複数のレイヤー、複数のネットワーク (高速道路と呼ばれる) になります。基本的に主要な高速道路は 4 つあります (黒、赤、青、オレンジ)。最終的なネットワークはさらに処理され、繰り返されるニューロンが個々のニューロンに圧縮されました。この最終プロセスでは、各イベントコンセプトが多数の機器に接続されたイベントベースのオントロジーが生成されます。リコールプロセスでは、特定の質問 (または文) に最も一致する概念を見つけるために 4 つの高速道路を通過する必要があります。推論を通じて質問の答えとして最後の黒いニューロンを見つけます。

要約する

ディープラーニングとディープクローニングの比較は次のとおりです。

ディープラーニングには、オントロジー処理を必要とする個別のステップに分解されないという利点があります。
ディープクローニングは分解プロセスの品質に依存します。
ディープクローニングには、データサイズが小さく、単一ステップで収束できるという利点があります。
ディープラーニングはブラックボックスですが、ディープクローニングは透過的で即座に変更できます。

ディープクローニングに必要なデータはコンテンツ知識のみですが、ディープラーニングでは言語検出と長いトレーニングサイクルのために大量のデータが必要になる場合があります。

<<: フロントエンドの面接でよく聞かれるアルゴリズムに関する質問

>>: テックネオテクノロジーサロン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究

Baidu AIの新インフラが2020 CIFTISでデビュー、最新の人工知能成果をパノラマ展示

ブログ

機械学習は科学プロジェクトからビジネスプランまで3段階の戦略を完了します

ブログ

データコレクターでリアルタイム機械学習に TensorFlow を使用する方法

ブログ

ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

Baidu AIの新インフラが2020 CIFTISでデビュー、最新の人工知能成果をパノラマ展示

Baidu Cloud ABC3.0がリリースされ、Baidu Brain、Apollo、DuerOSが共同でBaidu AI3.0を構築

Omdia: 2024 年に注目すべき主要な AI トレンド

2021 年に検討すべき 15 のデータサイエンスツール

人工知能を製造業に統合するのはどれくらい難しいのでしょうか?私の国のAI人材不足は30万人に達する

機械学習は科学プロジェクトからビジネスプランまで3段階の戦略を完了します

データコレクターでリアルタイム機械学習に TensorFlow を使用する方法

推薦する

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

メタは商業用人工知能に注力するためタンパク質折り畳みチームを解散すると報道

スタンフォード大学の博士が独力で注意力を9倍に加速！ FlashAttention はビデオメモリを消費し、Transformer のコンテキストの長さが劇的に増加します

ドローンが田舎に飛来、その価値は想像もできない

顔認識だけでなく、「心を読む」こともできます。このような AI は好きですか?

AIによる朗読がオーディオブック市場に影響、声優の仕事が脅かされる

人々が家に座っていて、車が道路を走っています。自動運転は信頼できるのでしょうか?

将来のシステム設計のための機械学習

マジックGPTは、1秒あたり1クロスの速度でオンライン記事を自動的に書き込み、宦官の作品に無制限の更新を提供することもできます。

AIインテリジェントボディがビッグモデルを巻き上げる！ AutoGPT と他の 4 つの主要エージェントが競争、「ウエストワールド」のソフトウェア 2.0 になるのはどれでしょうか?

指紋、顔、音声認識技術は、本当に簡単に解読できます。