コード不要で再利用可能な AI が AI の溝を埋める方法

著者: ミシェル・ゾウ

翻訳：李睿

企画丨孫淑娊

[51CTO.com クイック翻訳]事前に構築された AI ソリューションとコンポーネントを再利用し、コーディングなしでカスタマイズすることで、最終的には、企業は AI の専門家を雇用したり、高価な IT リソースを採用したりすることなく、AI ソリューションを作成できるようになります。

1960 年、人工知能技術の先駆者であり MIT 教授でもある JCR リックライダーは、「人間とコンピュータの共生」と題する独創的な論文で未来の世界を次のように描きました。「意図された共生関係において、人間は目標を設定し、仮説を立て、基準を決定し、評価を行います。コンピュータはプログラムされた作業を完了し、技術的および科学的思考における洞察と決定への道を開きます。」

今日の世界では、そのようなコンピューターは「AIアシスタント」と呼ばれています。しかし、AI アシスタントの開発は複雑で時間のかかるプロセスであり、AI アシスタントのトレーニングに必要な膨大な量のデータを収集、クリーニング、注釈付けする作業は言うまでもなく、深い AI の専門知識と高度なプログラミングスキルが必要です。したがって、AI アシスタントの全部または一部をさまざまなアプリケーションやドメインで再利用することが非常に重要です。

AIが人間のスキルを学ぶのは難しい

AI アシスタントのトレーニングは困難です。なぜなら、AI アシスタントは人間と連携して、医療処置の決定やキャリアガイダンスの提供などの意味のあるタスクの完了を支援するために、特定の人間的スキルを備えている必要があるからです。

人工知能は人間の言語を学ばなければならない

おそらく、AI アシスタントが人間を本当に助けるために習得しなければならない最も重要なスキルは、人間の言語です。これにより、AI はユーザーと対話し、自然言語入力を解釈し、自然言語でユーザーの要求に応答できるようになります。しかし、機械に人間の言語を学習させることは、いくつかの理由から簡単ではありません。

まず、人間の表現は非常に多様かつ複雑です。図１に示すように、例えば、ＡＩアシスタント（ＡＩチャットボットまたはＡＩ面接官とも呼ばれる）が自由形式の質問を使用して求職者に面接するアプリケーションでは、そのような質問に対する求職者の応答は多様かつ複雑である。

図 1. 就職面接で自由形式の質問をする AI アシスタント (「仕事で直面する最大の課題は何ですか?」)。求職者の反応は非常に多様かつ複雑であるため、AIがそのような反応を正しく認識して対応できるように訓練することは非常に困難です。

第二に、求職者は、説明を求める質問をしたり、無関係な回答をしたりすることで、話題から逸れてしまう可能性があります。以下の例 (図 2) は、上記と同じ質問に対する候補者のトピック外の回答を示しています。会話を続けるには、AI アシスタントがそのような応答を正しく認識して処理する必要があります。

図 2. 会話を続けるには、AI アシスタントはユーザーからの 3 種類の話題外の応答を認識し、正しく処理する必要があります。

第三に、ユーザーの表現は曖昧または不完全である可能性があります（図3）。

図3. AIの質問に対するユーザーの曖昧な応答を示す例

人工知能は人間のソフトスキルを学ばなければならない

機械が人間のスキルを習得することをさらに困難にしているのは、AI が人間の有能なアシスタントになるために人間のソフトスキルも習得する必要があることです。ソフトスキルを備えた優秀な人間のアシスタントと同様に、AI は人間の感情を読み取り、デリケートな状況で共感を示すことができなければなりません。

一般的に、AI に人間のスキル (言語スキル、ソフトスキルなど) を学習させることは、主に次の 3 つの理由から困難です。

まず、AI をトレーニングするにはどのような方法やアルゴリズムが必要か、またそれらをどのように実装するかを把握するには、AI の専門知識と IT プログラミングスキルが必要になることがよくあります。

たとえば、図 1 および 2 に示すように、自由形式の質問に対するユーザーの非常に多様で複雑な応答に AI が正しく応答するようにトレーニングするには、どの自然言語理解 (NLU) 手法 (データ駆動型ニューラルメソッドを使用できるなど) または機械学習手法 (教師あり学習または教師なし学習など) を使用できるのかを知る必要があります。さらに、データを収集し、そのデータを使用してさまざまな NLU モデルをトレーニングし、さまざまなトレーニング済みモデルを接続するためのコードを記述する必要があります。 AI の専門家である Ziang Xiao 氏らがこの研究論文で説明しているように、プロセス全体は非常に複雑で、多くの AI の専門知識とプログラミングスキルが必要です。これは、既製の機械学習手法を使用する場合にも当てはまります。

第二に、AI モデルをトレーニングするには、十分なトレーニングデータが必要です。上記の例を使用して、Ziang Xiao らは、自由形式の質問ごとに数万件のユーザー応答を収集し、AI アシスタントがインタビューの会話でそのような質問を使用できるようにトレーニングしました。

第三に、研究で説明されているように、AI アシスタントをゼロからトレーニングすることは、多くの場合、反復的で時間のかかるプロセスです。このプロセスには、データの収集、データのクリーニングと注釈付け、モデルのトレーニング、トレーニング済みモデルのテストが含まれます。トレーニングされたモデルのパフォーマンスが良好でない場合は、トレーニングされたモデルが適格になるまでプロセス全体を繰り返す必要があります。

しかし、ほとんどの組織には社内に AI の専門知識や高度な IT チームがなく、AI アシスタントのトレーニングに必要な膨大な量のトレーニングデータもありません。これにより、そのような組織が AI ソリューションを導入することが困難になり、AI 格差が生じる可能性があります。

多階層の再利用可能なモデルベースの認知AI

AI を広く導入するための 1 つの解決策は、直接再利用したり、さまざまなアプリケーションに合わせてすばやくカスタマイズしたりできる、事前トレーニング済みの AI モデルです。モデルをゼロから完全に構築するよりも、エンジン、ホイール、ブレーキ、その他の部品から車を組み立てるのと同じように、既成の部品からモデルを組み立てる方が簡単で迅速です。

AI アシスタントの構築の文脈において、図 4 は、3 層の AI コンポーネントが積み重ねられたモデルベースの認知 AI アーキテクチャを示しています。各レイヤーの AI コンポーネントは、事前にトレーニングまたは構築して再利用したり、簡単にカスタマイズしたりして、さまざまな AI アプリケーションをサポートできます。

図4. 複数のレベルで再利用可能なAIを備えたモデルベースのコグニティブAIアーキテクチャ

事前学習済みのAIモデルとエンジン（AIアシスタントの基礎）を再利用

AI アシスタントを含むすべての AI システムは、AI/ML モデル上に構築されます。モデルは、その目的やトレーニング方法に基づいて、主に 2 つのカテゴリに分類できます。

さまざまな AI アプリケーションで使用できる汎用 AI モデル。
トレーニング済みの専用 AI モデルまたはエンジン固有の AI アプリケーション。会話エージェントは汎用 AI の例であり、物理ロボットは特殊用途 AI の例です。

人工知能または機械学習モデルには、データ駆動型ニューラルネットワーク (学習モデル) またはシンボリックモデルが含まれます。たとえば、BERT と GPT-3 は汎用のデータ駆動型モデルであり、多くの場合、Wikipedia などの大量の公開データで事前トレーニングされています。これらは、自然言語表現を処理する AI アプリケーションで再利用できます。対照的に、有限状態マシンなどのシンボリック AI モデルは、構文パーサーとして使用して、ユーザー入力からの日付や名前などの特定の概念 (エンティティ) など、より正確な情報を識別して抽出できます。

さまざまな理由から、一般的な AI モデルは特定の AI アプリケーションを強化するには不十分であることがよくあります。まず、このようなモデルは一般的なデータでトレーニングされるため、ドメイン固有の情報を説明できない可能性があります。図 5 に示すように、事前トレーニング済みの汎用 AI 言語モデルは、表現 B が表現 A に似ていると「考える」可能性がありますが、人間は、B が実際には表現 C に似ていることを認識します。

図 5. 事前トレーニング済み言語モデルの欠落部分を示す例。この場合、汎用データで事前トレーニングされた言語モデルは、表現 B を表現 A に類似していると解釈し、表現 C に類似していると解釈します。

さらに、一般的な AI モデルは、会話の管理や会話からのユーザーのニーズや要望の推測など、特定のタスクを本質的にサポートしていません。したがって、特定のアプリケーションをサポートするには、専用の AI モデルを構築する必要があります。

たとえば、チャットボットの形で認知 AI アシスタントを作成する場合を考えてみましょう。 Cognitive AI アシスタントは、一般的な AI モデルに基づいて構築されており、ユーザーとの効果的かつ効率的なやり取りを保証するために 3 つの追加の Cognitive AI エンジンを搭載しています。特に、アクティブリスニング対話エンジンにより、AIアシスタントはシナリオ内の不完全で曖昧な表現も含めてユーザーの入力を正しく解釈できるようになります（図6a）。また、AI アシスタントは、任意のユーザー中断を処理し、会話のコンテキストを維持してタスクを完了できるようになります (図 6b)。

図6a. 認知AI会話エンジンが、異なる応答シナリオで同じユーザー入力を処理する方法を示す例

図6b. 認知AI会話エンジンが会話中のユーザーの中断を処理し、コンテキストとチャットフローを維持する方法を示す例

会話エンジンが生産的なやり取りを保証する一方で、パーソナルインサイト推論エンジンは各ユーザーをより深く理解し、より深くパーソナライズされたエンゲージメントを可能にします。個人の学習仲間や個人の健康アシスタントとして機能する AI アシスタントは、ユーザー固有の個性的な特性に基づいて、ユーザーが学習や研究のコースを継続するように促すことができます (図 7)。

さらに、会話に特化した言語エンジンにより、AI アシスタントは会話中にユーザーの表現をより適切に解釈できるようになります。たとえば、感情分析エンジンはユーザー入力に表れた感情を自動的に検出し、質問検出エンジンはユーザー入力が質問なのか AI アシスタントからの応答を必要とするリクエストなのかを識別できます。

ここで説明した AI モデルやエンジンを構築するには、多大なスキルと労力が必要です。したがって、このようなモデルとエンジンを再利用可能にすることが非常に望ましいです。慎重に設計および実装すれば、ここで説明したすべての認知 AI エンジンを再利用できます。たとえば、アクティブリスニング会話エンジンは、会話データを使用して事前にトレーニングされ、さまざまな会話シナリオ (ユーザーが言い訳をしたり、質問を明確にしたりする場合など) を検出できます。エンジンは最適化ロジックを事前に構築し、ユーザーの中断を処理する際に常にユーザーエクスペリエンスとタスクの完了のバランスを取るようにすることができます。

同様に、項目反応理論 (IRT) とビッグデータ分析を組み合わせることで、個人のコミュニケーションパターンと固有の特性 (社会的行動や実際の職場関係のパフォーマンスなど) を捉えたデータに基づいて、パーソナルインサイトエンジンを事前にトレーニングできます。会話が自然言語で行われている限り、このエンジンを再利用して、あらゆる会話における個人的な洞察を推測することができます。

事前に構築されたAI機能ユニット（AIアシスタントの機能）を再利用

一般的な AI モデルと特定の AI エンジンは AI アシスタントに基本的なインテリジェンスを提供できますが、特定のタスクを完了したり特定のサービスを提供したりするには、完全な AI ソリューションが必要です。たとえば、AI 面接官が特定のトピックについて求職者と会話する場合 (図 1 を参照)、その目的は、そのトピックに関する関連情報を求職者から取得し、収集した情報を使用して求職者が職務に適しているかどうかを評価することです。

したがって、特定のタスクやサービスをサポートするには、さまざまな AI 機能ユニットが必要です。認知 AI アシスタントのコンテキストでは、サービスはユーザーと対話し、ユーザーのニーズを満たします (例: トランザクションの完了)。たとえば、トピック固有の AI 通信ユニットを構築し、それぞれのユニットで AI アシスタントが特定のトピックに関してユーザーと通信できるようにすることができます。したがって、ダイアログライブラリには、それぞれが特定のタスクをサポートする複数の AI 通信ユニットが含まれます。

図 7 は、AI アシスタントが特定のトピックについてユーザー (たとえば、求職者) と会話できるようにする AI 通信ユニットの例を示しています。

図 7. たとえば、AI アシスタントがユーザーと特定のトピックについて話し合うことを可能にする AI コミュニケーションユニットを見てみましょう。これには、AI アシスタントがディスカッション中のユーザーのアクションに基づいて実行できる複数の条件付きアクション (応答) が含まれます。ここでは、事前トレーニング済みの言語モデル（アーキテクチャの下部2層で説明したモデルなど）を使用して、ユーザーのアクションを検出し、AIアクションを生成することができます。

モデルベースのアーキテクチャでは、AI 機能ユニットを事前にトレーニングして直接再利用できます。新しい条件と対応するアクションを組み込むことで、それらを組み合わせたり拡張したりすることもできます。

事前に構築された AI ソリューション (AI アシスタント) の再利用

モデルベースのコグニティブ AI アーキテクチャの最上位層は、エンドツーエンドの AI ソリューションテンプレートのセットです。認知 AI アシスタントを作成するという観点から、この最上位レイヤーはさまざまな AI アシスタントテンプレートで構成されます。これらのテンプレートは、AI アシスタントが実行する特定のタスクフローと、対話プロセス中に AI 機能をサポートする関連知識ベースを事前に定義します。たとえば、AI 就職面接テンプレートには、AI アシスタントが求職者と会話するための一連の面接質問と、一般的な仕事関連の質問に答えるためのナレッジベースが含まれています。同様に、AI パーソナルヘルスマネージャーテンプレートでは、健康状態の確認やケアの指示やリマインダーの提供など、AI アシスタントが実行する必要がある一連のタスクの概要を記述できます。

このようなテンプレートは、AI アシスタントを作成するために直接再利用でき、特定のニーズに合わせてすばやくカスタマイズすることもできます。

再利用可能なAIはコード不要のAIを実現する

再利用可能な AI コンポーネントまたはシステムは、AI ソリューションを作成する際の時間と労力を節約するだけでなく、再利用可能なコンポーネントをコードなしで迅速にカスタマイズすることも可能にします。すべての AI ソリューションにはカスタマイズが必要になる可能性があるため、ノーコード AI は AI の導入をさらに促進し、AI システムの市場投入までの時間を短縮します。コーディングなしでカスタマイズ可能で再利用可能な AI コンポーネントの例をいくつか示します。

人工知能ソリューションテンプレートコード不要のカスタマイズ

人事採用担当者が AI 面接官を作成したいとします。採用担当者は、テンプレート内の面接の質問や仕事に関するよくある質問を編集して AI 面接担当者テンプレートを再利用し、カスタマイズされた AI 面接担当者を構築できます (図 8a)。テンプレートの再利用とコード不要のカスタマイズにより、特にコーディング方法を知らない、または高度な IT スキルを持たない従業員にとって、エンドツーエンドの AI ソリューションの作成が大幅に簡素化されます。

図 8a. AI 面接官テンプレートをコードなしでカスタマイズし、人事採用担当者が作成した特定の質問を AI が尋ねられるようにします。ここで、採用担当者は「現在の仕事で一番好きなことは何ですか？」という質問を追加し、既存のAIコミュニケーションユニットがこのトピックに関する議論を自動的に処理します。

人工知能機能ユニットのコードフリーカスタマイズ

上記の例を続けると、採用担当者が AI 面接官に求職者に「現在の仕事で一番好きなことは何ですか？」と質問してもらいたいとします。応募者が「顧客とのやり取りです」と答えた場合、採用担当者は AI 面接官に「顧客とのやり取りで楽しかった経験を教えてください」というフォローアップの質問をしてもらいたいと考えています。

この特定の状況に対処するための事前に構築された AI 通信ユニットは存在しないため、採用担当者は AI 通信をカスタマイズする必要があります。図 8b に示すように、採用担当者は、ユーザーの応答と、フォローアップの質問を含む対応する AI 面接官のアクションを示すことで、これを簡単に実行できます。同様に、すべてのカスタマイズはコーディングなしで実行できます。

図8b. AI通信ユニットのコードフリーカスタマイズ。ここで、ユーザーが「現在の仕事で一番好きなことは何ですか？」という質問に対して、「顧客とのやり取り」などと答えると、AI面接官が回答し、フォローアップの質問をしてくれます。

上記の例は、再利用可能な AI テンプレートまたはコンポーネントをコードなしでカスタマイズすることで、IT に詳しくない人でもカスタマイズされた AI ソリューションを迅速に作成できることを示しています。

コード不要で再利用可能なAIの未来

コード不要で再利用可能な AI により、AI スペシャリストを雇用したり、高価な IT リソースを使用したりすることなく、強力な AI ソリューションの作成と導入が民主化されます。コード不要の再利用可能な AI が AI ソリューションの開発と導入の主要モデルになるためには、複数の分野で進歩を遂げる必要があります。

最初の領域は、再利用可能な AI コンポーネントとシステムを説明可能にすることです。 IT 部門以外の担当者が、事前トレーニング済みまたは構築済みの AI コンポーネントやソリューションを再利用できるようにするには、「ブラックボックス」を開いて、各コンポーネントまたはソリューションの内部に何が含まれているのか、その長所と短所も含めて説明することが重要です。説明可能で再利用可能な AI は、人間が既存の AI コンポーネントとシステムをよりよく理解して活用するのに役立つだけでなく、潜在的な AI の落とし穴を回避するのにも役立ちます。たとえば、この AI 機能を使用して求職者に関する洞察を推測する前に、人事採用担当者が個々の洞察を推測する方法を理解しておくと役立ちます。

2 番目の側面は、自動 AI デバッグをサポートすることです。 AI ソリューションがより洗練されるにつれて、多様で複雑な状況における潜在的な AI の動作を手動で検査することが難しくなります。特に、IT 以外のユーザーは、正式な導入前に AI ソリューション (AI アシスタントなど) を評価し、改善するための支援を必要としています。 AI アシスタントの分析についてはいくつかの予備的な研究が行われていますが、将来的にはさらなる研究を行う必要があります。

3 番目の領域は、特に AI の民主化に照らして、AI の責任ある使用を確保することです。たとえば、誰かが AI 機能ユニットを再利用してユーザーから機密情報を取得できる場合、ユーザーとその機密情報を誰がどのように保護するのでしょうか。精度や堅牢性などの一般的な AI パフォーマンスを測定するだけでなく、信頼性が高く安全な AI ソリューションの作成と展開を確実にするために、新しい対策と使用ガイドラインを採用する必要があります。

原題: コード不要の再利用可能な AI が AI の格差を埋める方法、著者: ミシェル・ゾウ

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: 研究者は人工知能を使ってSARS-CoV-2のような次のウイルスを見つける

>>: トランスフォーマーは新たな覇者となったのか？ FAIRらは純粋な畳み込みConvNetを再設計し、より良いパフォーマンスを達成した。