機械学習は言語から意味を抽出するのにまだ苦労している

機械学習は言語から意味を抽出するのにまだ苦労している

私たちは幼児期から言語を吸収し始めます。簡単な単語は1年目か2年目に出てきます。 6 歳までに語彙は数千語増え、10 代になると 10 万語を超える単語を学習します。しかし、言語は人間が生まれながらに持つ能力ですが、機械にとっては非常に困難です。

[[421700]]

これは、機械にとって簡単なことは人間にとって難しいことであり、その逆もまた真なりであるというモラベックのパラドックスの典型的な例です。ソフトウェアは、大規模な集合に対する数学的演算を迅速かつ完璧に計算できますが、周囲の環境内の物体を識別したり、言語を理解したりするなど、人間の日常的な活動には苦労します。人間と同じように自然言語を理解するソフトウェアの開発には多くの取り組みが行われていますが、依然として大きな課題が残っています。

数字ではなく言葉

過去 20 年間で、あらゆる形式で生成および収集されるデータの量は爆発的に増加しました。大まかに言えば、このデータは構造化データと非構造化データの 2 つのカテゴリに分類されます。構造化データはデジタル化され、整理されており、定義上、数学演算の基本的な入力となります。機械学習 (ML) とデータ処理機能の全体的な成長のおかげで、AI は、潜在的な機械の故障から不正の検出まで、あらゆるものについて構造化データから予測的な洞察を生成する点で着実に進歩しました。データを数値的に表現し、構造化できれば、機械学習による洞察を得られる可能性があります。

しかし、デジタル技術の進歩により、画像、動画、言語データなどの非構造化データも大幅に増加しました。この点では、従来の機械学習ベースの自然言語処理 (NLP) 技術では不十分です。言語はデータ集約型であり、使用方法に応じて豊富な潜在的情報を持ちます。

思考訓練として、「bat」などの一般的な単語の意味と用途の数を単純にリストアップします。これらの意味は文脈から生まれます。言語学者 R.J. ファースは、「単語にはどのような仲間がいるかを知っておくべきだ」と書いています。言語のこうした本質的な要素により、数学的手法を適用して自然言語の意味を真に理解することは非常に困難になります。しかし、言語機械学習に対する万能アプローチには、より根本的な欠点、つまり知識問題があります。

知識の問題

幅広いビジネスをサポートし、それぞれの分野に固有の複雑な言語のドキュメントを扱う現実の世界では、言語の課題はさらに複雑になります。定義上、これらは言語をより複雑にするエッジケースです。機械学習モデルは、トレーニングに使用したデータを通じてのみ世界について学習し、複雑で多くの場合不透明なアルゴリズム(多くの AI アプローチに特徴的な有名な「ブラック ボックス」)を通じて結果を導き出します。

実用的なソリューションを提供する作業の多くは、データ セットが十分に大きく、主題の専門家が何年もの経験とトレーニングを経てのみ識別できる情報を取り込むのに十分な代表性を備えていることを保証することにかかっています。多くの場合、このような大量のトレーニング データは利用できません。現実世界は時間の経過とともに変化し、モデルを再トレーニングする必要があることを考えると、これは継続的な取り組みでもあります。

GPT-3 のような大規模言語モデルにおけるよく知られた進歩でさえ、この複雑さについて楽観的になる理由はほとんどありません。これらのモデルはトレーニングに膨大なデータセットに依存しており、比較的単純な言語のケースを処理できます。しかし、特定の領域における実質的な基盤が欠如しているため、経験と知識のある人が意図、文脈、意味を理解するために使用する方法からは遠く離れています。

全体は部分の総和よりも大きい

機械学習手法の力と、ビジネスの専門家が長年にわたって培ってきた知識に基づくアプローチを組み合わせる必要性がますます認識されつつあります。シンボリック AI として知られるこれらの知識ベースのアプローチは、人間が特定の分野の習熟度を高める方法と同様に、知識を埋め込む技術に依存しています。

シンボリックアプローチでは、結果が知識の明示的な表現に関連付けられるため、解釈可能性という追加の利点が得られます。実際、シンボリック手法は人工知能における自然言語理解に使用された最初の技術であり、最近の機械学習手法に必要な補完技術としてますます認識されるようになっています。

学習と知識のアプローチを組み合わせることで、説明可能なドメインと結果に関連する洞察とともに、大規模な深い理解を生み出す能力が得られます。この「ハイブリッド」アプローチにより、言語に埋め込まれた関連情報がスケーラブルな方法でキャプチャおよび配信され、より迅速でスマートかつ一貫性のある意思決定が可能になり、人々がより良く仕事をする(よりプロフェッショナルになる)ことが可能になります。究極的には、ここが企業が競争し、最高のテクノロジーが発揮される場なのです。

<<:  米裁判所、人工知能コンピューターは発明を特許できないと判決

>>:  プログラマーに必要ないくつかの一般的なソートおよび検索アルゴリズムの概要

ブログ    
ブログ    

推薦する

ディープラーニングの限界を理解していますか?

[[205696]]簡単なコメント: AI、機械学習、ディープラーニングは近年注目されている分野で...

機械学習で画像の色を復元する方法

[[217139]]この記事では、k-means アルゴリズムを使用して画像の色を復元することを提案...

機械学習とディープラーニングの5つの主な違い

前回のシリーズの記事「機械学習とディープラーニングの違いは何でしょうか?」に続き、簡単に説明した後、...

人工知能、機械学習、アルゴリズムが施設・資産管理に与える影響

急速に進化する今日のテクノロジーの世界では、「人工知能」、「機械学習」、「アルゴリズム」などの用語が...

プログラマーの面接でよく聞かれる質問: スケジュールされたタスク スケジューラを設計し、どのようなアルゴリズムとデータ構造を使用するか

学生時代、私は Huya の面接を受けたことがあります。今でもはっきりと覚えている面接の質問がありま...

クラッシュラマ2!マイクロソフトの13億パラメータphi-1.5は、単一のA100でトレーニングされ、SOTAを更新します

モデルが大きくなれば機能も増えるのでしょうか?しかし、そうではありません。最近、マイクロソフトの研究...

お茶や水を出すロボットを購入する見込みはありますか?メタとニューヨーク大学がOK-Robotを開発

「xx、テレビ台のリモコンを取ってきて。」 家庭環境では、多くの家族が必然的にこの種の作業を命じられ...

変革管理における生成AIの課題

AI が社会に重大なリスクをもたらすという警告が見出しで報じられているにもかかわらず、ボストン コン...

顔認識、マルチターゲット追跡…Suningのスマートストアのその他のブラックテクノロジーを公開!

[51CTO.comからのオリジナル記事] インターネット+の急速な発展に伴い、オフライン小売業界...

C# バイナリ ツリー トラバーサル アルゴリズムの実装の簡単な分析

C# アルゴリズムは、バイナリ ツリーの定義、既知のバイナリ ツリーの構築方法、および C# でバイ...

2018年のAIトレンドはこちら

ビッグデータの計算分析は決して時代遅れではありません。それどころか、データ量が増え続けるにつれて、デ...

IIoTとAIは大きな課題に直面している

AI は IIoT から生成される膨大な量のデータを管理できるため、その基盤となるアーキテクチャはセ...

OpenAI、リーダーシップ争いの末に新事業GPTストアを立ち上げ

ChatGPT Team は OpenAI の Enterprise Edition 製品の小型版で...

...