人工知能の3つの段階：統計学習から文脈適応へ移行中

物事が急速に進んでいるときは、立ち止まって自分がどこにいるのかを振り返ることが必要になることがよくあります。そうしないと、細かいことに夢中になりやすくなります。人工知能の基盤となるデータ技術は、さまざまな形で急速に進歩しています。したがって、転職したり、AI を使用してビジネスを拡大したりする前に、まず AI を俯瞰して、現在の状況と今後の方向性を理解しましょう。

[[195779]]

人工知能の3つの段階

私たちは、人工知能を何か新しいもの、特にディープラーニングに関連する新しい技術や新しいスキルとして考える傾向があります。しかし、AI は数十年にわたって開発が進められており、テクノロジーは常に前進しているため、過去の成功を否定するのは非論理的に思えます。

AI を他の人に説明するのに苦労しているとき、私たちが長い間行ってきた予測分析と AI の一般的な見方との間に境界線があることに気づき続けています。最近、DARPA の情報イノベーションオフィスのディレクターであるジョンローンチベリーが書いた「AI の 3 つの波」という本を読みました。彼は、より長期的かつ広い視点から、人工知能の歴史と未来を 3 つの段階に分けています。

1. 手作りの知識

2. 統計学習フェーズ

3. 文脈適応段階

ローンチベリーの視点は私に大いに役立ちました。時代の比喩は便利ですが、一つの時代が終わり、その代わりに次の時代が始まるという意味だと誤解されやすいです。対照的に、私は AI をピラミッドとして捉えており、次の開発段階は前の段階を基盤として構築されます。これは、最も古い AI テクノロジーでさえ時代遅れではなく、実際にまだ使用されていることを明確に示しています。

現在私たちがいる第 2 段階の統計学習については、第 2 段階には別々に説明する価値のある大きな進歩がいくつかあるため、さらに詳細な段階に分割しました。

ステージ1: マニュアルの知識

最初の段階は「エキスパートシステム」に代表されます。これは、人間の知性を高めるために中小企業のチームが慎重に開発した意思決定ツリーに大量の知識を変換します。エキスパートシステムの代表的な例としては、TurboTax やスケジュール作成を行うロジスティクスプログラムなどが挙げられます。これらは 1980 年代、おそらくそれ以前から存在していました。

回帰、SVM、ランダムフォレスト、ニューラルネットワークなどの機械学習統計アルゴリズムを使用する能力は 1990 年代以降急速に拡大しましたが、手作りのシステムの使用が完全になくなったわけではありません。ローンチベリー氏は最近、サイバー攻撃の防御に成功したシステムの応用例について言及した。 2004 年頃までに、同様のシステムが実際に自動運転車の中核となりました (主に現実世界のあらゆる問題に対応できなかったために失敗しました)。

ローンチベリーは、エキスパートシステムは推論の性能は優れているが、厳密に定義された少数の問題に限定されており、学習能力がなく、不確実性に対処できないと考えていました。

フェーズ2: 統計学習

私たちは今、第二段階にいます。 Launchbury はディープラーニングの進歩に焦点を当てる傾向がありますが、コンピューターを使用してデータ内の信号を探すようになって以来、私たちは実際には第 2 段階にいます。統計学習の段階は数十年前に始まりましたが、1990 年代に勢いを増し、新しいデータ、ボリューム、さらにはデータストリームを処理することで拡大し続けています。

統計学習フェーズでは、深層学習技術のツールボックス（回帰、ニューラルネットワーク、ランダムフォレスト、SVM、GBM など）の拡大により、データ内の信号を見つける能力が爆発的に向上しました。

これは、今後もなくなることのない基本的なデータサイエンスの実践であり、消費者 (なぜ来たのか、なぜ留まったのか、なぜ去ったのか)、トランザクション (不正行為があったか)、デバイス (問題はあったか)、データフロー (30 日間でその価値はいくらか) に関するすべての行動に関する質問を説明します。統計学部は、進化する人工知能分野の一環として、人間の知能の向上に取り組んでいます。

第 2 段階では、少なくとも 2 つの大きな進歩により、人間の能力が大幅に向上しました。 1 つ目は Hadoop とビッグデータです。現在では、大規模で非構造化かつ高速に移動するデータセットを保存およびクエリするだけでなく、超並列処理を実行する方法も存在します。 Hadoop は 2007 年に初めてオープンソース化され、現在もその状態が続いています。 2 番目の小さなブレークスルーは、次の 6 つのテクノロジーで構成される最新の AI ツールセットの登場でした。

1. 自然言語処理

2. 画像認識

3. 強化学習

4. 質問応答機

5. 敵対的トレーニング

6. ロボット

いくつかの例外を除いて、これらの技術はディープラーニングに依存するものとしてグループ化できますが、ディープラーニングの仕組みやディープニューラルネットワークの動作の詳細を見ると、これが問題の核心ではないことがすぐにわかります。

一般的に、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク、生成的敵対的ニューラルネットワーク、強化学習における進化型ニューラルネットワーク、およびそれらのすべての変種は非常に少なく、質問応答マシン (Watson)、ロボット、または強化学習の変種では、ディープニューラルネットワークを使用しないものはさらに少ないです。

これらの技術に共通するのは、独自の機能を生成するということなので、これを「フィーチャレスモデリングの時代」と呼ぶべきかもしれません。トレーニングには既知のラベル付きインスタンスを使用する必要がありますが、事前定義されたバリアントと属性で列を入力する必要はありません。また、非常に大規模なコンピューティングアレイでの大規模な並列処理も必要であり、多くの場合、すべてを人間の時間スケールで実行するには、専用のチップ (GPU や FPGA など) が必要になります。

したがって、重要な違いは、人工知能の第 2 段階は数十年続く可能性があり、主に機械学習、ビッグデータ/Hadoop、および特徴のないモデリングの 3 つの側面で新しいテクノロジーに 3 つの大きな変化がもたらされたことです。しかし、これらのブレークスルーはまだ統計的学習方法の段階にあり、今後も発展を続け、さらなるブレークスルーを生み出すことになるでしょう。

ローンチベリーは、これまでのところ、非常に高度でセグメント化された強力な予測システムがあるものの、コンテキストの理解と最小限の推論能力がまだ欠けていることを示しています。当社のテクノロジーはデータに対する需要が高まっているため、これが障害になっていますが、当社の予測分析テクノロジーが価値と効果を維持し続けるためには、このような状況であってはなりません。しかし、自動運転車、ますます複雑化するゲームに機械が勝つ能力、画像、テキスト、自然言語処理など、この段階の初期には解決できなかった困難は、現在では大きな進歩を遂げています。

ステージ3: 状況適応

次は何ですか？ローチベリー氏は、現在の統計学習の時代には 2 つの問題が生じており、第 3 フェーズではその両方に対処すると述べました。

推論行動を説明するモデル: ディープニューラルネットワークは、たとえば画像の分類に優れていますが、そのプロセスの原理は依然として謎に包まれています。分類と説明の両方ができるシステムが必要です。理由を理解することで、プロセスの修正が本当に効果的になります。

生成モデル: これらのモデルは、大量の不完全な書き方の例に基づく力ずくの分類ではなく、各文字のストロークを学習するモデルなど、基礎となるコンテキストから学習できます。現在使用されている生成モデルは、トレーニングデータの必要性を大幅に削減する可能性があります。

これらの特性を考慮すると、現段階の人工知能システムは、認識、学習、推論、抽象化のためのコンテキストモデルを使用して、1 つのシステムから学習した内容をまったく異なるコンテキストに適用できます。

パノラマビュー

新しい段階の始まりは、前の段階が突然終了することを意味するものではありません。一部の技術や機能は有用性が低下する可能性はありますが、完全に排除することは現実的ではありません。たとえば、最新のテクノロジーには膨大な計算能力、研究開発の複雑さ、トレーニングが必要となるため、その廃止は制限されますが、将来のある時点で発生する価値の高い問題には、これらのテクノロジーの使用が必要になる可能性があります。

状況に応じた採用段階などの他のケースでは、人間の脳にさらに近い新世代のチップが登場するまで待たなければならないかもしれない。ニューロモルフィックニューラルネットワークまたはスパイキングニューラルネットワークと呼ばれるこれらの第 3 世代ニューラルネットワークでは、現在開発の初期段階にあるものと同じチップが使用されます。

さて、第 2 段階 (統計学習) のどこにいるでしょうか?

現在のフェーズの 3 つの章のうち、おそらく人々が最も懸念しているのは、新しいもの、ディープラーニング、強化学習、そしてこのフェーズを構成する上記の 6 つのテクノロジー間のバランスです。

これは、ようやく実を結び始めたばかりの困難な進化のプロセスですが、こうした新たな発展の大部分はまだ開花して実を結ぶ準備ができていません。これらのテクノロジーがどこに向かっているかはわかりますが、商業的に実現可能になる見込みがあるのは 2 つまたは 3 つだけです (画像処理、テキストおよび音声処理、Watson QAM の限定バージョン)。

これらのテクノロジーを結び付けようとすると、それらは緩くしか接続されておらず、これらのテクノロジーを統合することが依然として最も困難なことの 1 つとなっています。方法は見つかるでしょうが、まだそこには至っていません。

最終的には、第 3 段階まで到達することになります。ただし、この段階を通過する前に、予期していなかった進化や変化が起こる可能性があります。

<<: SLAMアルゴリズム分析：ビジュアルSLAMの難しさを把握し、技術開発の全体的な傾向を理解する

>>: 生態学的な閉ループを作り、RV を運転して、愛する人を楽しい景色の中に連れて行きましょう。