ディープラーニングは機械学習手法の一種であり、人工知能を実現するための重要な基盤です。最近、一部の学者は、人工知能の発展に伴い、ディープラーニングの欠点がますます顕著になり、「ボトルネックが到来した」と考えています。ディープラーニングのボトルネックは本当に到来したのか?この問題に関して、この記事は 2 つの部分に分かれており、ディープラーニングの利点と欠点、およびそれを改善する方法について説明し、専門家と学者のさまざまな考えを整理して読者に提供します。 少し前、世界的な人工知能コンピュータービジョン分野の創始者の一人であり、ジョンズホプキンス大学の教授であるアラン・ユール氏は、「ディープラーニングはコンピュータービジョンの分野でボトルネックに達している」という見解を提唱し、業界の多くの専門家の共感を呼び、激しい議論を巻き起こしました。 現在、人工知能の一種であるディープラーニングは、人間の脳をより忠実に模倣することを目指しています。では、業界の専門家や学者はこの意見に同意するのでしょうか?人工知能技術の重要な基盤であるディープラーニングは、開発においてどのような困難に直面しているのでしょうか?ディープラーニングがボトルネックに達した場合、この問題をどう解決すればよいのでしょうか?科技日報の記者は最近、関連する質問で国内外の人工知能の著名な専門家にインタビューし、ユール教授の見解を深く解釈した。 ディープラーニングの高度化 当初、ディープラーニングはほとんどの人工知能研究者の目に留まったときには冷笑されていましたが、わずか数年後には、その触手は多くのハイテク分野に広がり、Google、Microsoft、Baidu などの多くの企業に広がりました。 多くのハイテク企業は、特殊な形式のディープラーニングである畳み込みニューラル ネットワークの研究に熱心に取り組んでいます。畳み込みネットワークは相互接続された畳み込み層で構成されており、視覚情報を処理する脳の視覚皮質に非常に似ています。違いは、画像内の複数の場所で同じフィルターを再利用できることです。畳み込みネットワークが 1 つの場所の顔を認識することを学習すると、他の場所の顔も自動的に認識できるようになります。この原理は音波や手書きのテキストにも当てはまります。 業界関係者は、畳み込みニューラル ネットワークは「メモリ使用量が小さく、画像内の各場所のフィルターを個別に保存する必要がないため、スケーラブルなディープ ネットの作成に非常に適している」ため、人工ニューラル ネットワークを迅速にトレーニングできると考えています。これにより、畳み込みニューラル ネットワークはグラフィックスの認識に優れているという利点も得られます。これを基に、Google は Android スマートフォン向けの音声認識システムを開発し、Baidu は新しいビジュアル検索エンジンを開発しました。 もちろん、畳み込みニューラル ネットワークが適切に動作するには、強力なコンピューターと大規模なデータ セットが必要であり、データの収集や平均の計算に関しては完璧ではありません。 畳み込みニューラルネットワークの強力な支持者であり、フェイスブックの人工知能研究所の所長であるイアン・ルカン氏は、最も広く使用されている畳み込みニューラルネットワークは現在、ほぼ完全に教師あり学習に依存していると述べた。つまり、畳み込みニューラル ネットワークに特定のオブジェクトを認識する方法を学習させるには、複数のサンプルにラベルを付ける必要があるということです。教師なし学習はラベルのないデータから学習することができ、人間の脳の学習方法に近いものです。これを基に開発されたバックプロパゲーションアルゴリズムは、エラー率を効果的に最小限に抑えることができますが、人間の脳の動作メカニズムを反映する可能性は低いです。 「脳がどのように学習するかは、ほとんどわかっていません」とルカン氏は言う。「シナプスが自己調整できることはすでにわかっていますが、大脳皮質のメカニズムはまだ不明です。私たちが知っている最終的な答えは、教師なし学習は人間の脳に近い学習方法であるということですが、脳の認知メカニズムを説明することはできません。」 ボトルネックが発生し、警戒が必要 「ディープラーニングは他の技術より優れているが、普遍的ではなく、数年の開発を経てそのボトルネックが明らかになった」とアラン・ユール氏は少し前に指摘した。 Yule 氏は、ディープラーニングには 3 つの大きな制限があると考えています。第 1 に、ディープラーニングではほとんどの場合、大量のラベル付きデータが必要になります。このため、視覚研究者は重要なタスクではなく、注釈を付けやすいタスクに重点を置きすぎています。 第二に、ディープネットはベンチマーク データセットでは優れたパフォーマンスを発揮するかもしれませんが、データセット外の現実世界の画像では大きな失敗をする可能性があります。特に、ディープネットでは、データセット内でまれに発生する「まれなイベント」に対処することが困難です。実際のアプリケーションでは、対応するビジョン システムの障害が悲惨な結果につながる可能性があるため、これらの状況は潜在的なリスクをもたらします。たとえば、自動運転車のトレーニングに使用されるデータセットには、道路上に座っている赤ちゃんが含まれることはほとんどありません。 第三に、ディープネットは画像の変化に対して過度に敏感です。この過敏性は、画像の知覚できない変化の基準だけでなく、コンテキストの変化にも反映されます。データセットのサイズの制限により、過敏性によってシステムが誤った判断を下す可能性がありますが、過敏性によって引き起こされるこの画像の変化は、人間の観察者を欺くことは困難です。 たとえば、ジャングルの猿の写真に、ギターがフォトショップで合成されていました。これにより、AI は猿を人間と間違えたり、ギターを鳥と間違えたりすることになります。おそらく、人間はサルよりもギターを持ち歩く可能性が高く、鳥はギターよりも近くのジャングルにいる可能性が高いと推測されます。 ユール氏は、ボトルネックの原因は「組み合わせ爆発」と呼ばれる概念にあると考えている。視覚の場合、組み合わせの観点から見ると現実世界の画像の数が多すぎるのだ。データセットは、どれほど大きくても、現実の複雑さを捉えることはほとんどできません。さらに、各人がオブジェクトをそれぞれ異なる方法で選択して配置するため、作成されるシーンの数は飛躍的に増加する可能性があります。これには無限に大きなデータセットが必要となり、トレーニングおよびテストデータセットにとって大きな課題となることは間違いありません。 業界の専門家は、これら 3 つの制限がディープラーニングを台無しにすることはないが、警戒する必要がある兆候であると述べています。 「死んだ」説は疑わしい 昨年、ディープラーニング分野の著名な学者がFacebookで「ディープラーニングは死んだ」という衝撃的な発言をし、業界に大騒動を引き起こしました。現在、オンラインの機械学習コミュニティの一部の人々は、ディープラーニングは行き止まりだと言っています。 「『ディープラーニングは死んだ』という発言は、かつてはディープラーニングに非常に楽観的だったが、後にその限界に気づいた業界関係者によるものだと私は思います。しかし、限界があるからといってディープラーニングが死んだわけではありません。私たちはディープラーニングに何かを加えることができます」と、フランスのタレス・グループの最高技術責任者、マーク・エルマン氏はサイエンス・アンド・テクノロジー・デイリーに語った。 「『ディープラーニングは死んだ』という主張には同意しない」と、新世代人工知能産業技術革新戦略連盟の共同事務局長で、iFLYTEK副社長、AI研究所共同所長の李世鵬氏は述べた。 李世鵬氏は、計算科学分野における新しい手法として、ディープラーニングには確かに限界と欠陥があると述べた。外の世界では万能のツールとして大々的に宣伝されてきたこの AI ツールは、実は科学界では慎重に扱われてきました。ラベル付けされたビッグ データへの依存、解釈不可能、推論能力の欠如、トレーニング セットに含まれるサンプルではうまく機能するが含まれないサンプルではうまく機能しない、システム モデルが非定常状態にあるなど、その限界のいくつかは最初から誰もが知っていました。 「ユール教授の、ディープラーニングはコンピュータービジョンの分野でボトルネックに達しているという客観的な発言には私も同意する傾向にあります。特に、この時期に彼がこの問題について議論することは、その方向に過剰修正する刺激効果を持つため、必要です。現在、誰もがディープラーニングに少し熱心になりすぎています。学界でも産業界でも、『ディープラーニングでないとAIではない』と感じているようです。実際、これは非常に問題があります。なぜなら、ディープラーニングは確かに実現された成功体験に過ぎず、人工知能の分野では比較的狭いからです」と、元旺シンクタンクの人工知能事業部長で、チューリング・ロボティクスのCSOであるタン・ミンジョウ氏は述べた。 全体的に見て、ディープラーニングは死んだという主張は議論の余地がある、と李石鵬氏は述べた。今後しばらくの間、ディープラーニングは人工知能の発展を促進する上で積極的な役割を果たし、大きな応用価値を持つでしょう。同時に、科学者たちはディープラーニングの固有の欠陥と限界を認識しており、現在の開発の欠点を補うためにいくつかの方法を試み、それぞれの分野で次世代の人工知能のブレークスルーを模索しています。 |
<<: ビル・ゲイツ:人工知能に国境を簡単に引いてはいけない
>>: 知らないうちに個人のプライバシーを人工知能に「提供」しないでください
有名なアニメーション会社ディズニーは、近々人工知能とロボット工学の分野に参入すると発表しました。ディ...
[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミット...
IT Homeは2月9日、「高齢者のデジタル適応力に関する調査報告」によると、スマートフォンを使用...
2月4日、アマゾンクラウドコンピューティング人工知能研究所の研究者らは、インターネット上の大量のコン...
規制の厳しい業界の企業は、AI を導入しようとすると、いわゆる「ブラック ボックス」問題に直面するこ...
[[385051]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...
[[238592]] 1. はじめにサービス低下とは何ですか?サーバーの負荷が急激に高まると、実際の...
今日、業界や部門に関係なく、私たちは皆、エネルギーと燃料のコスト上昇、原材料費の増加、営業利益率と利...
DeepMind チームによる最新の Nature 論文には、実は重大な抜け穴が含まれています。ロ...
「エネルギー自己教師学習っていったい何?」と多くのRedditネットユーザーがコメントした。ちょう...
動的プログラミング基本的に、それは次のことを意味します。女の子を追いかけるときは、彼女の親しい友達全...
ストーリーの背景:元のデータは個人の取引記録ですが、データ自体のプライバシーを考慮して、元のデータは...