Facebook、プリンストン大学、MITのAI研究者らは最近、「ディープラーニング理論の原理:ニューラルネットワークを理解するための効果的な理論的アプローチ」と題する書籍を共同出版すると発表しました。この本の原稿は現在公開されています。 序文によれば、この本は基礎レベルで、ディープ ニューラル ネットワーク (DNN) を第一原理から理解するための理論的枠組みを提供します。 AI 実践者にとって、この理解は、これらの DNN をトレーニングするために必要な試行錯誤の量を大幅に削減できる可能性があります。たとえば、現在必要とされる時間と計算量の多い実験を行わなくても、特定のモデルに最適なハイパーパラメータを明らかにすることができます。 FacebookのAI研究科学者であるSho Yaida氏は、DNNは現代のAI研究の重要な要素の1つであると述べた。しかし、ほとんどの AI 研究者を含む多くの人々は、DNN は第一原理から理解するには複雑すぎると考えています。この問題は、業界が実験と試行錯誤を通じて AI で大きな進歩を遂げている一方で、研究者は DNN を非常に有用なものにしている重要な特性の多くについてまだよくわかっていないことを意味します。研究者がこれらの重要な特性をより深く理解すれば、大きな進歩と、より強力な AI モデルの開発につながる可能性があると彼は考えています。 矢井田氏はAIを産業革命初期の蒸気機関に例えた。蒸気機関は製造業を永遠に変えたが、熱力学の法則と統計力学の原理が開発されて初めて、科学者は蒸気機関がどのように、なぜ機能するのかを理論レベルで完全に説明できるようになったと彼は述べた。この理解不足によって人々が蒸気機関を改良するのを妨げることはなかったが、熱機関の原理の発見によって改良のペースは大幅に加速された。
矢井田氏は、AIの分野も現在、同様の局面にあると指摘する。 DNN はブラック ボックスと見なされており、第一原理から理解するには複雑すぎる。したがって、AI モデルは、人間が蒸気機関を改良したのと同様に、試行錯誤を通じて微調整されます。しかし、矢井田氏は、試行錯誤は必ずしも悪いことではなく、長年の経験を組み合わせることで上手に行うことができるとも語った。しかし、試行錯誤は、DNN とその実際の動作を説明する統一された理論言語の代替にすぎません。 発表では、この本は、第一原理から、そして現実的なモデルが実際にどのように機能するかを説明することに焦点を当てて、AIの科学を再考するより大きなプロジェクトの第一歩に過ぎないと述べられている。このディープラーニングの一般理論が成功すれば、より強力な人工知能モデルが実現可能となり、知能の一般的な側面を研究するための枠組みにつながる可能性もある。 この本で説明されているフレームワークは、現代の AI コミュニティで使用されている実際の DNN に拡張できることは注目に値します。しかし、この本の主な焦点は、最も単純なディープラーニング モデル (ディープ多層パーセプトロン) にあります。 この新しい実用的な理論により、AI 理論家がニューラル ネットワークのより深く、より包括的な理解に向かって前進できることを期待しています。まだ解明すべきことはたくさんありますが、この研究によって、これらのモデルのどのような特定の特性によってインテリジェントなパフォーマンスが可能になるのかという理解がさらに深まることが期待されます。また、この本が AI コミュニティにおいて、現在の進歩を制限することがある試行錯誤のサイクルを減らすのに役立つことを願っています。私たちは、より効率的で、パフォーマンスが高く、トレーニングが速い、より優れたモデルを実践者が迅速に設計できるように支援したいと考えています。特に、DNN を設計する人は、トレーニングなしで最適なハイパーパラメータを選択し、最適なアルゴリズムとモデル アーキテクチャを選択して最良の結果を達成できるようになります。 詳細は公式ブログをご確認ください。 この記事はOSCHINAから転載したものです この記事のタイトル: FacebookとMITが共同で研究論文を発表: ディープラーニングが実際にどのように機能するかを説明する理論 記事URL: https://www.oschina.net/news/147068/facebook-mit-ai-researchers |
<<: ついに誰かが畳み込みニューラルネットワーク(CNN)を明確にした。
>>: 人工知能が普及しつつある今、将来はロボットの時代になるのでしょうか?
今年ドイツで開催された国際自動車・スマートモビリティ博覧会(IAA)では、Amazon、Qualco...
[[396949]]近年、新世代の通信およびナビゲーション技術の継続的な進歩を背景に、我が国のドロー...
[[391010]]昨今、都市化の加速と生活水準の向上に伴い、ペットを飼うことがますます多くの人々の...
単純な生物はどのようにして特定の場所へ移動できるのか?ウィーン大学で開発された人工知能と物理モデルが...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
サイバーセキュリティは、攻撃と防御の継続的なゲームです。防御戦略が進化し続ける一方で、攻撃者も攻撃の...
清華大学金融学科教授の李道奥氏は、ハーバード大学で経済学の博士号を取得。スタンフォード大学フーバー研...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
現在、多くの企業が AI テクノロジーで一定の成功を収めており、IT チームは AI プロジェクトを...
[51CTO.com クイック翻訳] この記事では、顔認識や画像認識、テキスト分析、自然言語処理 ...
Google 初の WeChat ミニプログラム「絵を当てよう」アプリは、リリースから 1 日で、一...
バイアスは機械学習において対処または軽減する必要がある重大な問題です。企業は将来のプレッシャーを軽減...
オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知...