ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

[[210898]]

なぜ人々が人工知能にこれほど魅了されるのか分からないなら、69歳のGoogle研究者ジェフ・ヒントンがその答えを知っているかもしれない。

トロント大学の教授は2012年10月に人工知能研究の分野に革命をもたらし、まったく新しい研究の方向性を切り開きました。当時、ヒントン氏は、何十年も提唱しながらもあまり受け入れられていなかった技術、つまり機械の画像理解能力を大きく向上させた人工ニューラルネットワークを世界に披露するために、2人の大学院生を連れてきた。 6 か月以内に、3 人の研究者全員が Google に採用されました。今日では、人工知能ニューラル ネットワークは、私たちの会話を理解し、ペットを認識し、小さな悪魔と戦うことができます。

しかし、ヒントン氏は現在、自らが創始した人工知能ニューラルネットワーク技術に疑問を抱き始めている。 「ディープラーニングによるコンピュータービジョンへの現在のアプローチは間違っていると思います」と彼は言う。「ディープラーニングが現時点で他の何よりも優れているからといって、それが正しいとは限りません。」

その代わりに、ヒントン氏は、将来コンピューターが世界を認識する方法を変え、人工知能を再構築する可能性のある、それほど新しくはない別のアイデアを発表した。これは重要なことです。なぜなら、コンピューター ビジョンは、自動運転技術から医師に代わる人工知能診断ソフトウェアに至るまで、さまざまなアプリケーションにとって極めて重要だからです。

最近、ヒントン氏は、40年近く研究してきたアイデアを示す2つの研究論文を発表しました。 「長い間、このアプローチは私にとって理にかなっていると感じていましたが、あまりうまくいきませんでした」とヒントン氏は言う。「ようやく本当に良い結果が得られました。」

ヒントン氏の新しいアプローチはカプセルネットワークと呼ばれ、既存のニューラルネットワークに工夫を加えたもので、機械が画像や動画を通じて世界をよりよく理解できるようにすることを目的としています。 10月下旬に発表された論文では、ヒントンのカプセルネットワークが、ソフトウェアが手書きの数字をどれだけ正確に認識できるかを測る標準テストでこれまでで最高の精度を示したと報告されている。 2 番目の論文では、ソフトウェアがトラックや車などのおもちゃをさまざまな角度から識別できるようにし、カプセル ネットワークによってこれまでの最高のエラー率をほぼ半分に削減しました。ヒントン氏はグーグルのトロントオフィスで同僚のサラ・セイバー氏とニコラス・フロスト氏とともに新しいAI技術に取り組んでいる。

カプセル ネットワークは、コンピューター ビジョン ソフトウェアの学習能力を制限する、今日の機械学習システムの弱点を解決するように設計されています。 Google やその他の企業が現在使用している画像認識ソフトウェアでは、さまざまな状況で物体を確実に識別する方法を学習するために、大量のサンプル写真が必要です。現在のコンピューター ビジョン ソフトウェアは、同じオブジェクトを異なる角度から認識することを学ぶなど、学習した内容を新しいシナリオに一般化するのがあまり得意ではないためです。

たとえば、コンピューターに複数の角度から猫を認識するように教える現在のディープラーニング アルゴリズムでは、猫のさまざまな視点をカバーする何千枚もの写真が必要になる場合があります。一方、人間の子どもは、家庭のペットを認識することを学ぶために、それほど明確で広範囲にわたる訓練を必要としません。

[[210899]]

ヒントン氏の考えは、世界についてのより多くの知識をコンピュータービジョンソフトウェアに組み込むことで、最高の AI システムと人間の幼児との間のギャップを縮めることです。そこで研究者たちは、猫の鼻や耳など物体のさまざまな部分や、空間内での相対的な位置を追跡するために使用できるカプセルニューラルネットワーク(粗い仮想ニューロンの小さなグループ)を考案しました。このようなカプセルを多数使ってニューラル ネットワークを形成することで、コンピューターは新しい種類の認識を獲得し、見る新しいシーンが実際には以前に見た物体の異なる視点にすぎないことを理解できるようになります。

ヒントンは 1979 年にはすでに独自の直感的な洞察力を培っていました。人間が想像するために脳をどのように使っているかを理解しようとしていたとき、コンピューター ビジョン システムは人間の脳の立体画像化機能を持つ必要があることに気付きました。ヒントン氏は2011年に初めてカプセルニューラルネットワークの予備設計を策定しました。彼の最新の論文では、人工知能分野の科学者たちが待ち望んでいた、より完全なアルゴリズムが紹介されている。 「誰もがジェフ・ヒトノンの次の飛躍を期待して待っている」とニューヨーク大学の画像認識教授、チョ・キョンヒョン氏は言う。

ヒントンのカプセルネットワークがどれほど大きな進歩であるかを判断するのは時期尚早だが、彼自身もそれをわかっている。 AIのベテランは、自分の直感が証拠によって裏付けられたことを静かに喜びつつ、カプセルネットワークは依然として大量の画像で証明する必要があり、現在のところ既存の画像認識ソフトウェアに比べて計算が遅いとも説明した。

しかしヒントン氏は、それらの欠点を克服できると楽観視している。 AI分野の他の専門家も彼の成熟したアイデアに期待を寄せている。

モントリオール大学教授で画像認識スタートアップ企業Twenty Billion Neuronsの共同設立者でもあるローランド・メミセビッチ氏は、ヒントン氏のカプセル型ニューラルネットワーク設計は、既存のシステムよりも一定量のデータからより多くの情報と理解を抽出できるはずだと語った。大規模に実証されれば、カプセルニューラルネットワークは、インターネット上の自撮り写真の海よりもはるかに多くの画像データがAIシステムをトレーニングする医療などの分野で役立つ可能性があります。

[[210900]]

ある意味では、ヒントンのカプセル ネットワークは AI ディープラーニング研究のトレンドに反するものです。ニューラル ネットワークの最近の成功の理由の 1 つは、人間が AI ソフトウェアにエンコードする知識をできるだけ少なくし、代わりに AI がゼロから学習して自ら物事の真実を解明できるようにすべきであるという点です。

ニューヨーク大学の心理学教授ゲイリー・マーカス氏は昨年、人工知能のスタートアップ企業をウーバーに売却した。ヒントンの***理論とアルゴリズムは新風をもたらしたと彼は語った。

マーカス氏は、AI 研究者は脳の構造や、視覚や言語などの主要なスキルを決定する構造を模倣するために、さらに努力する必要があると考えています。 「この特定のカプセル型ニューラルネットワークアーキテクチャがどこまで進むかを判断するのは時期尚早だが、ヒントン氏がこの分野の現在の定着した軌道の限界を押し広げているのを見るのは素晴らしいことだ」とマーカス氏は語った。

<<:  ウェブデザインに人工知能を活用する10の方法

>>:  JavaScript における一般的なソートアルゴリズムの詳細な説明

ブログ    
ブログ    

推薦する

人工知能産業は各地で花開いています。この7つのロボットがあなたに近づいてきます!

現在、中国の製造業、農業、飲食業、企業、機関はすべて、自動化からインテリジェンス化、デジタル化への変...

あなたの周りにある、機械学習の一般的な使用例トップ 7!

想像してみてください。あなたはずっと夢見てきた機械学習の職種の面接を受けに行こうとしています。すべて...

ザッカーバーグはオープンソース AGI に全力を注ぐ: Llama 3 をトレーニング、35 万台の H100 を年末までに提供開始

ザッカーバーグ氏は新たな目標「すべてをオープンソースの AGI に」を発表しました。そう、ザッカーバ...

テックネオテクノロジーサロ​​ン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究

【51CTO.comオリジナル記事】 [51CTO オリジナル記事、パートナーサイトに転載する場合は...

...

AlphaGoの仕組み:マルチエージェント強化学習の詳細な説明

このレビュー記事では、著者はマルチインテリジェンス強化学習の理論的基礎を詳細に紹介し、さまざまなマル...

アダプティブコンピューティングがAI製品化の課題にどのように対処するか

[[389356]]今日、人工知能技術は急速に発展しており、イノベーションのペースは加速しています。...

クラウド、持続可能性、デジタル導入 - 2022 年のアジア太平洋地域の技術予測

フォレスターのアジア太平洋地域における 2022 年の予測によると、地域特有の圧力により、どこからで...

何百万人もの人々が「焼けた赤ちゃん」の写真を見ました!バークレー教授が噂を否定:AI画像検出器は役に立たない

AI画像検出器が再び攻撃を受けました!最近、中東紛争の写真が大量にインターネット上に公開され、極限状...

コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

[[414746]]企業はコンテナ内で人工知能や機械学習のワークロードを実行する準備ができているでし...

AIも催眠術をかけられるのか?

いつか、おそらく数十年以内に、人工ニューラル ネットワークを使用して、人間の脳をリアルにシミュレート...

「翼竜」が飛び立ち、その威力を発揮。固定翼ドローンについて、あなたはどのくらい知っていますか?

空を飛ぶ龍、数千マイル離れたところから救援に駆けつける!最近、「翼龍」無人機が飛び立ち、被災地に急行...

ヤン・ルカンの最新インタビュー: エネルギーモデルは自律型人工知能システムの出発点

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

「顔認証」の時代に「顔を守る」には?代表者と議員は顔認識に関する特別立法を実施し、不正なデータ収集を是正することを提案した。

「顔認証」の時代、あなたの「顔」をどう守るか? 2021年の全国「両会」では、顔認識によって生成さ...