ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

[[210898]]

なぜ人々が人工知能にこれほど魅了されるのか分からないなら、69歳のGoogle研究者ジェフ・ヒントンがその答えを知っているかもしれない。

トロント大学の教授は2012年10月に人工知能研究の分野に革命をもたらし、まったく新しい研究の方向性を切り開きました。当時、ヒントン氏は、何十年も提唱しながらもあまり受け入れられていなかった技術、つまり機械の画像理解能力を大きく向上させた人工ニューラルネットワークを世界に披露するために、2人の大学院生を連れてきた。 6 か月以内に、3 人の研究者全員が Google に採用されました。今日では、人工知能ニューラルネットワークは、私たちの会話を理解し、ペットを認識し、小さな悪魔と戦うことができます。

しかし、ヒントン氏は現在、自らが創始した人工知能ニューラルネットワーク技術に疑問を抱き始めている。「ディープラーニングによるコンピュータービジョンへの現在のアプローチは間違っていると思います」と彼は言う。「ディープラーニングが現時点で他の何よりも優れているからといって、それが正しいとは限りません。」

その代わりに、ヒントン氏は、将来コンピューターが世界を認識する方法を変え、人工知能を再構築する可能性のある、それほど新しくはない別のアイデアを発表した。これは重要なことです。なぜなら、コンピュータービジョンは、自動運転技術から医師に代わる人工知能診断ソフトウェアに至るまで、さまざまなアプリケーションにとって極めて重要だからです。

最近、ヒントン氏は、40年近く研究してきたアイデアを示す2つの研究論文を発表しました。「長い間、このアプローチは私にとって理にかなっていると感じていましたが、あまりうまくいきませんでした」とヒントン氏は言う。「ようやく本当に良い結果が得られました。」

ヒントン氏の新しいアプローチはカプセルネットワークと呼ばれ、既存のニューラルネットワークに工夫を加えたもので、機械が画像や動画を通じて世界をよりよく理解できるようにすることを目的としています。 10月下旬に発表された論文では、ヒントンのカプセルネットワークが、ソフトウェアが手書きの数字をどれだけ正確に認識できるかを測る標準テストでこれまでで最高の精度を示したと報告されている。 2 番目の論文では、ソフトウェアがトラックや車などのおもちゃをさまざまな角度から識別できるようにし、カプセルネットワークによってこれまでの最高のエラー率をほぼ半分に削減しました。ヒントン氏はグーグルのトロントオフィスで同僚のサラ・セイバー氏とニコラス・フロスト氏とともに新しいAI技術に取り組んでいる。

カプセルネットワークは、コンピュータービジョンソフトウェアの学習能力を制限する、今日の機械学習システムの弱点を解決するように設計されています。 Google やその他の企業が現在使用している画像認識ソフトウェアでは、さまざまな状況で物体を確実に識別する方法を学習するために、大量のサンプル写真が必要です。現在のコンピュータービジョンソフトウェアは、同じオブジェクトを異なる角度から認識することを学ぶなど、学習した内容を新しいシナリオに一般化するのがあまり得意ではないためです。

たとえば、コンピューターに複数の角度から猫を認識するように教える現在のディープラーニングアルゴリズムでは、猫のさまざまな視点をカバーする何千枚もの写真が必要になる場合があります。一方、人間の子どもは、家庭のペットを認識することを学ぶために、それほど明確で広範囲にわたる訓練を必要としません。

[[210899]]

ヒントン氏の考えは、世界についてのより多くの知識をコンピュータービジョンソフトウェアに組み込むことで、最高の AI システムと人間の幼児との間のギャップを縮めることです。そこで研究者たちは、猫の鼻や耳など物体のさまざまな部分や、空間内での相対的な位置を追跡するために使用できるカプセルニューラルネットワーク（粗い仮想ニューロンの小さなグループ）を考案しました。このようなカプセルを多数使ってニューラルネットワークを形成することで、コンピューターは新しい種類の認識を獲得し、見る新しいシーンが実際には以前に見た物体の異なる視点にすぎないことを理解できるようになります。

ヒントンは 1979 年にはすでに独自の直感的な洞察力を培っていました。人間が想像するために脳をどのように使っているかを理解しようとしていたとき、コンピュータービジョンシステムは人間の脳の立体画像化機能を持つ必要があることに気付きました。ヒントン氏は2011年に初めてカプセルニューラルネットワークの予備設計を策定しました。彼の最新の論文では、人工知能分野の科学者たちが待ち望んでいた、より完全なアルゴリズムが紹介されている。「誰もがジェフ・ヒトノンの次の飛躍を期待して待っている」とニューヨーク大学の画像認識教授、チョ・キョンヒョン氏は言う。

ヒントンのカプセルネットワークがどれほど大きな進歩であるかを判断するのは時期尚早だが、彼自身もそれをわかっている。 AIのベテランは、自分の直感が証拠によって裏付けられたことを静かに喜びつつ、カプセルネットワークは依然として大量の画像で証明する必要があり、現在のところ既存の画像認識ソフトウェアに比べて計算が遅いとも説明した。

しかしヒントン氏は、それらの欠点を克服できると楽観視している。 AI分野の他の専門家も彼の成熟したアイデアに期待を寄せている。

モントリオール大学教授で画像認識スタートアップ企業Twenty Billion Neuronsの共同設立者でもあるローランド・メミセビッチ氏は、ヒントン氏のカプセル型ニューラルネットワーク設計は、既存のシステムよりも一定量のデータからより多くの情報と理解を抽出できるはずだと語った。大規模に実証されれば、カプセルニューラルネットワークは、インターネット上の自撮り写真の海よりもはるかに多くの画像データがAIシステムをトレーニングする医療などの分野で役立つ可能性があります。

[[210900]]

ある意味では、ヒントンのカプセルネットワークは AI ディープラーニング研究のトレンドに反するものです。ニューラルネットワークの最近の成功の理由の 1 つは、人間が AI ソフトウェアにエンコードする知識をできるだけ少なくし、代わりに AI がゼロから学習して自ら物事の真実を解明できるようにすべきであるという点です。

ニューヨーク大学の心理学教授ゲイリー・マーカス氏は昨年、人工知能のスタートアップ企業をウーバーに売却した。ヒントンの***理論とアルゴリズムは新風をもたらしたと彼は語った。

マーカス氏は、AI 研究者は脳の構造や、視覚や言語などの主要なスキルを決定する構造を模倣するために、さらに努力する必要があると考えています。「この特定のカプセル型ニューラルネットワークアーキテクチャがどこまで進むかを判断するのは時期尚早だが、ヒントン氏がこの分野の現在の定着した軌道の限界を押し広げているのを見るのは素晴らしいことだ」とマーカス氏は語った。

<<: ウェブデザインに人工知能を活用する10の方法

>>: JavaScript における一般的なソートアルゴリズムの詳細な説明