ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

ディープラーニングの父ヒントン氏が、人工知能を一新するカプセルネットワークの最新動向を発表

[[210898]]

なぜ人々が人工知能にこれほど魅了されるのか分からないなら、69歳のGoogle研究者ジェフ・ヒントンがその答えを知っているかもしれない。

トロント大学の教授は2012年10月に人工知能研究の分野に革命をもたらし、まったく新しい研究の方向性を切り開きました。当時、ヒントン氏は、何十年も提唱しながらもあまり受け入れられていなかった技術、つまり機械の画像理解能力を大きく向上させた人工ニューラルネットワークを世界に披露するために、2人の大学院生を連れてきた。 6 か月以内に、3 人の研究者全員が Google に採用されました。今日では、人工知能ニューラル ネットワークは、私たちの会話を理解し、ペットを認識し、小さな悪魔と戦うことができます。

しかし、ヒントン氏は現在、自らが創始した人工知能ニューラルネットワーク技術に疑問を抱き始めている。 「ディープラーニングによるコンピュータービジョンへの現在のアプローチは間違っていると思います」と彼は言う。「ディープラーニングが現時点で他の何よりも優れているからといって、それが正しいとは限りません。」

その代わりに、ヒントン氏は、将来コンピューターが世界を認識する方法を変え、人工知能を再構築する可能性のある、それほど新しくはない別のアイデアを発表した。これは重要なことです。なぜなら、コンピューター ビジョンは、自動運転技術から医師に代わる人工知能診断ソフトウェアに至るまで、さまざまなアプリケーションにとって極めて重要だからです。

最近、ヒントン氏は、40年近く研究してきたアイデアを示す2つの研究論文を発表しました。 「長い間、このアプローチは私にとって理にかなっていると感じていましたが、あまりうまくいきませんでした」とヒントン氏は言う。「ようやく本当に良い結果が得られました。」

ヒントン氏の新しいアプローチはカプセルネットワークと呼ばれ、既存のニューラルネットワークに工夫を加えたもので、機械が画像や動画を通じて世界をよりよく理解できるようにすることを目的としています。 10月下旬に発表された論文では、ヒントンのカプセルネットワークが、ソフトウェアが手書きの数字をどれだけ正確に認識できるかを測る標準テストでこれまでで最高の精度を示したと報告されている。 2 番目の論文では、ソフトウェアがトラックや車などのおもちゃをさまざまな角度から識別できるようにし、カプセル ネットワークによってこれまでの最高のエラー率をほぼ半分に削減しました。ヒントン氏はグーグルのトロントオフィスで同僚のサラ・セイバー氏とニコラス・フロスト氏とともに新しいAI技術に取り組んでいる。

カプセル ネットワークは、コンピューター ビジョン ソフトウェアの学習能力を制限する、今日の機械学習システムの弱点を解決するように設計されています。 Google やその他の企業が現在使用している画像認識ソフトウェアでは、さまざまな状況で物体を確実に識別する方法を学習するために、大量のサンプル写真が必要です。現在のコンピューター ビジョン ソフトウェアは、同じオブジェクトを異なる角度から認識することを学ぶなど、学習した内容を新しいシナリオに一般化するのがあまり得意ではないためです。

たとえば、コンピューターに複数の角度から猫を認識するように教える現在のディープラーニング アルゴリズムでは、猫のさまざまな視点をカバーする何千枚もの写真が必要になる場合があります。一方、人間の子どもは、家庭のペットを認識することを学ぶために、それほど明確で広範囲にわたる訓練を必要としません。

[[210899]]

ヒントン氏の考えは、世界についてのより多くの知識をコンピュータービジョンソフトウェアに組み込むことで、最高の AI システムと人間の幼児との間のギャップを縮めることです。そこで研究者たちは、猫の鼻や耳など物体のさまざまな部分や、空間内での相対的な位置を追跡するために使用できるカプセルニューラルネットワーク(粗い仮想ニューロンの小さなグループ)を考案しました。このようなカプセルを多数使ってニューラル ネットワークを形成することで、コンピューターは新しい種類の認識を獲得し、見る新しいシーンが実際には以前に見た物体の異なる視点にすぎないことを理解できるようになります。

ヒントンは 1979 年にはすでに独自の直感的な洞察力を培っていました。人間が想像するために脳をどのように使っているかを理解しようとしていたとき、コンピューター ビジョン システムは人間の脳の立体画像化機能を持つ必要があることに気付きました。ヒントン氏は2011年に初めてカプセルニューラルネットワークの予備設計を策定しました。彼の最新の論文では、人工知能分野の科学者たちが待ち望んでいた、より完全なアルゴリズムが紹介されている。 「誰もがジェフ・ヒトノンの次の飛躍を期待して待っている」とニューヨーク大学の画像認識教授、チョ・キョンヒョン氏は言う。

ヒントンのカプセルネットワークがどれほど大きな進歩であるかを判断するのは時期尚早だが、彼自身もそれをわかっている。 AIのベテランは、自分の直感が証拠によって裏付けられたことを静かに喜びつつ、カプセルネットワークは依然として大量の画像で証明する必要があり、現在のところ既存の画像認識ソフトウェアに比べて計算が遅いとも説明した。

しかしヒントン氏は、それらの欠点を克服できると楽観視している。 AI分野の他の専門家も彼の成熟したアイデアに期待を寄せている。

モントリオール大学教授で画像認識スタートアップ企業Twenty Billion Neuronsの共同設立者でもあるローランド・メミセビッチ氏は、ヒントン氏のカプセル型ニューラルネットワーク設計は、既存のシステムよりも一定量のデータからより多くの情報と理解を抽出できるはずだと語った。大規模に実証されれば、カプセルニューラルネットワークは、インターネット上の自撮り写真の海よりもはるかに多くの画像データがAIシステムをトレーニングする医療などの分野で役立つ可能性があります。

[[210900]]

ある意味では、ヒントンのカプセル ネットワークは AI ディープラーニング研究のトレンドに反するものです。ニューラル ネットワークの最近の成功の理由の 1 つは、人間が AI ソフトウェアにエンコードする知識をできるだけ少なくし、代わりに AI がゼロから学習して自ら物事の真実を解明できるようにすべきであるという点です。

ニューヨーク大学の心理学教授ゲイリー・マーカス氏は昨年、人工知能のスタートアップ企業をウーバーに売却した。ヒントンの***理論とアルゴリズムは新風をもたらしたと彼は語った。

マーカス氏は、AI 研究者は脳の構造や、視覚や言語などの主要なスキルを決定する構造を模倣するために、さらに努力する必要があると考えています。 「この特定のカプセル型ニューラルネットワークアーキテクチャがどこまで進むかを判断するのは時期尚早だが、ヒントン氏がこの分野の現在の定着した軌道の限界を押し広げているのを見るのは素晴らしいことだ」とマーカス氏は語った。

<<:  ウェブデザインに人工知能を活用する10の方法

>>:  JavaScript における一般的なソートアルゴリズムの詳細な説明

ブログ    
ブログ    

推薦する

エッジ AI について知っておくべきことすべて

エッジ AI では、システムを他のシステムに接続する必要がないため、ユーザーはデータをリアルタイムで...

卒業生は就職活動のためにアルゴリズムを知っておく必要があります。バイナリ検索をステップバイステップで教えます

1. 二分探索の背景配列またはコレクションに多数の要素が格納されている場合、特定の要素の位置または存...

人工知能の時代は私たちの生活にどのような影響を与えるのでしょうか?

これは視覚障害者向けに設計された特別な人工知能メガネです。このメガネを通して、視覚障害者は再びこの色...

CPU、GPU、NPU、FPGA はディープラーニングでどのように優位性を発揮するのでしょうか?

AIの応用が広まるにつれ、ディープラーニングは現在のAI研究と応用の主流の方法となっています。膨大...

人工知能はビッグデータの保存と管理の効率をどのように向上させるのでしょうか?

ビッグデータのソースが多数存在し、企業が利用できるデータの量も増加しているため、ストレージ管理者にと...

...

...

売上高2,684億元の背後にあるアリババのAI技術の全貌

先日終了した双十一では、天猫の取引額は2,684億元に達し、前年比25.7%増加した。この成果の裏に...

カメラ、レーダー、地図は不要、二足歩行ロボットは「自分の感覚」で歩く

二足歩行ロボットは高価で複雑、そして壊れやすい。バランスという観点で言えば、二足歩行は四足歩行よりは...

データが「生産手段」となるとき、透かし技術を使ってAIトレーニングデータの著作権を保護する方法をまとめた3つの論文

1. はじめに - AI トレーニング データに透かしを追加する理由ディープ ニューラル ネットワー...

スマートオフィス管理におけるAIの役割

スマート オフィスの概念は新しいものではありませんが、企業のオーナーや管理者が自動化の生産性の価値を...

CityDreamer: ワンクリックで境界のない 3D 都市を生成

近年、3D自然シーンの生成に関する研究は盛んに行われていますが、3D都市の生成に関する研究はまだほと...

北京市、企業のコンピューティングパワー使用コストを削減するためのAIコンピューティングバウチャー実施計画を発表

10月11日、北京市経済情報化局は「人工知能コンピューティングパワーバウチャー実施計画(2023~2...

EUがAIを活用して社会イノベーションを推進する方法

2020年の新型コロナウイルスの世界的な蔓延は、人類にとって永遠の記憶となることは間違いないだろう。...