人工知能の新たなブレークスルー:ニューラルネットワークが画像内の物体を自律的に識別できる

人工知能の新たなブレークスルー:ニューラルネットワークが画像内の物体を自律的に識別できる
海外メディアの報道によると、フィンランドのコンピューター科学者は神経生物学的手法を用いて人工知能研究で新たな進歩を遂げており、ディープラーニングニューラルネットワークは画像内の物体を75%の精度で自律的に識別できるという。

[[183504]]

人間の脳は素晴らしいです。何十年にもわたる研究を経ても、人間は未だに人間の脳の超高速計算速度を再現できていません。現在、コンピューター科学者が利用できる最も優れたツールはニューラル ネットワークです。このような大規模なコンピュータ ネットワークは、人間の中枢神経系と同様の方法で複雑な問題を解決するようにトレーニングすることができ、さまざまなレベルのニューロンを使用して問題のさまざまな部分を解決し、最終的にそれらを適切な答えに統合します。

問題は、そのようなニューラル ネットワークが問題を解決する方法を学習する前に、大量のデータ入力とトレーニングが必要になることです。たとえば、トレーニング データの優れたソースとしては、手動で注釈が付けられた 100 万枚の写真を含む視覚情報の巨大なデータベースである ImageNet があります。

これは「教師あり学習」と呼ばれますが、真の人工知能とは、ニューラル ネットワークが「教師なし学習」を自動的に完了する方法を学習する必要があることを意味します。フィンランドのスタートアップ企業Curious AIがまさに実現したいと考えているのは、まさにそれだ。

「人間の脳は、教師なし学習を多く行っています」と、ヘルシンキで開催された技術業界カンファレンス「スラッシュ 2016」で、キュリアス AI の最高技術責任者アンディ・ラスムス氏は語った。「赤ちゃんにスプーンとは何かを教える必要はありません。赤ちゃんは環境から学び、自動的に概念を形成します。」

「人間の脳は、物体に基づいて概念を形成するのが簡単です。これは心理学で『ゲシュタルト理論』として研究されてきました。人間の脳は、形、色、動き、パターンが似ているものをグループ化します。私たちが最初に行ったのは、ディープラーニング システムが人間の脳と同じように物体を分類できるようにすることでした。」

神経科学を人工ニューラルネットワークに応用する

神経科学では、レートコーディングと呼ばれる理論によれば、脳内のニューロンの発火率が高ければ高いほど、ニューロンはより活発になります。ニューロンは発火し続けます。 1980 年代に、科学者たちはニューロンが集まってさまざまな情報を表すことを発見しました。

この理論は「一時コーディング」と呼ばれます。理論によれば、ニューロンの発火のタイミングは重要であり、正確な発火のタイミングによって、何万ものニューロンの中からどのニューロンが同じグループに属するかが決まります。したがって、いくつかのニューロンが同時に発火し、事務用品の山の中にある赤い布切れなど、脳が物体の集合の中の特定の物体を認識するのを助けると同時に、ニューロンの別のサブセットが、他の物体が背景情報であることを脳に伝えます。

「私たちのコンピューターアルゴリズムには一時的なエンコードメカニズムが組み込まれています。ニューラルネットワークの各層に複数のコピーを保存します。ニューラルネットワーク全体は4回複製されます。つまり、システムは各コピーが特定のオブジェクトを表していることを学習でき、これらのオブジェクトを結合すると元の画像と一致する可能性があるということです」と、Nvidiaの元ソフトウェアエンジニアで、現在はフィンランドのアアルト大学でディープラーニングの博士研究を行っているラスムス氏は述べた。

「画像を4つの異なるグループに分割することで、ニューラル ネットワークは画像を独自にエンコードできます。これは教師なし学習であり、システムにラベルを付ける必要はありません。ニューラル ネットワークに画像を表示すると、自動的に画像が要素 (画像内のオブジェクトなど) に分解されます。」

ニューラル ネットワークが画像を個々の要素に分解すると、画像が重なってぼやけることがなくなるため、オブジェクトの分類と識別が容易になります。

知覚的グループ化はディープラーニングに革命をもたらす可能性がある

研究者らは、最初にニューラルネットワークに、教師なしで画像を分析し、オブジェクトを整理することを教え、次に画像にラベル付けされた情報を追加して(教師あり学習)、システムが何を学習したかを観察しました。その結果、Curious AI の Tagger システムは 75.1% の精度を達成できることがわかった。

比較すると、従来のニューラル ネットワークの精度はわずか 21% で、ランダムな推測よりもわずか 1% 高いだけです。

「これは、教師なし学習をさらに一歩進めた革命的な研究です」とラスムス氏は言う。「機械に物体の概念を与えることで、人間の脳にもっと近い教師なし学習を実現しています。これは、ニューラル ネットワークがより高度な推論を実行し、物体と環境の関連性を学習できるようにする将来の研究に役立つ可能性があります。」

「現在のシステムでは、コンピューターは統計的な視点で世界を捉えています。私たちが暮らす世界にコンピューターを導入したいのであれば、機械が人間のように世界を理解することが非常に重要です。人間の視覚は私たちにとってとても自然なことなので、コンピューターの視覚がなぜそれほど劣っているのか理解できないことがよくあります。」

同社の関連論文「Tagger: Deep Unsupervised Perceptual Grouping」は、12月7日にバルセロナで開催されるNeural Information Processing Systems 2016ディープラーニングカンファレンスで発表される予定だ。

Curious AI は、実際の AI システムでディープラーニング技術を試験的に導入する業界パートナーを募集しています。同社は現在、無人運転技術の開発を希望する自動車メーカーと連絡を取っている。 「画像を4つの異なるグループに分割することで、ニューラルネットワークは画像を独自にエンコードできます。これは教師なし学習であり、システムにラベルを付ける必要はありません。画像をニューラルネットワークに表示すると、自動的に画像を要素(画像内のオブジェクトなど)に分割します。」ニューラルネットワークが画像を個別の要素に分割すると、オブジェクトが互いに重なり合ってぼやけた画像になることがなくなるため、オブジェクトの分類と識別が容易になります。 知覚的グループ化はディープラーニングに革命を起こす可能性があります。研究者は最初に、ニューラル ネットワークに、教師なしで画像を分析し、オブジェクトを整理する方法を教え、次に、システムが学習した内容を観察するために、画像にラベル付けされた情報を追加しました (教師あり学習)。その結果、Curious AI の Tagger システムは 75.1% の精度を達成できることがわかった。 比較すると、従来のニューラル ネットワークの精度はわずか 21% で、ランダムな推測よりもわずか 1% 高いだけです。 「これは革命的な研究であり、教師なし学習をさらに一歩進めたものです」とラスムス氏は言う。「機械に物体の概念を与えることで、人間の脳に似た教師なし学習を実現しています。これは、ニューラル ネットワークがより高度な推論を実行し、物体と環境の関連性を学習できるようにする将来の研究に役立つでしょう。」 「現在のシステムでは、コンピューターは統計ベースの世界観で動作します。コンピューターを人間の住む世界に入れたい場合、機械が人間のように世界を理解することが非常に重要です。人間の視覚は私たちにとって非常に自然なため、コンピューターの視覚がなぜそれほど貧弱なのかを理解するのは難しいことがよくあります。」 同社の対応する論文「Tagger: Deep Unsupervised Perceptual Grouping」は、12 月 7 日にバルセロナで開催される「Neural Information Processing Systems 2016」ディープラーニング カンファレンスで発表される予定です。 Curious AI は、実際の AI システムでディープラーニング技術を試験的に導入する業界パートナーを募集しています。同社は現在、無人運転技術の開発を希望する自動車メーカーと連絡を取っている。

<<:  ファイアウォールではできないことを人工知能で実現できるでしょうか?

>>:  機械に記憶を与える: DeepMind の主要研究は柔軟な重み統合アルゴリズムを提案

ブログ    
ブログ    
ブログ    

推薦する

ゲームにおける経路探索アルゴリズムの深い理解

World of Warcraft などの MMOARPG ゲームをプレイしたことがあるなら、キャラ...

LeCun 氏はリツイートしました: 中国がトップ AI カンファレンスのリストで首位を占め、米国が 2 位です!中国と米国が世界の数学計算分野を支配している

最近、「科学は戦略だ」というネットユーザーが、近年いくつかの海外の主要メディアや調査機関がまとめたグ...

...

独学で機械学習エンジニアを目指す人のための 10 の戒律

コードを書くのは少し憂鬱になるので、色に囲まれる必要があります自己規律や自己学習という言葉を軽く受け...

...

...

IDC:2026年までに国内市場の端末のほぼ半数がハードウェアレベルのAIエンジン技術を搭載

市場調査会社IDCは7月25日、近年の人工知能の急速な進化と発展により、ビッグデータモデルはますます...

AIの有効性はサイバーセキュリティでは限られているが、サイバー犯罪では無限である

AI は大きな可能性を秘めているにもかかわらず、サイバーセキュリティにおける AI の応用は非常に限...

科学者たちは、人間のチームが海洋ゴミを見つけるのを助けるために人工知能を搭載したドローンを開発している

ニューアトラス誌の報道によると、海洋ゴミは、海に漂うゴミと海岸に打ち上げられるゴミの両方の形で大きな...

...

2019年に人工知能をマスターするには?世界のAI専門家が答えを教えます

[[265422]]人工知能はビジネスを変えています。自然言語処理やインテリジェント音声からモノのイ...

マルチエージェントシステムにおける協力:MASにおける不確実性、社会的メカニズム、強化学習の探究

マルチエージェント システム (MAS) は、共通の目標または個別の目標を達成するために相互に対話お...

ロボティック・プロセス・オートメーション技術の需要が急増

Adroit Market Research によると、世界のロボットプロセス自動化技術市場は 20...

...

2018 年のエンタープライズ AI の良い点と悪い点

人工知能の応用はまだ機械学習タスクに限定されていますが、アルゴリズムとハードウェアは徐々に融合してお...