大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

人間は機械にゲームをさせることに魅了されているようだ。1770 年という早い時期に、発明家たちは「トルコ機械機械」と呼ばれるチェスをプレイする機械を発明し、どんなゲーム プレイヤーにも勝てると主張した (実際は、これは人工知能の詐欺だった)。1997 年、IBM のスーパー コンピューター Deep Blue がゲームでカスパロフを破り、標準的なゲーム時間制限内で世界チェス チャンピオンを破った最初のコンピューター システムとなった。その後、DeepMind の Hassabis 率いるチームが AlphaGo を開発し、人間のプロの囲碁プレイヤーを破った最初の知的存在であり、囲碁の世界チャンピオンを破った最初の存在となった。

なぜこれほど多くの研究者が生物がどのように情報を伝達し、認識するかに興味を持っているのでしょうか?率直に言えば、これは生物が、急速に限界に達しつつあると思われる今日のコンピューティング技術よりも優れているためです。市販のセンサーはコンピュータが理解するには多すぎるデータを生成するため、コンピュータはそれを理解するために大量のエネルギーを消費します。しかし、生物界では、目立たない蚊の脳はわずか20万個程度のニューロンで構成されているものの、飛行制御能力や障害物回避能力は人間が構築したものよりはるかに優れています。エネルギー消費量で言えば、ミツバチの脳には100万個のニューロンがありますが、消費電力はわずか0.1mWです。人間の脳は、日常の仕事や行動などに対応するために約20Wのエネルギーを消費するだけで済みます。しかし、GPT-3 を例にとると、機械の場合、1 回のトレーニングのエネルギー消費量は、デンマークの 126 世帯の年間エネルギー消費量に相当します。これは生物学的知能と従来の人工知能との大きな違いです。

現時点では、最先端のスーパーコンピュータでさえ脳の複雑さに匹敵することはできません。コンピュータは線形であり、中央処理装置とメモリ チップ間のデータ転送には主に高速ハブに依存しています。対照的に、脳はあらゆる面で相互接続されており、現代のコンピューターよりも何十億倍も高密度かつ多様です。近年、コンピュータの小型化により従来のコンピューティングの性能は大幅に向上しましたが、メモリと中央処理装置間のデータ転送には大量のエネルギーが消費され、過剰な熱が発生します。このボトルネックにより、コンピュータのさらなる改善が制限されています。

近年、脳の神経系にヒントを得たニューロモルフィック コンピューティングは、人工知能の分野で重要な研究方向となっています。最近、オーストラリアのウエスタン シドニー大学の国際ニューロモルフィック システム センター (ICNS) の研究者が、テーブル サッカーをプレイするニューロモルフィック ロボットを開発しました。

ニューロモルフィックセンサーで動くボールを追跡

まず、ICNS はピンボールをプレイできる小型ロボットのデモを構築しました。ロボットはテーブルの上に 3 つの小さなボールを保持することができ、デモ効果は人間のプレイヤーとほぼ同じです。驚くべきことに、数十万または数百万の人工ニューロンを備えた一般的なディープラーニング システムとは異なり、この小さなニューロモルフィック デバイスは、わずか 2 つの人工ニューロンを使用して、イベントベースのイメージャーの入力を解釈し、それに基づいて動作することができます。

ピンボール ゲームで有望な結果を達成した後、チームは、ニューロモルフィック研究をさらに進めるには、より複雑で要求の厳しいタスクが必要であると判断し、テーブル サッカーに目を向けました。

テーブルサッカーのすべてのアクションは 2 次元で行われ、テーブル上の小さな人形を制御するために必要なのは 8 つのモーターだけですが、これを実現するのは想像以上に困難です。これまで何年にもわたり、ロボットのフーズボール選手を作ろうという試みは数多く行われてきましたが、成功の度合いはさまざまで、ニューロモルフィックセンサーを使ったものは一つもありませんでした。

一般的に言えば、ニューロモルフィック センサーを使用してボールを追跡するのは簡単ですが、フーズボールははるかにダイナミックなゲームです。特に人間のプレイヤーの場合は、各プレイヤーの戦略が異なり、動きが必ずしも論理的または必然的であるとは限りません。

一部の研究者は、非ニューロモルフィックソリューション(ディープラーニングなど)を使用してフーズボールをプレイしようとしましたが、ディープラーニングニューラルネットワークが処理される方法(通常はGPU上)は、GPUが一度に1フレームではなく画像のバッチを処理するため、このタスクにはあまり適していません。フーズボールでは、プレイヤーはボールが過去にどこにあったか、あるいは現在どこにあるのかを気にしません。彼らが気にするのは、ボールが次にどこにあるかだけです。

第二に、研究者たちは、ディープラーニングの手法は問題の小さな変化に非常に敏感であることを発見しました。カメラのわずかな揺れ、プレーヤーがさまざまな方向に引っ張る際のテーブルのわずかな傾き、さらには照明条件の変化でさえ、ディープラーニングのボールトラッカーのパフォーマンスを低下させる可能性があります。

ICNS の研究では、よりシンプルで高速なニューロモルフィック ネットワーク、つまりカメラからの各イベント (ニューロモルフィック コンピューティングではスパイクとも呼ばれる) を処理し、それを使用してボールの位置の推定値を更新するアルゴリズムに注目しています。

このニューロモルフィック ネットワークは、多数のニューロン層を使用する代わりに、それぞれ 18 x 18 ピクセルの 16 個の小さなパターン認識ネットワークを使用するため、ゲームでは常に 364 ピクセルのみが考慮され、ネットワークが非常に高速かつ正確になります。イベント駆動型アルゴリズムはカメラによって生成される時間に敏感なデータに対応する必要があり、各イベントにはいくつかの小さく単純な計算のみが必要であるため、速度が重要です。このシステムは経験豊富なプレーヤーにとって大きな脅威にはならないが、ネットトラッキングによってボールがゴールに入るのを阻止することはすでに可能であり、ゴールを決める機能はまだ開発中である。

原理的には、ディープラーニングでも同様のことが可能ですが、画像全体を調べ、ネットワークの各層で桁違いの計算を実行する必要があります。これは、このシステムが使用するデータよりもはるかに多いだけでなく、イベント駆動型出力を効果的にフレームに変換します。

現在、ICNS のアルゴリズムは、ボールの見た目と次にボールがどこにあるかをどれだけ正確に予測できるかの両方を学習できる遺伝的最適化アルゴリズムを使用して、記録されたイベント データに基づいてオフラインでトレーニングされています。アルゴリズムは、エンコードではなく、データ自体からボールを​​識別する方法を学習します。重要なのは、このアルゴリズムは、ボールがどのように動くべきかという予想からではなく、ボールが実際にどのように動くかから学習するという点です。

次のステップとして、ICNS はオフラインのトレーニングベースの学習をリアルタイムのオンライン学習に移行し、ゲーム中にネットワークが継続的に学習して適応できるようにします。これは、システムがトレーニングされた特定のテーブルに対する感度に寄与する可能性があります。

このイベント駆動型アルゴリズムは、スパイキング ニューロモルフィック ハードウェアを使用して動作するアルゴリズムの中間ステップです。脳にヒントを得たプロセッサはすでにいくつか存在している。その中には、インテルの脳型チップ Loihi や、情報をパルス列としてエンコードし、イベントベースのセンサーに自然に適合するニューロモルフィック プロセッサの世界初の商用製造業者である BrainChip の Akida などがある。安定したスパイキング アルゴリズムが利用可能になると、ニューロモルフィック コンピューティングはさらに進歩するでしょう。

最後に、ICNS チームは、フーズボールをプレイするロボットを設計する際には、コストを抑え、プロジェクト全体をオープンソース化することに重点を置いたと述べました。

<<:  マスク氏:大胆なアイデアがあるんです!信号機にAIビジョンプラグインを追加する

>>:  USTC 統合入力フィルタリング フレームワーク: すべてのデータ モダリティをサポートするフィルタリング可能性の最初の理論的分析

ブログ    
ブログ    

推薦する

プログラマーにとって「朗報」:AI が人間のコード作成を支援することは信頼できるのか?

[[264055]]データマップ:ゲーム会社のプログラマー。写真提供:ユー・チン、中国新聞社午前9...

...

Microsoft が大規模コード モデル WaveCoder をリリースしました。 4つのコードタスクと20,000のインスタンスデータセットにより、LLMの一般化能力が大幅に向上しました。

高品質のデータ セットを使用して命令のチューニングを実行すると、大規模なモデルのパフォーマンスを迅速...

「ブロックチェーン+人工知能」は医療金融やその他の応用シナリオに応用されています

最近、国家インターネット金融セキュリティ技術専門家委員会と上海振聯公司は共同で「ブロックチェーン+A...

...

直接的な選好最適化戦略を用いたミストラル7bモデルの微調整

翻訳者|朱 仙中レビュー | Chonglou導入通常、事前トレーニング済みの大規模言語モデル (L...

Evil GPT に新たなメンバーが加わりました: Dark Web には 3,000 を超えるサブスクリプションがあり、発行者の正体は依然として謎のままです。

著者: 徐潔成物事の表面と内部の性質の間には常に微妙な境界線があります。過去数か月間、私たちは人工知...

AI投資から利益を得るための3つの鍵

人工知能 (AI) の専門家や機械学習 (ML) サービスの利用可能性が高まるにつれて、AI は多く...

3年間の車両インターネット無料化により、自動運転の産業化が加速

最近、国家発展改革委員会と財政部は、新技術と新事業の発展を奨励するために、5905-5925MHz周...

AIと機械学習が克服すべき3つのハードル

[[343495]] [51CTO.com クイック翻訳] 人工知能革命はまだ初期段階ですが、人工知...

...

AI温度測定から警備ロボットまで、インテリジェントセキュリティは新たな「ゲートキーパー」となるのでしょうか?

セキュリティシステムといえば、「監視カメラ」や「電子アクセス制御」を思い浮かべる人が多いでしょう。人...

IoT と AI を組み合わせたユースケースにはどのようなものがありますか?

モノのインターネットは現代のビジネスと経済全体を急速に変革しています。この革新的なテクノロジーにより...

ディープラーニング入門 - TensorFlow を使ってモデルをトレーニングする方法を教えます

[[206688]]導入Tensorflow はバージョン 1.0 へのアップデート後に多くの新機能...

顔認識の悪用は情報セキュリティ上の懸念を引き起こす

食べ物を注文した後、カメラをかざすだけで支払いが完了します。ホテルに宿泊する場合、顔をスキャンしない...