ニューラルコンピュータAIモデルのブレークスルー!トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

ニューラルコンピュータAIモデルのブレークスルー!トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

[[326502]]

今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレームのトレーニング時間を達成し、新記録を樹立したと主張した。 IBM は、最先端のテクノロジーに匹敵する AI モデル トレーニングのブレークスルーを達成しました。ネットユーザーからは信じられないという声が上がった。

IBMは今年初めに発表した論文で、ニューラル・コンピュータについて詳しく説明しました。これは、新興の AI アルゴリズムと計算神経科学の研究開発用に設計された再構成可能な並列処理システムです。

今週、同社はニューラルコンピューターの最初のアプリケーションであるディープニューロエボリューションシステムを実演した。このシステムは、Atari 2600 ハードウェア実装、画像前処理、AI アルゴリズムを最適化されたパイプラインに組み合わせています。

実験で報告された結果は最先端のものと匹敵するが、さらに重要なのは、IBM がシステムが 1 秒あたり 120 万フレームのトレーニング時間を達成し、新記録を樹立したと主張していることである。

ネットユーザーたちは「信じられない!」と叫んだ。

ニューラルコンピュータは、AIコンピューティングの軍拡競争における警告信号のようなものです。

OpenAIが公開した分析によると、最大規模のAIトレーニング実行で使用されるコンピューティング量は2012年から2018年にかけて30万倍に増加し、トレーニング時間は3.5か月で倍増し、ムーアの法則のペースをはるかに上回っています。

AlexNet から AlphaGo Zero へ: 計算量は 30 万倍

まずはIBMのニューラルコンピュータについて学びましょう

IBM ニューラル・コンピュータ

IBM のニューラル コンピュータは、IBM の長期戦略パートナーである Xilinx のフィールド プログラマブル ゲート アレイ (FPGA、製造後に構成できるように設計された集積回路) である 432 個のノード (16 モジュール カードごとに 27 個のノード) で構成されています。

IBMのニューラルコンピュータはモジュールカードあたり27個のノードを持つ

各ノードには、Xilinx Zynq システムオンチップ (同じチップ上に FPGA とペアになったデュアルコア ARM A9 プロセッサ) と 1 GB の専用 RAM チップが搭載されています。

ノードは 3D グリッド トポロジーで配置され、シリコン ウェーハまたはチップを完全に貫通するシリコン貫通ビアと呼ばれる電気接続によって垂直に相互接続されます。

ノード番号は3Dメッシュトポロジーで確認できます

ネットワークに関しては、FPGA は複数の異なる通信チャネルを確立するために、モジュール カード間の物理的な通信へのアクセスを提供します。

理論上は、1 枚のカードで最大 432GB/秒の転送速度をサポートでき、ニューラル コンピューターのネットワーク インターフェイスは自動的に調整され、特定のプログラムに合わせて徐々に最適化されます。

「私たちのシステムは、各ノードがアプリケーション固有のプロセッサ オフロードを可能にするという点でユニークです。これは、私たちが知る限り、あらゆる規模の並列コンピュータでは利用できない機能です」と、ニューラル コンピュータ フレームワークの概要を説明する論文の共著者は書いています。「パフォーマンスが重要なステップのほとんどは、ARM プロセッサのサポートにより、FPGA でオフロードおよび最適化されます。」

ニューラル コンピューターについてある程度わかったところで、IBM はニューラル コンピューターの最初のアプリケーション デモンストレーションで、どのようにして 120 万フレーム/秒という記録破りのトレーニング時間を達成したのでしょうか。

[[326505]]

調べてみましょう

Atari ゲームで AI をテストする

ビデオ ゲームをテストに使用することは、AI および機械学習の研究に最適なプラットフォームです。

これらはテストにすぐに利用できるだけでなく、大規模に実行しても安価です。

例えば、強化学習などの特定の分野では、報酬を得るために、AIは環境と相互作用することで最適な行動を学習し、ゲームのスコアが最も直接的な報酬となります。

ゲーム分野で開発された AI アルゴリズムは、タンパク質の折り畳み予測研究など、より実用的な用途に有望であることが示されています。 IBM ニューロコンピュータのテスト結果が再現されれば、このシステムを使用して AI アルゴリズムの開発を加速できる可能性があります。

研究者らはニューラルコンピューターのカード1枚につき26個のノードを使用し、合計416個のノードを使用した。

Atari ゲーム アプリケーションの 2 つのインスタンスが 416 個の FPGA ノードそれぞれで実行され、各インスタンスが並列に実行されて最大 832 個のノードまで拡張されます。

各インスタンスは、指定された Atari 2600 ゲームからフレームを抽出し、画像の前処理を実行し、機械学習モデルを通じて画像を実行し、ゲーム内のアクションを実行します。

ディープ ニューラル ネットワークを使用して FPGA 上でゲームをトレーニングするスクリーンショット

最高のパフォーマンスを実現するために、研究チームは Atari 2600 のエミュレーションを避け、代わりに FPGA を使用してコンソールの機能をはるかに高い周波数で実装することを選択しました。

彼らは、現代のハードウェアを使用してコンソールとアーケードマシンを再現することを目的としたオープンソースの MiSTer プロジェクトのフレームワークを採用し、Atari 2600 のプロセッサクロック周波数を 3.58 MHz から 150 MHz に上げ、1 秒あたり約 2,514 フレームを生成しました。

画像の前処理ステップでは、IBM のアプリケーションはフレームをカラーからグレーに変換し、ちらつきを除去し、画像をより小さい解像度に再スケーリングしてから、フレームを 4 つのグループに積み重ねます。

次に、ゲーム環境を推測する AI モデルと、AI モデルによって予測された最大報酬を識別して次のフレームのアクションを選択するサブモジュールに渡されます。

IBM の研究者は 5 回の実験を通じて、ニューラル コンピューター上で 59 個の Atari 2600 ゲームを実行しました。

結果によると、このアプローチは他の強化学習技術ほどデータ効率が良くなく、合計 60 億のゲーム フレームが必要となり、Montezuma’s Revenge や Pitfall などの難易度の高い探索型ゲームでは失敗しました。

Deep Qネットワークは59試合中30試合に勝利し、トレーニングに10日かかりましたが、IBMチームはトレーニングにわずか6分しかかかりませんでした(トレーニングフレーム2億枚)。

59 の Atari 2600 ゲームの 60 億のトレーニング フレームを備えたニューラル コンピューターで実行し、2 桁も短い時間 (2 時間 30 分) でトレーニングしながら、36 のゲームで Deep Q ネットワークを上回りました。

<<:  企業はビッグデータ アルゴリズムを使用して効果的なリンクを構築できますか?

>>:  ついにデータサイエンス、機械学習、人工知能を説明する人が現れる

ブログ    
ブログ    
ブログ    

推薦する

...

...

機械学習における皇帝の新しい服の発見

[[246000]]ビッグデータダイジェスト制作編曲:李佳、メロディー、雲周機械学習は、データ内のパ...

自己教師あり学習:AI技術の将来の方向性

ディープラーニングは人工知能の分野に多大な貢献をしてきましたが、その技術自体には依然として致命的な欠...

JavaScript でアルゴリズムの複雑さを学ぶ

この記事では、アルゴリズムの文脈における「二次」や「n log(n)」などの用語の意味について説明し...

機械学習が通信業界にもたらすメリット

通信分野における機械学習技術は、ネットワーク事業者がサービス品質を向上させ、利益を増やし、顧客離れを...

...

...

マシンビジョンは人工知能を複数の業界に根付かせる

インターネットと人工知能が2019年全国人民代表大会で最もホットな話題の一つになることは間違いありま...

今日のデータとAI市場における不確実性にどう対処するか

データ分析と人工知能 (AI) 市場に関するニュースをフォローしている人なら誰でも、過去数年間で多く...

顔認証決済だけでは不十分、マスターカードは歩行、心拍、静脈による決済を検討

[[317535]]顔認証決済や指紋認証決済だけでは不十分だ。世界的決済ソリューション大手のマスター...

とても驚きました! GPT-4V錯視チャレンジ記録: 間違っているはずのものは間違っていない、間違っているはずのないものも間違っている

GPT-4V は視覚エラーマップに挑戦し、その結果は「衝撃的」でした。 「どちらの側が明るいですか」...

2020年のライフスタイルに関する2008年の予測:そのほとんどが実現

米国のピュー・リサーチ・センターは2008年に、主に以下のような2020年のライフスタイルを予測しま...

この「PhD Study Simulator」はとてもリアルです。何回諦めるように説得されるか試してみてください。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ドローン技術が牽引する未来のスマートシティ

テクノロジーが進化し続けるにつれ、ドローンが「破壊」と同義だった時代は終わりました。現在、ドローンは...