今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレームのトレーニング時間を達成し、新記録を樹立したと主張した。 IBM は、最先端のテクノロジーに匹敵する AI モデル トレーニングのブレークスルーを達成しました。ネットユーザーからは信じられないという声が上がった。 IBMは今年初めに発表した論文で、ニューラル・コンピュータについて詳しく説明しました。これは、新興の AI アルゴリズムと計算神経科学の研究開発用に設計された再構成可能な並列処理システムです。 今週、同社はニューラルコンピューターの最初のアプリケーションであるディープニューロエボリューションシステムを実演した。このシステムは、Atari 2600 ハードウェア実装、画像前処理、AI アルゴリズムを最適化されたパイプラインに組み合わせています。 実験で報告された結果は最先端のものと匹敵するが、さらに重要なのは、IBM がシステムが 1 秒あたり 120 万フレームのトレーニング時間を達成し、新記録を樹立したと主張していることである。 ネットユーザーたちは「信じられない!」と叫んだ。 ニューラルコンピュータは、AIコンピューティングの軍拡競争における警告信号のようなものです。 OpenAIが公開した分析によると、最大規模のAIトレーニング実行で使用されるコンピューティング量は2012年から2018年にかけて30万倍に増加し、トレーニング時間は3.5か月で倍増し、ムーアの法則のペースをはるかに上回っています。 AlexNet から AlphaGo Zero へ: 計算量は 30 万倍 まずはIBMのニューラルコンピュータについて学びましょう IBM ニューラル・コンピュータIBM のニューラル コンピュータは、IBM の長期戦略パートナーである Xilinx のフィールド プログラマブル ゲート アレイ (FPGA、製造後に構成できるように設計された集積回路) である 432 個のノード (16 モジュール カードごとに 27 個のノード) で構成されています。 IBMのニューラルコンピュータはモジュールカードあたり27個のノードを持つ 各ノードには、Xilinx Zynq システムオンチップ (同じチップ上に FPGA とペアになったデュアルコア ARM A9 プロセッサ) と 1 GB の専用 RAM チップが搭載されています。 ノードは 3D グリッド トポロジーで配置され、シリコン ウェーハまたはチップを完全に貫通するシリコン貫通ビアと呼ばれる電気接続によって垂直に相互接続されます。 ノード番号は3Dメッシュトポロジーで確認できます ネットワークに関しては、FPGA は複数の異なる通信チャネルを確立するために、モジュール カード間の物理的な通信へのアクセスを提供します。 理論上は、1 枚のカードで最大 432GB/秒の転送速度をサポートでき、ニューラル コンピューターのネットワーク インターフェイスは自動的に調整され、特定のプログラムに合わせて徐々に最適化されます。 「私たちのシステムは、各ノードがアプリケーション固有のプロセッサ オフロードを可能にするという点でユニークです。これは、私たちが知る限り、あらゆる規模の並列コンピュータでは利用できない機能です」と、ニューラル コンピュータ フレームワークの概要を説明する論文の共著者は書いています。「パフォーマンスが重要なステップのほとんどは、ARM プロセッサのサポートにより、FPGA でオフロードおよび最適化されます。」 ニューラル コンピューターについてある程度わかったところで、IBM はニューラル コンピューターの最初のアプリケーション デモンストレーションで、どのようにして 120 万フレーム/秒という記録破りのトレーニング時間を達成したのでしょうか。
調べてみましょう Atari ゲームで AI をテストするビデオ ゲームをテストに使用することは、AI および機械学習の研究に最適なプラットフォームです。 これらはテストにすぐに利用できるだけでなく、大規模に実行しても安価です。 例えば、強化学習などの特定の分野では、報酬を得るために、AIは環境と相互作用することで最適な行動を学習し、ゲームのスコアが最も直接的な報酬となります。 ゲーム分野で開発された AI アルゴリズムは、タンパク質の折り畳み予測研究など、より実用的な用途に有望であることが示されています。 IBM ニューロコンピュータのテスト結果が再現されれば、このシステムを使用して AI アルゴリズムの開発を加速できる可能性があります。 研究者らはニューラルコンピューターのカード1枚につき26個のノードを使用し、合計416個のノードを使用した。 Atari ゲーム アプリケーションの 2 つのインスタンスが 416 個の FPGA ノードそれぞれで実行され、各インスタンスが並列に実行されて最大 832 個のノードまで拡張されます。 各インスタンスは、指定された Atari 2600 ゲームからフレームを抽出し、画像の前処理を実行し、機械学習モデルを通じて画像を実行し、ゲーム内のアクションを実行します。 ディープ ニューラル ネットワークを使用して FPGA 上でゲームをトレーニングするスクリーンショット 最高のパフォーマンスを実現するために、研究チームは Atari 2600 のエミュレーションを避け、代わりに FPGA を使用してコンソールの機能をはるかに高い周波数で実装することを選択しました。 彼らは、現代のハードウェアを使用してコンソールとアーケードマシンを再現することを目的としたオープンソースの MiSTer プロジェクトのフレームワークを採用し、Atari 2600 のプロセッサクロック周波数を 3.58 MHz から 150 MHz に上げ、1 秒あたり約 2,514 フレームを生成しました。 画像の前処理ステップでは、IBM のアプリケーションはフレームをカラーからグレーに変換し、ちらつきを除去し、画像をより小さい解像度に再スケーリングしてから、フレームを 4 つのグループに積み重ねます。 次に、ゲーム環境を推測する AI モデルと、AI モデルによって予測された最大報酬を識別して次のフレームのアクションを選択するサブモジュールに渡されます。 IBM の研究者は 5 回の実験を通じて、ニューラル コンピューター上で 59 個の Atari 2600 ゲームを実行しました。 結果によると、このアプローチは他の強化学習技術ほどデータ効率が良くなく、合計 60 億のゲーム フレームが必要となり、Montezuma’s Revenge や Pitfall などの難易度の高い探索型ゲームでは失敗しました。 Deep Qネットワークは59試合中30試合に勝利し、トレーニングに10日かかりましたが、IBMチームはトレーニングにわずか6分しかかかりませんでした(トレーニングフレーム2億枚)。 59 の Atari 2600 ゲームの 60 億のトレーニング フレームを備えたニューラル コンピューターで実行し、2 桁も短い時間 (2 時間 30 分) でトレーニングしながら、36 のゲームで Deep Q ネットワークを上回りました。 |
<<: 企業はビッグデータ アルゴリズムを使用して効果的なリンクを構築できますか?
>>: ついにデータサイエンス、機械学習、人工知能を説明する人が現れる
グーグルは10月16日、今月13日に自社の生成AI製品のユーザーが当局によって保護されると発表した。...
近年の科学技術の急速な発展に伴い、人工知能の概念が徐々に明確になってきています。特にOTT業界の重要...
汎用人工知能と人工知能の未来を探ります。汎用人工知能 (AGI) は、人工知能 (AI) 研究の分野...
自動化ほど製造業界に大きな影響を与え、破壊的な影響を与えたテクノロジーはほとんどありません。自動化の...
AI を活用して雇用を減らし、コストを削減する方法を考えている企業は、間違っていると思います。最近、...
サイバーセキュリティは、おそらく今日すべての企業が直面している最大の脅威です。これらの課題は新しいも...
ルールによれば、ビットコインは2016ブロックごと、つまり約2週間ごとにマイナーの難易度をリセットし...
2030 年までに RSA 暗号を解読できるマシンが登場するでしょうが、まずは量子センシングやその他...
[[421481]]この記事はWeChatの公開アカウント「Pythonとビッグデータ分析」から転載...
[51CTO.com クイック翻訳] 人工知能が私たちの日常生活に入り込んでいることに気づいています...
「中東のシリコンバレー」と呼ばれるイスラエルはハイテク産業が発達しており、特にチップ産業や半導体技術...
2016年3月にアルファ碁が囲碁の世界チャンピオン、イ・セドルを破って以来、人工知能は大きな注目を集...