光学行列乗算は人工知能をどう変えるのか

光学行列乗算は人工知能をどう変えるのか

現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが、この進歩に伴い、計算能力の大幅な増強が必要になりました。既存のトランジスタベースのコンピューティングは物理的な限界に近づいており、増大するコンピューティング需要に対応するのにすでに苦労しています。

大企業は、独自のカスタム チップ ソリューションを開発することでこの問題に対処しようとしてきました。ただし、ハードウェアのボトルネックは、従来の電子プロセッサでは克服できないほど深刻になる可能性があります。では、テクノロジーはどのようにして、急増するコンピューティング能力の需要に十分対応できるのでしょうか?

行列の乗算

大規模言語モデルでは、計算タスクの 90% 以上で行列乗算が使用されます。行列乗算は、乗算と加算の基本演算を構造化された方法で実行することにより、人工知能のさまざまな機能ブロックをサポートします。言語モデルだけではありません。この基本的な線形代数演算は、ほぼすべての種類のニューラル ネットワークの基礎であり、ニューロンの大規模な相互接続を可能にし、画像分類やオブ​​ジェクト検出のための畳み込みを実行し、順次データを処理します。これは単純な概念ですが、人工知能やその他無数のアプリケーションを動かすデータを効果的に操作および変換するために不可欠なものであり、行列乗算の重要性を過大評価することはできません。

AI モデルが大きくなるにつれて、より多くの行列演算を実行する必要があり、より多くの計算能力が必要になります。要求される性能を達成するために、電子機器は現在でも限界まで追い込まれています。他に選択肢はありますか?

光学行列乗算

光学は、光ファイバーネットワークにおける光通信に代表されるように、さまざまな方法で私たちの生活を変えるために使用されてきました。光コンピューティングは当然の次のステップです。デジタル エレクトロニクスでは、最も単純な算術演算を実行するために多数のトランジスタが必要ですが、光コンピューティングでは物理法則を利用して計算を実行します。入力情報は光線としてエンコードされ、干渉や回折などの光学の自然特性を使用して行列乗算が実行されます。情報は複数の波長、偏光、空間パターンでエンコードできるため、無制限の並列処理が可能になり、計算は事実上光速で実行されます。

3D光学で新たな次元を追加

デナードスケーリングとムーアの法則の終焉に伴い、コンピューティングの基礎を再検討する時期が来ています。デジタル エレクトロニクスは本質的に「2D」レイアウトに制限されます。トランジスタ ゲートと回路はウェーハ上で製造され、計算は 2D 平面上の異なるユニット間の情報の流れによって実行されます。この 2D コンピューティング アーキテクチャでは、トランジスタ密度がますます高くなる必要があり、深刻な相互接続問題が発生し、悪名高いメモリ ボトルネックが発生します。 3D スタック メモリの開発により、2D 設計の変革が始まりました。しかし、業界全体が適応するにはまだ長い道のりが残っています。

現在、光学は 3D 空間で自然に計算を実行することでゲームを完全に変えることができます。新しい次元を追加することで、従来のコンピューティングにおける多くの制限を緩和できます。コンポーネントの相互接続はより簡単かつエネルギー効率が高く、レイテンシ (各計算の実行速度) を損なうことなく、スループット (一定時間内に実行できる計算数) を継続的に向上させることができます。これは 3D 光学に特有のもので、10 個の数を掛け算する場合でも 10,000 個の数を掛け算する場合でも、すべて光の速度で同時に行われます。これは光プロセッサのスケーラビリティに大きな影響を与え、現在のデジタルプロセッサの最大 1,000 倍の速度を実現できるようになります。

3D 光学の本来のスケーラビリティに加えて、光学のクロック速度は従来の電子機器よりも 100 倍高速であり、波長多重化 (複数の光波長を使用して情報を並行して処理する) 機能により、さらに 100 倍の速度向上が可能になります。これらすべてを組み合わせることで、3D 光学マトリックス乗算のみが提供できる、より高いスループット、より低いレイテンシ、およびより高い信頼性により、計算速度を飛躍的に向上させることができます。

これは AI にとって何を意味するのでしょうか?

アプリケーションに関係なく、行列乗算はすべての AI 計算のバックボーンを形成します。特に、3D 光学によって実現される高スループットと低レイテンシは、リアルタイムの応答性と効率性が重視されるアプリケーションであるデータセンターの AI 推論タスクにとって特に価値があります。

3D 光コンピューティングは、従来のエレクトロニクスや統合フォトニクスと比較して、帯域幅、レイテンシ、速度、スケーラビリティが大幅に向上します。既存の機械学習アルゴリズムとの互換性と組み合わせることで、すべての AI アプリケーションに革命を起こす可能性があります。

<<:  ワークステーションはクライアント側の大規模モデルの「幸せな家」です

>>:  Panda-Gym のロボットアームシミュレーションを使用したディープ Q 学習強化学習

ブログ    
ブログ    

推薦する

機械学習システムの弱点: 保護が必要な 5 つの理由

[[345683]]日々の努力の究極の目的は、生活をより楽に、より便利にすることです。これが人類の歴...

Java ソートアルゴリズムの概要 (II): 選択ソート

選択ソートの基本的な操作は、ソートするデータ要素から毎回最小(または最大)の要素を選択し、ソートする...

人工知能に関する長期的および短期的な懸念

人工知能(AI)技術の発展により、いつか「超人」的なAIが出現する日は来るのでしょうか?もしそうなれ...

...

中国のAI麻雀が新たな高みに到達!テンセントの「Jueyi」が本物のプロプレイヤーを破り新記録を樹立

中国のAIは予想通り、麻雀のプレイでは「楽々と」トップに立った。テンセントの最新ニュースによると、同...

GPT-3 の推論高速化は NVIDIA のソリューションを 50% 上回ります。大規模モデル推論システムEnergon-AIオープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習プロジェクトを管理および組織化する方法

この記事では主に、機械学習プロジェクトの編成と管理に関する実践的な経験をいくつか紹介します。パイソン...

生成 AI: サイバーセキュリティにとってのメリットか、それとも危険か?

脅威の状況が絶えず変化する中、高度なサイバー攻撃に対する防御手段として、生成型人工知能 (GAI) ...

ネットセレブ列車は強制的に停止させられた。ドローンの操縦はどれほど難しいのか?

最近、「重慶の人気列車がドローンに衝突され停止」する動画がインターネット上で広く出回っている。 [[...

マスク氏の最新インタビュー:自動運転、AI、テスラのヒューマノイドロボットについて

最近、世界一の富豪イーロン・マスク氏がTEDディレクターのクリス・アンダーソン氏が主催する独占インタ...

GPTベースの開発者ツール

localGPT - GPT モデル ツールのローカル展開localGPT を使用すると、GPT モ...

快手科技のY-tech AI Labが「2019 CCF科学技術賞」を受賞

より多くの中級・低級モデルでハイコンピューティングAIタスクを普及させるために、快手が自社開発した「...

優れたビジネス機械学習のユースケース 5 つ

ビッグデータと機械学習を組み合わせることで、ビジネスの競争優位性を獲得するために必要な、すでに保有し...

予想外?今年の建国記念日に最も多く目にするのはドローンかもしれません!

[[426834]]国慶節のゴールデンウィークが近づいてきました。旅行の計画はお決まりですか?昨今...