現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが、この進歩に伴い、計算能力の大幅な増強が必要になりました。既存のトランジスタベースのコンピューティングは物理的な限界に近づいており、増大するコンピューティング需要に対応するのにすでに苦労しています。 大企業は、独自のカスタム チップ ソリューションを開発することでこの問題に対処しようとしてきました。ただし、ハードウェアのボトルネックは、従来の電子プロセッサでは克服できないほど深刻になる可能性があります。では、テクノロジーはどのようにして、急増するコンピューティング能力の需要に十分対応できるのでしょうか? 行列の乗算大規模言語モデルでは、計算タスクの 90% 以上で行列乗算が使用されます。行列乗算は、乗算と加算の基本演算を構造化された方法で実行することにより、人工知能のさまざまな機能ブロックをサポートします。言語モデルだけではありません。この基本的な線形代数演算は、ほぼすべての種類のニューラル ネットワークの基礎であり、ニューロンの大規模な相互接続を可能にし、画像分類やオブジェクト検出のための畳み込みを実行し、順次データを処理します。これは単純な概念ですが、人工知能やその他無数のアプリケーションを動かすデータを効果的に操作および変換するために不可欠なものであり、行列乗算の重要性を過大評価することはできません。 AI モデルが大きくなるにつれて、より多くの行列演算を実行する必要があり、より多くの計算能力が必要になります。要求される性能を達成するために、電子機器は現在でも限界まで追い込まれています。他に選択肢はありますか? 光学行列乗算光学は、光ファイバーネットワークにおける光通信に代表されるように、さまざまな方法で私たちの生活を変えるために使用されてきました。光コンピューティングは当然の次のステップです。デジタル エレクトロニクスでは、最も単純な算術演算を実行するために多数のトランジスタが必要ですが、光コンピューティングでは物理法則を利用して計算を実行します。入力情報は光線としてエンコードされ、干渉や回折などの光学の自然特性を使用して行列乗算が実行されます。情報は複数の波長、偏光、空間パターンでエンコードできるため、無制限の並列処理が可能になり、計算は事実上光速で実行されます。 3D光学で新たな次元を追加デナードスケーリングとムーアの法則の終焉に伴い、コンピューティングの基礎を再検討する時期が来ています。デジタル エレクトロニクスは本質的に「2D」レイアウトに制限されます。トランジスタ ゲートと回路はウェーハ上で製造され、計算は 2D 平面上の異なるユニット間の情報の流れによって実行されます。この 2D コンピューティング アーキテクチャでは、トランジスタ密度がますます高くなる必要があり、深刻な相互接続問題が発生し、悪名高いメモリ ボトルネックが発生します。 3D スタック メモリの開発により、2D 設計の変革が始まりました。しかし、業界全体が適応するにはまだ長い道のりが残っています。 現在、光学は 3D 空間で自然に計算を実行することでゲームを完全に変えることができます。新しい次元を追加することで、従来のコンピューティングにおける多くの制限を緩和できます。コンポーネントの相互接続はより簡単かつエネルギー効率が高く、レイテンシ (各計算の実行速度) を損なうことなく、スループット (一定時間内に実行できる計算数) を継続的に向上させることができます。これは 3D 光学に特有のもので、10 個の数を掛け算する場合でも 10,000 個の数を掛け算する場合でも、すべて光の速度で同時に行われます。これは光プロセッサのスケーラビリティに大きな影響を与え、現在のデジタルプロセッサの最大 1,000 倍の速度を実現できるようになります。 3D 光学の本来のスケーラビリティに加えて、光学のクロック速度は従来の電子機器よりも 100 倍高速であり、波長多重化 (複数の光波長を使用して情報を並行して処理する) 機能により、さらに 100 倍の速度向上が可能になります。これらすべてを組み合わせることで、3D 光学マトリックス乗算のみが提供できる、より高いスループット、より低いレイテンシ、およびより高い信頼性により、計算速度を飛躍的に向上させることができます。 これは AI にとって何を意味するのでしょうか?アプリケーションに関係なく、行列乗算はすべての AI 計算のバックボーンを形成します。特に、3D 光学によって実現される高スループットと低レイテンシは、リアルタイムの応答性と効率性が重視されるアプリケーションであるデータセンターの AI 推論タスクにとって特に価値があります。 3D 光コンピューティングは、従来のエレクトロニクスや統合フォトニクスと比較して、帯域幅、レイテンシ、速度、スケーラビリティが大幅に向上します。既存の機械学習アルゴリズムとの互換性と組み合わせることで、すべての AI アプリケーションに革命を起こす可能性があります。 |
<<: ワークステーションはクライアント側の大規模モデルの「幸せな家」です
>>: Panda-Gym のロボットアームシミュレーションを使用したディープ Q 学習強化学習
導入世界的に有名なコンサルティング会社であるアクセンチュアは最近、AI がもたらす産業革新がもたらす...
[[415590]]ボストン・ダイナミクス社が開発したヒューマノイドロボット「アトラス」、ロボット...
[51CTO.comからの原文] インテリジェント運用保守(AIops)は、IT運用保守の分野で最...
データ中心のエンジニアにとって、Python と R はデータセンターで最も人気のあるプログラミング...
先週、深セン大学コンピュータサイエンスおよびソフトウェア工学部の Yu Shiqi 教授が、最大 1...
テレンス・タオ氏は、ChatGPT が数学的証明を覆すだろうと常に楽観的でしたが、現在、化学分野にお...
人工知能の波が大きな変化を引き起こすには、4年という時間は十分あります。 2016年に北京の大学の講...
[[414466]] 7月28日、最高人民法院は「顔認識技術を用いた個人情報処理に関する民事訴訟にお...
数日前、OpenAIのCEOサム・アルトマン氏は世界ツアーのスピーチで、OpenAIの最近の開発ルー...
昨年 11 月、Google Brain チームは、実行によって定義される新しいインターフェースであ...