光学行列乗算は人工知能をどう変えるのか

現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが、この進歩に伴い、計算能力の大幅な増強が必要になりました。既存のトランジスタベースのコンピューティングは物理的な限界に近づいており、増大するコンピューティング需要に対応するのにすでに苦労しています。

大企業は、独自のカスタムチップソリューションを開発することでこの問題に対処しようとしてきました。ただし、ハードウェアのボトルネックは、従来の電子プロセッサでは克服できないほど深刻になる可能性があります。では、テクノロジーはどのようにして、急増するコンピューティング能力の需要に十分対応できるのでしょうか?

行列の乗算

大規模言語モデルでは、計算タスクの 90% 以上で行列乗算が使用されます。行列乗算は、乗算と加算の基本演算を構造化された方法で実行することにより、人工知能のさまざまな機能ブロックをサポートします。言語モデルだけではありません。この基本的な線形代数演算は、ほぼすべての種類のニューラルネットワークの基礎であり、ニューロンの大規模な相互接続を可能にし、画像分類やオブジェクト検出のための畳み込みを実行し、順次データを処理します。これは単純な概念ですが、人工知能やその他無数のアプリケーションを動かすデータを効果的に操作および変換するために不可欠なものであり、行列乗算の重要性を過大評価することはできません。

AI モデルが大きくなるにつれて、より多くの行列演算を実行する必要があり、より多くの計算能力が必要になります。要求される性能を達成するために、電子機器は現在でも限界まで追い込まれています。他に選択肢はありますか？

光学行列乗算

光学は、光ファイバーネットワークにおける光通信に代表されるように、さまざまな方法で私たちの生活を変えるために使用されてきました。光コンピューティングは当然の次のステップです。デジタルエレクトロニクスでは、最も単純な算術演算を実行するために多数のトランジスタが必要ですが、光コンピューティングでは物理法則を利用して計算を実行します。入力情報は光線としてエンコードされ、干渉や回折などの光学の自然特性を使用して行列乗算が実行されます。情報は複数の波長、偏光、空間パターンでエンコードできるため、無制限の並列処理が可能になり、計算は事実上光速で実行されます。

3D光学で新たな次元を追加

デナードスケーリングとムーアの法則の終焉に伴い、コンピューティングの基礎を再検討する時期が来ています。デジタルエレクトロニクスは本質的に「2D」レイアウトに制限されます。トランジスタゲートと回路はウェーハ上で製造され、計算は 2D 平面上の異なるユニット間の情報の流れによって実行されます。この 2D コンピューティングアーキテクチャでは、トランジスタ密度がますます高くなる必要があり、深刻な相互接続問題が発生し、悪名高いメモリボトルネックが発生します。 3D スタックメモリの開発により、2D 設計の変革が始まりました。しかし、業界全体が適応するにはまだ長い道のりが残っています。

現在、光学は 3D 空間で自然に計算を実行することでゲームを完全に変えることができます。新しい次元を追加することで、従来のコンピューティングにおける多くの制限を緩和できます。コンポーネントの相互接続はより簡単かつエネルギー効率が高く、レイテンシ (各計算の実行速度) を損なうことなく、スループット (一定時間内に実行できる計算数) を継続的に向上させることができます。これは 3D 光学に特有のもので、10 個の数を掛け算する場合でも 10,000 個の数を掛け算する場合でも、すべて光の速度で同時に行われます。これは光プロセッサのスケーラビリティに大きな影響を与え、現在のデジタルプロセッサの最大 1,000 倍の速度を実現できるようになります。

3D 光学の本来のスケーラビリティに加えて、光学のクロック速度は従来の電子機器よりも 100 倍高速であり、波長多重化 (複数の光波長を使用して情報を並行して処理する) 機能により、さらに 100 倍の速度向上が可能になります。これらすべてを組み合わせることで、3D 光学マトリックス乗算のみが提供できる、より高いスループット、より低いレイテンシ、およびより高い信頼性により、計算速度を飛躍的に向上させることができます。