私たちはコンピューティングにおける革新の大きな段階を目撃しています。急速に加速する世界的な 5G 展開は、データ集約型のワークロードと生成 AI の画期的な開発と交差します。これまで以上に、コンピューティング エコシステム全体で、データ消費の増大する需要に対応するために、新しいタイプのアクセラレーション、新しいシステム アーキテクチャ、新しいアプローチを革新し、探求する柔軟性が求められています。半導体設計コストの上昇と世界的なエネルギー予算の引き締めというさらなる課題により、私たちは世界のコンピューティング インフラストラクチャの変革の真っ只中にいることになります。 5Gと人工知能の組み合わせは大きなチャンスを秘めています。 5G テクノロジーは、AI アプリケーションが大量のデータを収集、送信、処理するために必要な、高スループット、低レイテンシ、信頼性の高い接続を提供できます。 その代わりに、AI は 5G ネットワークがリソースを動的に割り当て、トラフィックを管理し、異常を検出するのに役立ちます。 人工知能は 5G を使用して、ユーザーやデバイスにパーソナライズされ、コンテキストに応じたインテリジェント サービスを提供することもできます。 これら 2 つのテクノロジーを組み合わせることで、私たちのコミュニケーション、仕事、生活のあり方は真に変わります。 しかし、どんな話にも二つの側面がある。 5G と AI は、どちらも大量のデータを生成するため、柔軟かつタイムリーでコスト効率が高く、エネルギー効率の高い方法で保存、処理、分析する必要があるため、データ センターの運営者と顧客にとって大きな課題となります。 この機会を最大限に活用するには、データ センター アーキテクトは、コンピューティングの設計、構築、展開方法に関する革新的なアプローチを見つける必要があります。 5G 仮想 RAN: エッジ データ センターを実現する重要な要因5G をサポートする重要なイノベーションの 1 つは、仮想化無線アクセス ネットワーク (vRAN) です。 vRAN は、人気が高まっている比較的新しい導入モデルです。 セルラー ベースバンド処理機能をハードウェアから分離し、汎用サーバー上でソフトウェアとして実行します。 これにより、5G ネットワークの展開と管理の際の柔軟性、拡張性、効率性が向上します。 仮想化された 5G インフラストラクチャにおける規模の経済は、さまざまな方法で実現できます。 まず、同じコンピューティング インフラストラクチャを組み合わせて 5G 接続とエッジ アプリケーションに対応させることで、接続性とデータ処理がソースに近づきます。次に、ソフトウェア駆動型のクラウド ネイティブ インフラストラクチャにより、動的なリソース割り当て、負荷分散、構成の高速化、ネットワーク管理の自動化が可能になり、運用効率に大きな影響を与えます。 3 つ目は、ファイバー接続により、vRAN は複数の基地局を集中型サーバー プールに集約できるため、5G インフラストラクチャのコストと複雑さが軽減されます。 vRAN は、コンピューティング能力をエンドユーザーとそのデバイスに近づけることで、エッジ コンピューティングを促進し、レイテンシを削減してパフォーマンスを向上させることができます。 しかし、vRAN の潜在能力を最大限に引き出すには、非常に高い計算効率を維持しながら、高スループット、低レイテンシ、確定的な無線信号処理をサポートできるコンピューティング プラットフォームが必要です。 また、サーバー、無線、エンドデバイス間の大量のデータトラフィックを処理するには高速ネットワークインターフェースも必要となり、変革的なアプローチの必要性がさらに強調されます。 今日の 5G データセンター: CPU と DPU従来の汎用 CPU では、5G vRAN スタックの複雑で多様なワークロードを処理できません。 オペレーティング システム、ネットワーク層、アプリケーション、プロトコルなど、すべてのネットワーク機能をソフトウェアに仮想化することで、データ センター内のトラフィックが大幅に増加し、CPU 効率が低下しました。 この課題を解決するには、CPU からネットワーク タスクをオフロードしてパフォーマンスと効率を向上できる補完的な専用アクセラレーション デバイスが必要です。 今日の 5G データセンターで最も人気のある加速デバイスの 1 つは、データ処理ユニット (DPU) です。 5G インフラストラクチャにおける人工知能。 (出典:Arm) DPU は、パケット処理、暗号化/復号化、圧縮/解凍、負荷分散、ファイアウォール、ルーティング/スイッチング、サービス品質 (QoS) などのネットワーク機能を実行できる組み込みプロセッサまたはプログラマブル ロジックを備えたネットワーク カードです。 DPU は、ネットワーク関連のタスクの一部を引き継ぐことでサーバーの CPU 使用率と電力消費を削減し、さまざまなシナリオに応じてネットワーク機能を構成および最適化する際の柔軟性とプログラマビリティを実現します。 異機種コンピューティングにより、将来のワークロードに対する柔軟性が高まります今日の 5G データ センターではすでに CPU と DPU を活用して vRAN やその他の 5G アプリケーションをサポートしていますが、次世代の 5G データ センターでは、ハードウェア アーキテクチャ、ソフトウェア プラットフォーム、サービス モデルにおいてより高い柔軟性が求められます。 たとえば、データ センターでは、複雑な数学、グラフィックス、ビデオ、またはその他の大規模なデータ セットを処理するために GPU を使用し、機械学習のワークロードには GPU または TPU を使用し、よりカスタムなワークロードを解決するためにプログラマブル ロジックに FPGA を使用する場合があります。 このタイプの異種コンピューティングは、RAN サービス、クラウド コンピューティング機能、および人工知能アプリケーション サービスをエンド ユーザーの近くで提供できる統合インテリジェント エッジ データ センターのパフォーマンス、効率、およびスケーラビリティの向上に役立ちます。 最終的には、より専門的なコンピューティングをデバイスやエンドユーザーに近づけることで、レイテンシを改善し、5G が約束する次世代のユースケースの多くを実現できるようになります。 ソフトバンク、Nvidia、Armは最近、AIと高性能コンピューティング(HPC)向けの世界最先端のデータセンターを構築するための提携を発表しました。 これは、特殊な処理機能を備えた、現在行われているこのタイプのデータ センター変革の最も優れた例の 1 つです。 この提携により、ソフトバンクが日本全国の新しい分散型AIデータセンターに展開する予定のNvidia GH200 Grace Hopperスーパーチップをベースにした、生成型AIと5G/6Gアプリケーション向けの画期的なプラットフォームが実現すると期待されています。 新しいデータセンターは、これまで使用されていたものよりも均等に分散され、人工知能や 5G のワークロードを処理できます。 これにより、低レイテンシでピーク容量をより適切に運用できるようになり、全体的なエネルギーコストが大幅に削減されます。 ソフトバンクは、生成型 AI アプリケーションとサービスを世界規模で迅速に展開するために、NVIDIA と連携して、マルチテナントの汎用サーバー プラットフォーム上で生成型 AI とワイヤレス アプリケーションをホストするデータ センターを構築し、コストを削減してエネルギー効率を向上させます。 この種のイノベーションは、5G と AI にとって重要な転換点となります。専用処理によって提供される目標パフォーマンスを中心に構築されたデータセンター全体により、オペレーターは vRAN の可能性を実現するために必要な運用効率を実現できます。さらに、専用処理により、オペレーターは、人工知能や 3D ビデオ会議などの計算集約型サービスを、データやユーザーに近い同じ物理的な場所で共同ホストできるようになります。これは、柔軟性、低レイテンシ、パフォーマンス効率によってコンピューティング リソースとそれに必要な資本コストおよびエネルギー コストが最適に使用され、データ センターの TCO (総所有コスト) 全体の方程式が変化するため、非常に重要です。 次世代の 5G データ センターを見据えると、柔軟で効率的なコンピューティング プラットフォームの必要性が極めて重要になります。 5G と AI によって高まるデータセンター サービスの需要に応えるため、次世代のデータセンターは、新しいテクノロジーとワークロードに適応し、企業と消費者が求めるパフォーマンスと効率性を実現する能力によって定義されることになります。そして、私たちは今後も、この分野におけるイノベーションと変革の基盤として、効率的で特殊なシリコンに注目し続けるでしょう。 |
<<: ソフトウェアと自動化機器が持続可能性と回復力を向上させる方法
>>: Google の研究者が GPT-4 を使用してレビュー システムを破る AI-Guardian
IoT カメラは、小売環境をより効率的かつ顧客に優しく、そして何よりもセキュリティと安全性を高めるこ...
MITの研究者たちは、人間とロボットのシームレスなコラボレーションに近づく可能性のある新しいシステム...
Meta は無料の商用バージョンである Llama 2 をリリースし、ネットワーク全体を席巻しました...
1 つ目は、GPT-4 API です。完全にオープンに使用できます。 7月7日、OpenAIは公式ウ...
ワールドカップが本格的に開幕し、大手データおよび人工知能技術組織もワールドカップの予想に参加している...
メタバースは現実世界を揺るがしており、未知の部分が多すぎるため、賛否両論の評価を受けています。しかし...
ハイパーパラメータとは何ですか?学習モデルには、一般的に 2 種類のパラメータがあります。1 つはデ...
2021年7月6日、世界人工知能大会組織委員会事務局主催の第1回BPAA応用アルゴリズム実践モデル...
生成 AI は、すぐに過大な期待のピークから幻滅の谷間へと移行するでしょう。控えめに言っても、現在、...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
マイクロソフトの最新の研究は、迅速なエンジニアリングの力を再び証明しています——追加の微調整や専門家...
AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...