今日、私たちはコンピューティングにおける大きなイノベーションの時代を目の当たりにしており、世界中で 5G が急速に導入され、データ集約型のワークロードと生成型人工知能の画期的な発展が絡み合っています。新しいタイプのアクセラレーション、斬新なシステム アーキテクチャ、そして増え続けるデータ消費の需要を満たす新しい方法を革新し、探求するために、コンピューティング エコシステム全体にわたる柔軟性の必要性がかつてないほど高まっています。半導体設計コストの上昇と世界的なエネルギー予算の引き締めというさらなる課題により、私たちは世界のコンピューティング インフラストラクチャの変革の真っ只中にいることになります。 5Gと人工知能の組み合わせは大きなチャンスを秘めています。 5G テクノロジーは、AI アプリケーションが大量のデータを収集、送信、処理するために必要な、高スループット、低レイテンシ、信頼性の高い接続を提供できます。その代わりに、AI は 5G ネットワークがリソースを動的に割り当て、トラフィックを管理し、異常を検出するのに役立ちます。人工知能は 5G を使用して、ユーザーやデバイスにパーソナライズされ、コンテキストに応じたインテリジェント サービスを提供することもできます。これら 2 つのテクノロジーを組み合わせることで、私たちのコミュニケーション、仕事、生活のあり方は真に変わります。 しかし、どんな話にも二つの側面がある。 5G と AI は、どちらも大量のデータを生成するため、柔軟かつタイムリーでコスト効率が高く、エネルギー効率の高い方法で保存、処理、分析する必要があるため、データ センターの運営者と顧客にとって大きな課題となります。この機会を最大限に活用するには、データ センター アーキテクトは、コンピューティングの設計、構築、展開方法に関する革新的なアプローチを見つける必要があります。 5G 仮想 RAN: エッジ データ センターを実現する重要な要因5G をサポートする重要なイノベーションの 1 つは、仮想化無線アクセス ネットワーク (vRAN) です。 vRAN は、人気が高まっている比較的新しい導入モデルです。セルラー ベースバンド処理機能をハードウェアから分離し、汎用サーバー上でソフトウェアとして実行します。 これにより、5G ネットワークの展開と管理の際の柔軟性、拡張性、効率性が向上します。仮想化された 5G インフラストラクチャにおける規模の経済は、さまざまな方法で実現できます。まず、同じコンピューティング インフラストラクチャを組み合わせて 5G 接続とエッジ アプリケーションに対応することで、接続とデータ処理がソースに近づきます。次に、ソフトウェア駆動型のクラウド ネイティブ インフラストラクチャにより、動的なリソース割り当て、負荷分散、構成の高速化、ネットワーク管理の自動化が可能になり、運用効率に大きな影響を与えます。 3 番目に、vRAN はファイバー接続を利用して複数の基地局を 1 つの集中型サーバー プールにまとめることができるため、5G インフラストラクチャのコストと複雑さが軽減されます。 vRAN は、コンピューティング能力をエンドユーザーとそのデバイスに近づけることで、エッジ コンピューティングを促進し、レイテンシを削減してパフォーマンスを向上させることができます。 しかし、vRAN の潜在能力を最大限に引き出すには、非常に高い計算効率を維持しながら、高スループット、低レイテンシ、確定的な無線信号処理をサポートできるコンピューティング プラットフォームが必要です。また、サーバー、無線、エンドデバイス間の大量のデータトラフィックを処理するには高速ネットワークインターフェースも必要となり、変革的なアプローチの必要性がさらに強調されます。 今日の 5G データセンター: CPU と DPU従来の汎用 CPU では、5G vRAN スタックの複雑で多様なワークロードを処理できません。オペレーティング システム、ネットワーク層、アプリケーション、プロトコルなど、すべてのネットワーク機能をソフトウェアに仮想化することで、データ センター内のトラフィック量が大幅に増加し、CPU 効率が低下しました。この課題を解決するには、CPU からネットワーク タスクをオフロードしてパフォーマンスと効率を向上できる補完的な専用アクセラレーション デバイスが必要です。今日の 5G データセンターで最も人気のある加速デバイスの 1 つは、データ処理ユニット (DPU) です。 AIとソフトウェアが5Gデータセンターの変革を推進する方法 5G インフラにおける人工知能 (出典: Arm) DPU は、パケット処理、暗号化/復号化、圧縮/解凍、負荷分散、ファイアウォール、ルーティング/スイッチング、サービス品質 (QoS) などのネットワーク機能を実行できる組み込みプロセッサまたはプログラマブル ロジックを備えたネットワーク カードです。 DPU は、ネットワーク関連のタスクの一部を引き継ぐことでサーバーの CPU 使用率と電力消費を削減し、さまざまなシナリオに応じてネットワーク機能を構成および最適化する際の柔軟性とプログラマビリティを実現します。 異機種コンピューティングにより、将来のワークロードに対する柔軟性が高まります今日の 5G データ センターではすでに CPU と DPU を活用して vRAN やその他の 5G アプリケーションをサポートしていますが、次世代の 5G データ センターでは、ハードウェア アーキテクチャ、ソフトウェア プラットフォーム、サービス モデルにおいてより高い柔軟性が求められます。たとえば、データ センターでは、複雑な数学、グラフィックス、ビデオ、またはその他の大規模なデータ セットを処理するために GPU を使用し、機械学習のワークロードには GPU または TPU を使用し、よりカスタムなワークロードを解決するためにプログラマブル ロジックに FPGA を使用する場合があります。 このタイプの異種コンピューティングは、RAN サービス、クラウド コンピューティング機能、および人工知能アプリケーション サービスをエンド ユーザーの近くで提供できる統合インテリジェント エッジ データ センターのパフォーマンス、効率、およびスケーラビリティの向上に役立ちます。最終的には、より専門的なコンピューティングをデバイスやエンドユーザーに近づけることで、レイテンシを改善し、5G が約束する次世代のユースケースの多くを実現できるようになります。 ソフトバンク、Nvidia、Armは最近、AIと高性能コンピューティング(HPC)向けの世界最先端のデータセンターを構築するための提携を発表した。これは、特殊な処理機能を備えた、現在行われているこのタイプのデータ センター変革の最も優れた例の 1 つです。この提携により、ソフトバンクが日本全国の新しい分散型AIデータセンターに展開する予定のNvidia GH200 Grace Hopperスーパーチップをベースにした、生成型AIと5G/6Gアプリケーション向けの画期的なプラットフォームが実現すると期待されています。新しいデータセンターは、これまで使用されていたものよりも均等に分散され、人工知能や 5G のワークロードを処理できます。これにより、低レイテンシでピーク容量をより適切に運用できるようになり、全体的なエネルギーコストが大幅に削減されます。 ソフトバンクは、NVIDIA と連携してデータセンターを構築し、世界中で生成 AI アプリケーションとサービスを迅速に展開するための道を開きます。このデータセンターは、マルチテナントの汎用サーバー プラットフォーム上で生成 AI とワイヤレス アプリケーションをホストできるため、エネルギー効率が向上し、コストが削減され、より多くのサービスが提供されます。 このようなイノベーションは、5G と AI にとって重要な転換点となります。データ センター全体は、特殊な処理によって実現される目標パフォーマンスを中心に構築されており、オペレーターは vRAN の可能性を実現するために必要な運用効率を得ることができます。さらに、特殊な処理により、オペレーターは人工知能や 3D ビデオ会議などの計算集約型サービスを、データやユーザーに近い同じ物理的な場所で共同ホストできるようになります。これは、柔軟性、低レイテンシ、パフォーマンス効率によってコンピューティング リソースとそれに必要な資本コストおよびエネルギー コストが最適に活用され、データ センター全体の TCO (総所有コスト) が変化するため、非常に重要です。 次世代の 5G データ センターを見据えると、柔軟で効率的なコンピューティング プラットフォームの必要性が極めて重要になります。 5G と人工知能によって推進されるデータセンター サービスの需要の高まりに対応するため、次世代のデータセンターは、新しいテクノロジーとワークロードに適応し、企業と消費者が求めるパフォーマンスと効率性を実現する能力によって定義されることになります。したがって、当社は今後も、効率的で特殊なチップをこの分野におけるイノベーションと変革の基盤として捉えていきます。 |
<<: IT の現状レポート: IT リーダーの 90% が、生成型 AI がまもなく主流になると考えています
>>: ICML 2023 優秀論文賞発表!北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出
[51CTO.com からのオリジナル記事] 今週の土曜日、Ascend Academy Tech...
AIビッグモデルの時代、データはIT担当者に「新たな使命」を与える今日、IT プロフェッショナルは企...
[[431971]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...
カリフォルニア大学バークレー校の新しい研究によると、ロボットはビデオ認識技術を通じて物体を移動させる...
[[400505]] AI(人工知能)がさらに発展するにつれて、新たな用途やメリットが生まれる可能性...
Logreduce は、大量のログ データから異常を検出することでデバッグ時間を節約できます。継続的...
最近、Google チームのもう一つの主要な研究成果が Nature 誌に掲載されました。研究成果は...
偽の動画や画像の拡散に対する懸念は世界中で高まっており、Adobe もその懸念を共有していると述べて...
12月27日、テスラのCEOイーロン・マスク氏が新たに設立したAIスタートアップ企業xAIは、競合他...
人工知能の概念は何年も前から存在しています。SF映画に出てくるような高度なロボットはまだ登場していま...