AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要に対応するにはデータ センターの容量を急速に増やす必要があることは明らかです。 しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資が減速し、ロンドンの空き容量は2022~23年に6.3%減少した。 この直感に反する傾向の背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャを取り巻くいくつかの問題を理解する必要があります。 AIがデータセンターのインフラをどう変えるのかデータ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU ラックを中心に構築されてきましたが、AI コンピューティングには GPU を搭載したラックが必要であり、同じ CPU 容量よりも多くの電力を消費し、多くの熱を放出し、多くのスペースを占有します。 実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。 これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換するにはコストがかかることが多く、場合によっては経済的に不可能になります。 実際には、オペレーターは、新しいデータセンター内で AI と従来のコンピューティングを「分割」するためにどれだけのスペースを割り当てるかを決定する必要があります。 これを間違え、AI について過大な約束をすると、データセンター運営者は永久に活用されず、利益が出ないという重荷を背負うことになるかもしれません。 AI市場がまだ初期段階にあるという事実によって問題はさらに悪化しており、ガートナーはAI市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張している。その結果、多くの事業者は、新しいデータセンター プロジェクトに AI コンピューティングを一定の割合で導入することを早急に決定するのではなく、設計段階では保留することを選んでいます。 設計段階では総合的なアプローチを取るしかし、事業者は、投資を遅らせることができるのは限られた期間だけであり、そうすると市場シェアと競争上の優位性を失うリスクがあることを痛感しています。これは、データセンター インフラストラクチャの多くの基本要素がリアルタイムで書き換えられていることを考えると、困難な作業です。 リスクを相殺しながら先駆者となるという要求を満たすために、事業者は、新しい総合的な設計アプローチを必要とする AI コンピューティングの時代に最大限の効率性と回復力を発揮するようにデータ センターを設計する必要があります。 1. より多くの関係者を巻き込むオペレーターが AI と従来のコンピューティングの間で正確に分割するかどうかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になると予想されます。複雑さが増すと、多くの場合、障害点も増えます。特に AI コンピューティングでは、従来のコンピューティングよりも多くの処理が要求される場合に顕著です。 したがって、稼働時間を保証し、サイトのライフサイクル中にコストのかかる問題が発生するリスクを軽減するには、チームはデータセンターの計画フェーズでより徹底する必要があります。 特に、設計フェーズでは、プロジェクトの開始時に、より広範なチームからの意見や専門知識を求める必要があります。設計者は、電力と冷却に関する専門知識を求めるだけでなく、潜在的なボトルネックや障害の原因を理解するために、運用、ケーブル配線、セキュリティの各チームと早期に連携する必要があります。 2. データセンター運用にAIを統合するオペレーターは現在、現場で AI コンピューティングを実行しているため、AI を使用する能力を活用して、運用の新たな効率性を生み出す必要があります。 AI はデータ センターで長い間開発されており、そのテクノロジーはワークフローを非常に高い精度と品質で実行することができます。たとえば、AI は次のことに役立ちます。
データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に活用することで、オペレーターは運用の効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなどを通じて、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。 3. 誤った節約を避けるトレーニング実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時には、AI によってデータセンターに大きな負荷がかかります。これらの期間中、AI コンピューティングは、電力消費、冷却要件、データ スループットの点で従来の期待をはるかに上回ることがよくあります。 最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが停止する可能性があります。 このため、事業者は、低品質のケーブルなど、低品質の材料を購入してコストを節約することを避ける必要があります。そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済的リスクが生じる可能性があります。しかし、最も問題なのは、基準を満たさない材料や部品による故障が、サイトのダウンタイムや停止につながることが多く、収益性に影響を及ぼすことです。 インフラの課題を解決するAI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的には必ずしもそうとは限りません。 市場の不確実性が解消されるにつれて、企業はデータセンターにおける従来型コンピューティングと AI コンピューティングの分割に関して「妥協点」に収束するでしょう。 そうなると、企業は学習し成熟するにつれて、サイトの運営において可能な限りの優位性を確保する必要があるでしょう。 これは、最初から総合的に設計し、AI 自体を活用してサイトの新たな効率性を発見し、AI のより大きなコンピューティング需要に対応できる高品質のコンポーネントに投資することを意味します。 |
何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...
[51CTO.com からのオリジナル記事] 少し前に、LinkedIn と IBM が多数の専門...
スマートシティ、スマートコミュニティ、スマート交通は絶えず推進され、普及しており、ユーザーの使用習慣...
[[315530]] 01. はじめにデータのクエリ速度を向上させるために、キャッシュがよく使用され...
Salesforce が実施した調査では、生成 AI の使用に関する明確なポリシーが存在しない状況で...
[[93484]]人間とアリの違いは何でしょうか? Ant にはインターネットがありません。創造的な...
在庫がなければ大晦日もありません。 2020年に日本のAI・ロボティクス分野で起こった出来事をいくつ...
最初の 10 個は、聖書からのトップ 10 アルゴリズムです。発起者からの説明: Proofs fr...
マイクロソフトは11月15日、Google DeepMindのAlphaZeroにヒントを得て、コン...
私たちは長い間、人工知能の進歩によって推進される自律的なインテリジェントエージェントを作成するという...