AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要に対応するにはデータ センターの容量を急速に増やす必要があることは明らかです。 しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資が減速し、ロンドンの空き容量は2022~23年に6.3%減少した。 この直感に反する傾向の背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャを取り巻くいくつかの問題を理解する必要があります。 AIがデータセンターのインフラをどう変えるのかデータ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU ラックを中心に構築されてきましたが、AI コンピューティングには GPU を搭載したラックが必要であり、同じ CPU 容量よりも多くの電力を消費し、多くの熱を放出し、多くのスペースを占有します。 実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。 これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換するにはコストがかかることが多く、場合によっては経済的に不可能になります。 実際には、オペレーターは、新しいデータセンター内で AI と従来のコンピューティングを「分割」するためにどれだけのスペースを割り当てるかを決定する必要があります。 これを間違え、AI について過大な約束をすると、データセンター運営者は永久に活用されず、利益が出ないという重荷を背負うことになるかもしれません。 AI市場がまだ初期段階にあるという事実によって問題はさらに悪化しており、ガートナーはAI市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張している。その結果、多くの事業者は、新しいデータセンター プロジェクトに AI コンピューティングを一定の割合で導入することを早急に決定するのではなく、設計段階では保留することを選んでいます。 設計段階では総合的なアプローチを取るしかし、事業者は、投資を遅らせることができるのは限られた期間だけであり、そうすると市場シェアと競争上の優位性を失うリスクがあることを痛感しています。これは、データセンター インフラストラクチャの多くの基本要素がリアルタイムで書き換えられていることを考えると、困難な作業です。 リスクを相殺しながら先駆者となるという要求を満たすために、事業者は、新しい総合的な設計アプローチを必要とする AI コンピューティングの時代に最大限の効率性と回復力を発揮するようにデータ センターを設計する必要があります。 1. より多くの関係者を巻き込むオペレーターが AI と従来のコンピューティングの間で正確に分割するかどうかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になると予想されます。複雑さが増すと、多くの場合、障害点も増えます。特に AI コンピューティングでは、従来のコンピューティングよりも多くの処理が要求される場合に顕著です。 したがって、稼働時間を保証し、サイトのライフサイクル中にコストのかかる問題が発生するリスクを軽減するには、チームはデータセンターの計画フェーズでより徹底する必要があります。 特に、設計フェーズでは、プロジェクトの開始時に、より広範なチームからの意見や専門知識を求める必要があります。設計者は、電力と冷却に関する専門知識を求めるだけでなく、潜在的なボトルネックや障害の原因を理解するために、運用、ケーブル配線、セキュリティの各チームと早期に連携する必要があります。 2. データセンター運用にAIを統合するオペレーターは現在、現場で AI コンピューティングを実行しているため、AI を使用する能力を活用して、運用の新たな効率性を生み出す必要があります。 AI はデータ センターで長い間開発されており、そのテクノロジーはワークフローを非常に高い精度と品質で実行することができます。たとえば、AI は次のことに役立ちます。
データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に活用することで、オペレーターは運用の効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなどを通じて、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。 3. 誤った節約を避けるトレーニング実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時には、AI によってデータセンターに大きな負荷がかかります。これらの期間中、AI コンピューティングは、電力消費、冷却要件、データ スループットの点で従来の期待をはるかに上回ることがよくあります。 最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが停止する可能性があります。 このため、事業者は、低品質のケーブルなど、低品質の材料を購入してコストを節約することを避ける必要があります。そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済的リスクが生じる可能性があります。しかし、最も問題なのは、基準を満たさない材料や部品による故障が、サイトのダウンタイムや停止につながることが多く、収益性に影響を及ぼすことです。 インフラの課題を解決するAI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的には必ずしもそうとは限りません。 市場の不確実性が解消されるにつれて、企業はデータセンターにおける従来型コンピューティングと AI コンピューティングの分割に関して「妥協点」に収束するでしょう。 そうなると、企業は学習し成熟するにつれて、サイトの運営において可能な限りの優位性を確保する必要があるでしょう。 これは、最初から総合的に設計し、AI 自体を活用してサイトの新たな効率性を発見し、AI のより大きなコンピューティング需要に対応できる高品質のコンポーネントに投資することを意味します。 |
[[379153]] [51CTO.com クイック翻訳] 研究によると、人工知能技術はさまざまな業...
人工知能 (AI) と機械学習の台頭により、あらゆる業界に大きな変化が起きています。データ量が増加し...
自動運転企業Roadstar.aiは最近、 1億2,800万米ドルのシリーズA資金調達ラウンドの完了...
人類はもはや人工知能(AI)の波から逃れることはできない。彼らが行くところすべてで、最新の AI ソ...
交通渋滞問題は北京、上海、広州の都市脳血栓症となっている。我々の巧妙な統治の下では、都市部の道路渋滞...
[[442868]]著者: ユン・チャオこの記事は、2021年の業界レビュー、2021年のビッグモ...
モデルとは何か一般人にとって、AIとそのプログラミングの基盤となるアルゴリズムが、これほど広範囲にわ...
人工知能、データサイエンス、機械学習はすべて同じ分野に属します。問題は、この場合、どちらが正しい目的...
機械はどのように学習し、何を学ぶのでしょうか?人間はどうやって機械に学習を教えるのでしょうか?この記...
最新の顔認識の脆弱性が明らかになり、テストされたすべての Android スマートフォンが脆弱である...
もしあなたが会社の CEO だったら、自社の製品が競合他社に打ち負かされたと聞いたらどう感じるでしょ...
私たちは、企業や専門家が IoT についてどう考えているかを知りたいと思っていますが、一般の人々はど...
クラウド ディープラーニング プラットフォームの定義 クラウド ディープラーニングとは何ですか? 機...