マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース

マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース


マイクロソフトは最近、シアトルで開催されたIgniteカンファレンスで2つのAIチップをリリースした。 1 つ目は Maia 100 AI チップで、これは Nvidia の大いに宣伝されている AI GPU と競合します。2 つ目は Cobalt 100 Arm チップで、これは一般的なコンピューティング タスクに使用され、Intel プロセッサと競合します。

マイクロソフト副社長のラニ・ボルカー氏はメディアとのインタビューで、コバルトチップ上で動作する仮想マシンインスタンスが2024年にマイクロソフトのAzureクラウドプラットフォームを通じて商用化される予定だと述べたが、マイア100のリリース時期については明らかにしなかった。

現在、資金力のあるテクノロジー企業は、クラウド コンピューティング インフラストラクチャを使用してアプリケーションを実行する顧客に、より多くのクラウド コンピューティング オプションを提供し始めています。 Alibaba、Amazon、Google は長年これを行ってきました。 10月末時点で推定1440億ドルの現金を保有していたマイクロソフトは、2022年には世界のクラウド市場で21.5%のシェアを持ち、アマゾンに次ぐ第2位となる。

Google は 2016 年に AI 向け TPU をリリースしました。 AWS は 2018 年に Graviton Arm ベースのチップと Inferentia AI チップをリリースし、2020 年にはトレーニング モデル用の Trainium チップを発表しました。

GPU が不足している場合は、クラウド コンピューティング プロバイダーのカスタム AI チップが需要を満たすのに役立つ可能性があります。しかし、Nvidia や AMD とは異なり、Microsoft とそのクラウド コンピューティング ベンダーは、ユーザーが自社のチップを搭載したサーバーを購入することを意図していません。

ボルカー氏は、マイクロソフトが顧客からのフィードバックに基づいてAIコンピューティング用のチップを開発したと説明した。マイクロソフトは、Bing 検索エンジンの AI チャットボット (現在は Bing Chat ではなく Copilot と呼ばれています)、GitHub Copilot コーディング アシスタント、およびマイクロソフトが支援する OpenAI の大規模言語モデル GPT-3.5-Turbo のニーズを Maia 100 がどのように満たせるかをテストしています。

GPT-3.5-Turbo モデルは、昨年の発売後すぐに人気を博した OpenAI の ChatGPT アシスタントで使用されています。 OpenAI はその後すぐに同様のチャット機能を自社のソフトウェアに追加し、GPU の需要が増加しました。

9月、NvidiaのCFOコレット・クレス氏はニューヨークで開催されたEvercoreカンファレンスで次のように述べた。「当社は供給状況の改善と多くの顧客のサポート、そして顧客のニーズに応えるために、さまざまなサプライヤーと包括的に協力してきました。」

OpenAI は以前、Azure の Nvidia GPU を使用してモデルをトレーニングしました。

Microsoft は、Maia チップの設計に加えて、Maia サーバーの横のラックに取り付けることができる Sidekicks と呼ばれるカスタム液体冷却ハードウェアも設計しました。マイクロソフトの広報担当者は、顧客はコンピュータルームを改造することなく、サイドキックをラックに設置できると述べた。

Amazon の経験を参考にすると、Microsoft による Cobalt プロセッサの採用は Maia AI チップの採用よりも早い可能性があります。 Microsoft は、Cobalt 上で Teams アプリケーションと Azure SQL データベース サービスをテストしています。マイクロソフトによれば、スタートアップ企業Ampereが開発したAzureの既存のArmチップよりも、これまでのところ40%優れたパフォーマンスを提供しているという。

過去 1 年間に価格と金利が上昇したため、多くの企業がクラウド コンピューティング支出の効率を改善する方法を模索しており、AWS の顧客である Graviton もその 1 つです。 AWS副社長のデイブ・ブラウン氏は、AWSの上位100社の顧客が現在Armベースのチップを使用しており、これにより価格性能比が40%向上すると述べた。

それでも、GPU から AWS Trainium AI チップへの移行は、Intel Xeon から Graviton への移行よりも複雑になる可能性があります。すべての AI モデルには独自の問題があります。ブラウン氏は、モバイルデバイスにおけるArmの人気により、多くの人がさまざまなツールをArm上で動作させるために懸命に取り組んでいるが、AIチップに関しては状況が異なると述べた。しかし、彼は、時間が経つにつれて、多くの企業がGPUと比較してTrainiumの価格性能比が同様に改善されることに気づくだろうと述べた。

「我々はエコシステム内の多くのパートナーとこれらの仕様を共有しており、これはAzureの顧客全員に利益をもたらすだろう」とマイクロソフトのラニ・ボルカー副社長は述べた。しかし、彼女はMaiaがNvidiaのH100などの代替品と比べてどう機能するかについては詳しく述べなかった。

<<:  アルトマン氏は、GPT-5 が加速トレーニングを受けていることを初めて明らかにしました。 GPT-4よりも複雑であることが示唆されており、真の能力は予測できない

>>:  NVIDIA が TensorRT-LLM の新バージョンをプレビュー: 推論能力が 5 倍に向上、8GB 以上のグラフィック カードがローカルで実行可能、OpenAI の Chat API をサポート

推薦する

ミツバチたちは、巣を監視し、餌を自動で分配できる多機能ロボットを搭載したこのスマートな巣箱に感銘を受けています。

ビッグデータダイジェスト制作著者: カレブスマート農場はますます私たちの身近なものになってきています...

メッシのサッカーの試合とリーグ・オブ・レジェンドについての解説:OpenAI GPT-4ビジュアルAPIは開発者が新しい方法を作成するために使用されています

記事の冒頭では、サッカーの試合解説ビデオを見てみましょう。それは正しいように聞こえませんか?あなたの...

歴史を作ろう!地球からのドローンが火星へ飛び立ち、NASAはこのようにライト兄弟に敬意を表す

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ユーザーの検索ログに基づくマルチタスク学習による商品タイトル圧縮手法

まとめTaobao や Tmall などの電子商取引プラットフォームでは、検索エンジン最適化 (SE...

張晨成: 第四パラダイムインテリジェントリスク管理ミドルプラットフォームアーキテクチャ設計と応用

共有は主に次の 5 つのポイントを中心に行われます。リスク管理センターの設計背景戦略のフルサイクル管...

会話型AIが顧客体験を向上させる方法

[[380661]] [51CTO.com クイック翻訳] 会話型 AI により、アプリケーションは...

機械学習でサンプルが不均衡な場合はどうすればよいでしょうか?

銀行が新規顧客が債務不履行になるかどうかを判断する際、債務不履行にならない顧客と債務不履行になる顧客...

...

遠隔医療と増加する高齢者人口:高齢者ヘルスケアの強化

高齢者人口の継続的な増加は、高齢者の差し迫った健康ニーズを満たすために医療および保健システムを改善す...

...

AIによる決定をどのように説明するのでしょうか?この記事では、アルゴリズムの適用シナリオと解釈可能性を整理します。

英国の情報コミッショナー事務局(ICO)とアラン・チューリング研究所は共同で「AIによる説明決定」ガ...

ヤン・ルカンは、テンセントのポートレート写真生成が自由にできることを明かした。

今回、ヤン・ルカンが初めて「変わり続ける大物」の仲間入りを果たした。アイアンマンの衣装とかっこいいサ...

...