今年の第 2 四半期だけで、Nvidia は 816 トンの H100 を販売しました。 同じペースでいけば、今年のH100の販売量は3,266トンになると予想されている。そして、その後数年間で、Nvidia は 120 万台の H100 を販売する予定です。 現在、クラウド サービス プロバイダーの大規模 H100 クラスターの容量は枯渇しつつあり、世界中で GPU が不足しており、シリコン バレーの経営者たちは不安を募らせています。全体として、世界中の企業は約 432,000 台の H100 を必要としています。 また、最近非常に人気があるのは、Huang Renxun 氏による Nvidia の管理方法です。 「計画なし、報告なし、階層なし」、とてもカジュアル、とても仏教的、とてもクレイジーとさえ言える。 この経営手法により、Nvidia の時価総額は 1 兆を超え、世界最強の半導体企業となったのです。 半導体大手Nvidiaは、2024年度第2四半期に103億ドル相当のデータセンターハードウェアを販売したと主張している。 103 億ドルの価値があるとはどういう意味ですか? 今日、市場調査会社 Omdia は、よりわかりやすい単位「816 トン H100」を提供してくれました。 Omdiaの推定によると、Nvidiaは第2四半期に816トン以上のH100 GPUを出荷した。 NVIDIA H100 GPU はラジエーターを含めて平均 3 キログラム以上の重さがあるため、第 2 四半期の H100 の出荷量は控えめに見積もっても 30 万台になります。 Omdia の見積りは正確ですか? H100 には、重量が異なる 3 つの異なるフォーム ファクターがあることに注意してください。 H100 PCIe グラフィック カードの重量は 1.2 kg、H100 SXM モジュールの重量は不明、ヒートシンク付き OAM モジュールの重量は最大 2 kg です。H100 SXM とほぼ同じサイズと TDP です。 H100 出荷の 80% がモジュールで、20% がグラフィック カードであると仮定すると、1 台の H100 の平均重量は約 1.84 kg になります。 したがって、大見田の推定はほぼ正確であると考えられる。もちろん、実際の重量は 816 トン未満である可能性があります。 816トンの重さはどれくらいですか?この重みを理解するために、次の例えを使うことができます。 4.5 ボーイング 747 11スペースシャトル 181,818 台のプレイステーション 5 ゴールデンレトリバー 32,727 匹 Nvidia が今後の四半期で同じ GPU 販売量を維持すれば、今年は 3,266 トンの H100 を販売すると予想されます。 このペースが一定であれば、Nvidia は年間 120 万台の H100 を販売することになります。 それだけではありません。 H800 のほか、前世代の A100、A800、A30 もあります。 この計算によると、Nvidia が四半期ごとに実際に販売する GPU の数は 30 万個をはるかに超え、総重量は 816 トンをはるかに超えることになります。 それでも、世界的なGPU不足には対応できない。業界関係者によると、Nvidiaの2023年向けH100の生産分はすでに完売しており、今注文してお金を払っても、少なくとも2024年半ばまでは商品を受け取れないという。 現在、H100 カードは入手困難です。 NVIDIAはH100の生産台数を今年の約50万台から2024年には150万~200万台に増やす計画だとの海外メディアの報道もある。 生成型 AI の流行の中で Nvidia チップの需要がますます高まっていることから、この予測が誇張でないことは明らかです。 ジェン・スン・ファン:第一原理同時に、GPU の売上が急増したことで、Nvidia は世界のコンピューティング パワーのリーダーとなり、1 兆ドル クラブへの参入を果たしました。 これは、リーダーである黄仁訓氏の「クレイジー」な経営戦略と切り離せないものです。 黄氏は、会社を立ち上げるときには、第一原則から始めるのが自然だと語った。 「機械を組み立てて、それがどのように機能するか、入力は何か、出力は何か、どのような条件下では、業界標準は何かを調べるようなものです...」 黄氏の言葉によれば、NVIDIA の使命は、世界のほぼ不可能と思われるコンピューティング問題を解決することです。通常のコンピュータで解決できる問題であれば、Nvidia はそれを行いません。 この使命を達成するために、NVIDIA は多くの優れた才能を引きつけ、結集しています。 同時に、これらの人材を管理するための黄氏の最重要戦略も必要です。 40人の部下を直接管理し、1対1のミーティングは行わない NVIDIA は「ピラミッド」管理を必要とせず、代わりに全員に権限を委譲します。 黄氏は、情報が素早く広まるためにはフラットな組織が最も強力だと考えています。 その中でも、組織の第一レベルであるトップマネジメントは、より慎重に物事を考えなければなりません。経営陣の誰も彼にキャリアに関するアドバイスを求めなかったため、彼はどの幹部に対してもキャリアに関するアドバイスをしたことはありませんでした。 「彼らは成功した。素晴らしい仕事をした。」 さらに、黄氏は決して一対一の会議を行わず、すべてをグループディスカッションで行います。 「戦略的な方向性があるのなら、なぜ1人だけに伝えるのですか?全員がそれを知っているべきです。」 誰もが常にあらゆる情報を得ている 社内で副社長会議や取締役会議が開催されることはありません。 老黄氏は、自分が出席した会議にはさまざまな組織の人々や最近大学を卒業した人々が参加しており、誰でも参加して意見を述べることができたと語った。 ステータスレポートの代わりに「トップ5」をメールで送る NVIDIA では、ステータス レポートを作成する必要がありません。Huang 氏は、ステータス レポートは「メタ情報」のようなもので、洗練されすぎていて、基本的に役立つ情報がないと考えているからです。 代わりに、社内の誰もが彼に「トップ 5 のこと」を電子メールで送信できます。 あなたがこれまでに学んだこと、観察したこと、これからやろうとしていること、それが何であれ、彼は毎朝 100 通以上のメールを読んで、全員のトップ 5 の事柄を理解します。 たとえば、素敵なレストランに行った、かわいい赤ちゃんが生まれた、など、これらは本当に重要な情報です。 正式な定期スケジュールはありません 計画の立て方としては、会社の最も基本的なアイデアを出して、それを優秀なエンジニアに実行させるというものです。 老黄氏は、「私にとって、5年計画や1年計画はなく、常に変化する事業や市場の状況に基づいて再評価します」と述べました。 要約すると、NVIDIA は組織構造を次のように最適化しています。(1) 優秀な人材を引き付ける、(2) チームの規模をできるだけ小さくする、(3) 情報をできるだけ迅速に広める。 Nvidia のディープラーニング研究担当副社長、ブライアン・カタンザーロ氏も出席し、すべてが真実であることを証明しました。 では、このような組織で働くというのはどのようなことなのでしょうか? ブライアン氏は、多くの点で非常に安定した環境だと語った。多くの上級従業員は数十年にわたってNvidiaで働いています。このスタイルはすべての人に適しているわけではありませんが、多くの人にとってうまく機能します。活気のある環境です。 マスク氏とは異なり、フアン氏は自分の会社をどのように経営しているかを他人に話すことはめったにない。 今年、国立台湾大学で行ったスピーチで、Huang 氏は今日の NVIDIA を定義する 3 つのストーリーを語りました。これは彼の意思決定、判断、思考と切り離せないものです。 当初、Nvidia は SEGA と契約を結び、SEGA 向けのゲーム コンソールを開発しました。 1 年間の開発を経て、使用された技術アーキテクチャが間違っていたことが判明しました。 しかし、黄仁訓氏は、自分が作成した製品がマイクロソフトの Windows システムと互換性がないため、たとえ修正しても無駄であることに気づきました。 そこで彼はセガのCEOに連絡し、NVIDIAでは課題を完了できないことを説明し、セガから援助を得た。幸いにも彼は倒産を免れた。 2つ目は、NVIDIAが2007年に発表したCUDA GPUアクセラレーションコンピューティングテクノロジーです。 CUDA 技術を世界に広めるために、GTC カンファレンスが特別に設立されました。長年の努力の結果、NVIDIA のテクノロジーは AI 革命の重要な原動力となりました。 3つ目は、携帯電話市場から撤退し、グラフィック カードに注力するという難しい決断を下すことです。 老黄はこう言いました。「戦略的な撤退、犠牲、そして何を諦めるかを決めることが成功の核心であり、まさに重要な核心である。」 X社のエンジニアは、この経営手法はマスク氏のX社の運営と非常に似ていると語った。 一部のネットユーザーは、黄氏の管理スタイルはマルチモーダルインテリジェントエージェント大規模モデルシステムにモデル化できると冗談を言った。 もし黄氏がマスク氏のような伝記を出版することができれば、誰もが喜んで読むだろうと私は信じている。 Nvidia の GPU がどのように成功を収め、大企業にとっての金採掘のシャベルとなったかを見てみましょう。 世界のGPU不足は40万台を超えるH100 の不足により、シリコンバレーの経営者たちはすでにパニックに陥っています。 Sam Altman 氏はかつて、GPU の燃料が不足しており、ChatGPT を使用するユーザーが減ることを望んでいると明かしました。 😂 「GPU は非常に不足しており、当社の製品を使用する人が少なければ少ないほど良いのです。」 アルトマン氏は、OpenAI は GPU の制限により、いくつかの短期計画 (微調整、専用容量、32K コンテキスト ウィンドウ、マルチモーダル性) を延期したと述べました。 OpenAIの共同設立者でパートタイムの科学者でもあるアンドレイ・カルパシー氏は、誰がいくつH100を獲得したかが今やシリコンバレーの最大の話題になっていることも明らかにした。 コミュニティ内で広く配布されたこのチャートでは、かつて次のような推定が行われました。 -GPT-4はおそらく約10,000〜25,000個のA100でトレーニングされた -メタ約21000 A100 -テスラ約7000 A100 -安定性AI約5000A100 -ファルコン40Bは384機のA100で訓練された – Inflectionは3500とH100を使用して、GPT-3.5に匹敵する機能を持つモデルをトレーニングしました。 現在、テクノロジー企業が H100 の購入に並んでいるだけでなく、サウジアラビアやアラブ首長国連邦も動き出し、一度に数千個の H100 GPU を購入しています。 マスク氏は、H100を購入するのは現在極めて困難であると率直に述べた。 マスク氏によると、GPT-5には3万〜5万個のH100が必要になる可能性がある。以前、モルガン・スタンレーは、GPT-5は25,000個のGPUを使用し、2月からトレーニングされていると述べていましたが、サム・アルトマンは後にGPT-5はまだトレーニングされていないことを明らかにしました。 「Nvidia H100 GPU: 供給と需要」と題された記事では、中小規模のクラウドプロバイダーの大規模H100クラスターの容量が枯渇しそうになっており、H100の需要傾向は少なくとも2024年末まで続くだろうと推測されています。 マイクロソフトの年次報告書では、GPU が同社のクラウド事業の急速な成長にとって「重要な原材料」であると投資家に強調した。必要なインフラストラクチャが利用できない場合は、データセンターの停止のリスク要因が発生する可能性があります。 OpenAI では 50,000 台の H100、Inflection では 22,000 台、Meta では 25,000 台、大手クラウド サービス プロバイダー (Azure、Google Cloud、AWS、Oracle など) では 30,000 台が必要になると推測されています。 Lambda、CoreWeave、その他のプライベート クラウドでは合計で 10 万が必要になる可能性があります。 Anthropic、Helsing、Mistral、Character にはそれぞれ 10k 必要になる可能性があります。 全体として、世界中の企業では約 432,000 台の H100 が必要です。 H100 1 台あたり約 35,000 ドルなので、GPU の総需要は 150 億ドルになります。 これには、H800 を必要とする多数の国内インターネット企業は含まれません。 さらに、H100 は需要が高いだけでなく、利益率も非常に高いです。 業界の専門家は、Nvidia H100 の利益率は 1,000% に近いと述べています。 |
<<: RLHF が LLM トレーニングの鍵となるのはなぜですか? AI専門家が5つの代替案を検討し、Llama 2のフィードバックメカニズムのアップグレードを説明
昨年、微博で話題になった動画を覚えている人はどれくらいいるだろうか。『射雁英雄伝』で朱茵娜が演じ...
導入畳み込みはニューラル ネットワークのコア計算の 1 つです。コンピューター ビジョンにおける畳み...
近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実...
【51CTO天津6月29日】本日、「偉大な知能時代へ向かう」をテーマとする世界知能会議が天津梅江会議...
自動運転とは何ですか?自動運転とは、さまざまなセンサー、コンピュータービジョン、人工知能、機械学習な...
「自動化」の本質的な意味は変わりませんが、その用語の使用法は時間の経過とともに確実に変化してきました...
[[244632]]今後 30 年間で、人工知能は、現在人間が理解していない多くの社会現象を引き起こ...
50 年前の kNN アルゴリズムは、わずか 14 行のコードで、BERT などの人気の Trans...
国際的なテクノロジーコンサルティンググループであるアクセンチュアは、間違いなくAIGCによって深刻な...
[[188225]] arXiv.org は、物理学、数学、コンピューターサイエンス、生物学の論文の...
人工知能は将来の技術開発の最前線分野として、ディープラーニング、レコメンデーションエンジン、コンピュ...
業界における人工知能(AI)の応用シナリオは増え続けており(日常的なスマート製品から大規模なイノベー...