LIama2を運営して8400万元稼ごう!最速のAI推論チップのコスト見積もりが白熱した議論を巻き起こす

LIama2を運営して8400万元稼ごう!最速のAI推論チップのコスト見積もりが白熱した議論を巻き起こす

史上最速の大規模モデル推論を実現するには、1171万ドル(8410万元)の費用がかかりますか? ? ?

同じプロジェクトの場合、Nvidia GPU を使用するコストはわずか 30 万ドルです...

最も強力な AI チップが Groq に移るかどうかについては、待って見守る必要があるかもしれない。

過去 2 日間で、Groq は驚くべき登場を果たしました。 「Nvidia より 100 倍コスト効率が高い」と言われるチップを使用して、目立った遅延なく 1 秒あたり 500 トークンの速度で大規模なモデルを生成します。 Google TPU チームの優秀な人材である Buff と相まって、多くの人がこう言っていました。「Nvidia は打ち負かされるだろう...」

騒動の後、主にGroqの費用対効果に焦点を当てた合理的な議論がいくつか出始めました。

ネットユーザーは、現在のデモには568個のチップが必要で、コストは1171万ドルになると概算した。

その結果、業界内外のあらゆる分野の人々が自発的に計算を始めました。

テーブルを持って現れ、自分の経験を共有するアナリストもいました...

そしてため息をつきました。 「よし、今週はみんな公開数学をやるんだ。」

しかし、Groq 氏もできるだけ早くソーシャル ネットワーク上で反応しました。

「みんな数学をやっている」

Groq のコスト問題に関する議論には、コンピューターを学ぶ学生や推論サービスを提供するクラウドベンダー、さらには現従業員と対立する元 Groq 従業員など、さまざまな人が参加し、非常に活発な議論が展開されました。

代表的なものをいくつか取り上げて、みんながどう思うか見てみましょう。

まず、大まかな見積もりですが、カードの価格はおよそ 20,000 ドルで、メモリはわずか 0.23 GB です。

したがって、1 台の LLama 70B モデルをサービスするには、約 320 枚のカード (実際にはそれ以上) を購入する必要があり、サーバーを含めて約 1,000 万ドルの費用がかかります...

Nvidia の H100 と比較するとどうでしょうか?

レプトンの賈洋青氏も参加し、いくつかの計算を行った。基本価格に加え、エネルギー消費量、性能、運用コストの観点からも分析しました。

最後に、次の核心点をまとめます。

  • LLaMA 70b モデルの場合、572 枚のカードを使用すると、年間の電気代は 254,000 ドルになります。
  • 4 枚の H100 カードを使用すると Groq のパフォーマンスの半分しか得られず、8 枚のカードが入った H100 ボックスのコストは現在約 30 万ドルになります。
  • 3年間運営した場合、Groqのハードウェア調達コストは1,144万ドル、運用コストは76万2,000ドルとなる。それに比べて、H100 は調達コストと運用コストが低くなります。

なお、Groq が実施したベンチマークテストには Lepton も含まれており、推論速度は Lepton の約 3 倍です。


賈陽青氏はまた、自分とGroqの創設者は古くからの知り合いであることを明らかにした。

私たちは Google にいた頃から知り合いでした。

ただし、これらの議論には他のアルゴリズムも存在します。

例えば、一部のネットユーザーは、単一のトークンの価格に基づいて計算するとどうなるのかと質問しています。

それは問題ではありません。行動を起こすプロのアナリストは他にもたくさんいます。

しかし、彼の計算によれば、100万トークンの支出ごとに、Groq の方が費用対効果が高くなります。

これに加えて、Transformer の高速化がサポートされているかどうかなど、他の議論もあります。

Groq オンライン Q&A

皆があまりにも注目していたので、グロクは出てきて自ら質問に答えざるを得ませんでした。

もう一度 FAQ を投稿して説明したいと思います。

主なポイントは次のとおりです。

  • オープンソース モデルを採用し、コンパイラを適応させて実行するだけです。
  • 当社のトークンは、チップからシステムまですべてを仲介業者なしで自社で行っているため、非常に手頃な価格で効率的です。
  • チップはサードパーティのサプライヤー以外には販売されないため、公表されている売上高は歪んでいる。
  • 私たちのターゲット顧客はシングルカードユーザーではありません。

オンラインでの質問への回答はまだ続いています...


したがって、Groq が本当に Nvidia の地位を揺るがすことができるのかどうかは、待って見守る必要がある。

しかし、昨日のNvidiaの株価は異常な動きを見せました...

<<:  人工知能は世界を支配するのでしょうか?

>>:  Karpathy の新しいビデオが再び人気に: GPT Tokenizer をゼロから構築

ブログ    
ブログ    
ブログ    

推薦する

Google CEO ピチャイ: 新しい AI 製品のサブスクリプション モデルを検討中

10月26日、2023年第3四半期の決算発表で、グーグルとその親会社アルファベットのCEOであるサン...

人工知能をゼロから学ぶのは難しくない

「人工知能」という用語は、1956年にダートマス協会で初めて提案されました。それ以来、研究者は多くの...

黄氏の最新インタビュー:チップ不足はなかなか解消されず、次のトランスフォーマーはすでに登場している

Nvidia の GPU が世界を席巻しています。テクノロジー企業は、Nvidia のスーパーコンピ...

ファーウェイの石耀宏氏:成都にインテリジェントシティを構築し、スマートで美しい都市を創る

「巴斯」と呼ばれる快適さと「成都」と呼ばれるライフスタイルがあり、中国で最も幸せな都市として、成都は...

この記事は人工知能を始める上で強力な助けとなるでしょう

[[269504]]人工知能はまるでまだ遠い未来の話であるかのように語られていますが、実際にはすでに...

2022 年の 5 つの主要な AI と機械学習のトレンド

[[414740]]人工知能と機械学習の分野では、企業が今から準備しておくべき大きなトレンドがいくつ...

モノのインターネット業界は一時的な流行に過ぎないのでしょうか、それとも産業史上の重要な節目となるのでしょうか?

人類の長い発展の過程において、生産性を向上させることができる発明や方法は、人々の記憶に残ります。産業...

ディープラーニングのためのヘテロジニアス アクセラレーション テクノロジー (パート 2): カタツムリの殻の中に道場を構築する

1. 概要記事「ディープラーニング向けヘテロジニアスアクセラレーションテクノロジー(パート1)」で説...

Objective-C でのソートアルゴリズムを学ぶ

データ構造とアルゴリズムを学習していたとき、ソートアルゴリズムをアニメーションで表現して、理解しやす...

...

IDC: 2021 年の中国スマート デバイス市場に関するトップ 10 の予測

過去 10 年間、中国のスマート デバイス市場では、一連の技術的変化、エコシステムの変化、ユーザーの...

...

効率的なコーディングのための 5 つの IntelliJ IDEA プラグイン

人工知能(AI)は現在、将来のトレンドと発展の方向性として広く認識されています。 AI がすべての仕...

Facebook の科学者: アルゴリズム モデルにジャンク データを入力するのはやめてください...

「人は食べたものでできている。私たちはモデルにジャンクフードを与えている」とフェイスブックのAI研...

モザイクも安全ではないのですか? 「ブロックバスター」のモザイクはAIによってワンクリックで削除可能

知っていましたか?モザイクはもう安全ではありません!こんにちは、友人の皆さん。私は Jiguo.co...