MLPerfの結果が発表され、中国のAIチップ企業が再び世界第1位に!大規模モデル推論の3つのカテゴリーで優勝し、H100を超えるパフォーマンスを達成

MLPerfの結果が発表され、中国のAIチップ企業が再び世界第1位に!大規模モデル推論の3つのカテゴリーで優勝し、H100を超えるパフォーマンスを達成

ChatGPT などの AIGC アプリケーションが大規模なモデルの波を引き起こすにつれて、インフラストラクチャとしてのコンピューティング パワー レイヤーが最初に恩恵を受ける業界になりました。

しかし、高い計算能力要件や高コストなどの問題は、企業が大規模モデルを実装する際の共通の悩みとなり、AIの発展を制限する可能性が高まっています。大規模モデルのパラメータが増加する一方で、計算能力供給のボトルネックが差し迫っており、大きな矛盾が生じています。

大規模モデル向けのより優れたコンピューティング ソリューションをどのように探求するかは、業界の共通の焦点です。

最近、世界的に権威のある評価機関MLPerfが最新の推論評価結果を発表しました。MLPerfがGPT大規模モデル推論テストを導入するのは今回が初めてです。参加熱は新記録を樹立し、NVIDIA、Intel、Google、Qualcommなどの企業から13,500件を超えるパフォーマンス結果が提出されました。

MLPerf Inference 3.1 では、Moffet AI S30 コンピューティング カードが、大規模モデル GPT-J (60 億パラメータ) の単一カード、4 枚カード、8 枚カードのコンピューティング能力で 1 位にランクされました。

MoXin が MLPerf でタイトルを防衛するのは今回で 3 回目です。

MoXin はこれまで、MLPerf Inference 2.0 および 2.1 で 2 年連続 1 位を獲得しています。

Moxin S30 コンピュートカード

MoXin の成果は、大規模モデル コンピューティング ソリューションに実現可能な革新的な方向性をもたらしました。

AI モデルとコンピューティング プラットフォームを組み合わせたソフトウェアとハ​​ードウェアの共同イノベーションにより、より大きなコンピューティング能力の可能性を引き出せることが事実によって証明されています。これは、スパースコンピューティングに代表される革新的な技術が、大規模モデルの時代におけるコンピューティングパワーの発展の鍵となることを改めて裏付けています。

MoXin は MLPerf オープン パーティションに参加しました。主催者の MLCommons によると、このパーティションはイノベーションを促進することを目的としています。したがって、参加者はソフトウェアとハ​​ードウェアの連携を通じてコン​​ピューティング能力を向上させる方法を模索できます。

MLPerfのGPT-J大規模モデルでは、4nm H100純粋なハードウェアアクセラレーションソリューションと比較して、12nm Moxin S30コンピューティングカードは、「独自のデュアルスパースアルゴリズム+ハードウェアコラボレーション」アプローチを通じて最大1.8倍の利点を達成しました。

このテストで評価された GPT-J モデルは、生成 AI モデルです。MoXin S30 コンピューティング カードの 8 カード、4 カード、シングル カード モードのパフォーマンスはそれぞれ 170.59、91.57、23.28 (サンプル/秒) で、NVIDIA H100 のパフォーマンスの 1.6 倍、1.8 倍、1.8 倍であり、MoXin 製品の AIGC タスクにおける能力を実証しています。

3度目の優勝を果たし、大型コンピューティングパワーで初めて「論文を提出」し、ソフトウェアとハ​​ードウェアの連携で革新を続けています。MoXinの製品力はMLPerfによって何度も厳しくテストされており、大型コンピューティングパワーの開発の新たな道も模索しています。

スパースコンピューティング: 大規模モデルの「潜在的在庫」が市場で認知される

MoXin の継続的な優れた成果は、主にスパース アルゴリズムに基づくソフトウェアとハ​​ードウェアの共同設計によるものです。

大規模モデルの時代において、スパース コンピューティングの重要性は自明です。AI モデルのサイズは、そのスパース化の可能性に比例します。

つまり、モデルが大きくなるほど、アルゴリズムのスパース性が高まる可能性が高くなり、スパースコンピューティングの高速化の度合いが高くなります。一般的な大規模言語モデルの場合、スパース コンピューティングによって数十倍の高速化が実現できます。

MoXin 独自のデュアルスパース アルゴリズムとソフトウェアとハ​​ードウェアの共同設計を組み合わせることで、MoXin の Antoum® チップは最大 32 倍のスパース性をサポートする世界初の高スパース AI チップとなり、これがこの MLPerf における MoXin の記録破りのパフォーマンスの鍵でもあります。

モデルが大きくなるほど、スパース コンピューティングの利点は明らかになります。特に、GPT などの大規模モデルのパラメーターが数百億、数千億に簡単に達する現在の状況では、MoXin の堀はより強固になります。

MoXin の製品の強みとスパース コンピューティングの一般的な傾向も業界で認められており、 MoXin の商用化プロセスは重要なブレークスルーを次々と実現し、企業の AI アプリケーションの加速に貢献しています。

つい最近、MoXin は正式に Byte MLPerf をサポートするサプライヤーの 1 つになりました。

出典: Byte MLPerf ウェブサイト

プロジェクトアドレス: https://github.com/bytedance/ByteMLPerf/blob/main/README.md

現在、MoXin AI コンピューティング プラットフォームは、BLOOM、OPT、GPT-J、LLaMA、StableDiffusion など、さまざまなパラメーター レベルの大規模モデルをサポートできます。

同時に、高スループット、低レイテンシ、低消費電力という特性を備えており、コンピューティングパワーの難しさが軽減され、企業に真に「使いやすく」「手頃な価格」な大規模コンピューティングパワーソリューションをもたらします。

スパースコンピューティングはコンピューティング能力に根本的な変化をもたらし、大規模モデルの開発に役立ちます。

MoXin のスパース コンピューティング ソリューションは、現在のコンピューティング能力の問題を軽減するだけでなく、AI の継続的な開発のための新たな空間を切り開きます。

スパースコンピューティングは、AIモデルに必要な計算量を削減します。つまり、大規模なモデルでは、過度な計算量を発生させることなく、パラメータの数を数桁増やすことができます。大規模なモデルパラメータの増加と計算能力のボトルネックの矛盾が根本的に解決されると期待されます。

同時に、計算​​能力の削減により、高い計算能力要件、高い電力消費、高コストなどの大規模モデルの問題点も解決され、「win-win」効果が得られます。

Moxin Antoumチップ:最大32倍のスパースをサポートする世界初の高スパースAIチップ

3回連続のMLPerfsの優れた結果は、MoXin製品の強さを証明するだけでなく、業界に新たなインスピレーションをもたらします。スパースコンピューティングなどのテクノロジーの助けを借りて、大規模モデルの開発と応用により、より広い表示スペースがもたらされ、AIGCやその他のアプリケーションのあらゆる分野への応用が加速されると期待されています。

MLPerfについて

MLPerf は、チューリング賞受賞者の David Patterson 氏と、Google、スタンフォード大学、ハーバード大学などのトップクラスの学術機関によって開始されました。急速に拡大する AI コンピューティングのニーズとパフォーマンスをタイムリーに追跡および評価する、最も権威があり影響力のある国際的な AI パフォーマンス ベンチマークです。

<<: 

>>:  ミュンヘンモーターショーからのシグナル:自動車メーカーがOS開発に躍起になり、中国の力が増す

ブログ    

推薦する

将来を見据えたデータセキュリティのためのAIソリューション

今日、ビジネスリーダーは急速に進化するデジタル世界における多数のデータセキュリティの脅威に対処してい...

...

2022年以降の中国の自動運転産業の展望

2022年1月28日、iResearchは「2021-2022年中国自動運転産業年次概要レポート」を...

洪水期に緊急通信を確保するにはどうすればよいでしょうか?ドローンは誰もが好む新たな力となる

現在、わが国の南北は本格的な洪水期に入っており、水利部門が洪水・干ばつ災害対策の緊急対応をレベルIV...

米軍は市街戦環境向けの人工知能システムを開発中

米陸軍研究所は、都市環境における兵士の状況認識力と戦闘能力を向上させるために、認知・神経工学共同技術...

SchiramRank - 公平にランク付けする方法を学ぶ

2023年に終了した国際学術会議AIBT 2023において、Ratidar Technologies...

...

マイクロソフト、進化拡散法を用いたタンパク質生成のための新しい AI フレームワーク EvoDiff をオープンソース化

進化により、細胞プロセスを正確に制御する多様な機能性タンパク質が生み出されました。近年、この多様性か...

...

...

李蘭娟氏との対話:人工知能は流行病を「すべて捕捉」し、医療をより正確にする

[[353851]] 「新型コロナウイルス感染症の突然の発生は、厳しい課題、不確実性、状況の進展の複...

デジタルホーム: IoTとAIで家電をもっとスマートに

洗濯機、照明、スピーカー、テレビ、カメラなど、日常的に使用するデバイスが、離れた場所からあなたと通信...

デジタル時代におけるデータ近代化の重要性

1. データの近代化とは何ですか? デジタル時代においてなぜ重要なのですか?データの最新化とは、デー...

MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

特定のタスクを実行するためにニューラル ネットワークを調整したいですか?この問題は想像したほど単純で...

...