「業界最強」と称されるアリトン・イー・チエンウェン、国内No.1大型モデルを目指す

どの時代にもメインテーマがあり、次の10年の主なテーマはAIです。

ChatGPTの登場以来、中国では雨後の筍のようにさまざまな大型モデルが出現しました。有名なHuawei Pangu大型モデル、Baidu Wenxin Yiyan大型モデル、iFlytek Spark大型モデル、Douyin Yunlark大型モデル、そして今日の主役であるAli Tongyi Qianwen大型モデルなど、名前を挙げることができる大型モデルは10以上あります。

Geek.com の不完全な統計によると、中国には 10 億を超えるパラメータを持つ大型モデルを所有するメーカーや機関が 300 社近くあり、その数は今も急速に増加しています。 2024年第1四半期末までに、「百式大戦」が「千式大戦」にアップグレードされる予定です。

図: 中国でよく知られている大型モデル

このような「壮観な」光景が最後に現れたのは、10年前のインターネット共同購入のときだった。しかし、両者の間には本質的な違いがあります。「千機種戦争」は、「千集団戦争」の資本主導・マーケティング主導型から、研究開発主導・技術主導型へと移行した。これは中国が産業の高度化で追求している高品質な発展と一致している。「千機種戦争」はもはや金銭とルーティンの競争ではなく、真の技術革新能力の競争である。

インターネット時代の最大の受益者と勝者の1つとして、アリババは強いビジネス感覚を持ち、最も早く「ハードテクノロジー」の研究開発に全面的に転換したインターネット大手の1つであり、AI大型モデルの分野でも第一層に参入することに成功しました。 2023年、アリババの同義千聞ビッグモデルは、テクノロジー、ビジネス、エコロジーの分野で画期的な進歩を遂げました。国内AIビッグモデルの王者は、おそらくアリババでしょう。

初めて「業界最強」と評価される

12月1日、アリババクラウドは北京で記者会見を開催し、同義千聞クローズドソースモデルのバージョン2.1をリリースし、同義千聞視覚理解モデルQwen-VLをアップグレードし、同義千聞720億パラメータモデルQwen-72Bをオープンソース化した。 18億、70億、140億から720億のパラメータスケールまで、Tongyi Qianwenは業界初の「フルサイズオープンソース」の大型モデルになりました。これは、4月のリリース以来、Alitong Yi Qianwenがついに壮大なアップグレードをもたらしたことを示しています。

写真：アリトン・イーチエンウェン記者会見

横並びの比較を通じて、Qwen-72B が現在業界で最強のオープンソースの中国製大型モデルであり、10 の権威あるベンチマーク評価でオープンソースモデルの中で最高の結果を達成していることは容易にわかります。特に中国語タスクモードでは、Qwen-72BはC-Eval、CMMLU、GaokaoBenchなどのベンチマークを圧倒し、そのスコアはGPT-4を上回っています。数学的推論の面では、Qwen-72BはGSM8KとMATH評価で他のオープンソースモデルを大きく上回っています。コード理解の面では、HumanEval、MBPPなどの評価におけるQwen-72Bのパフォーマンスが大幅に向上し、コーディング能力が質的に飛躍しました。

英語タスクでは、Qwen-72B は MMLU ベンチマークテストでオープンソースモデルの中で最高スコアを達成しました。言い換えれば、Qwen-72B は、オープンソースベンチマーク Llama 2-70B やほとんどの商用クローズドソースモデルのパフォーマンスを上回っているだけではありません。将来的には、エンタープライズレベルや科学研究レベルの高性能アプリケーションにも、オープンソースの大規模モデルのオプションが提供されるようになります。

図: 権威ある評価のトップ10では、Tongyi Qianwenの720億パラメータモデルがオープンソースモデルの中で最高得点を獲得しました。

図：Tongyi Qianwenの720億オープンソースモデルは、いくつかの点でクローズドソースのGPT-3.5とGPT-4を上回っています

さらに、Tongyi Qianwen 2.1 も大幅にアップグレードされ、複雑なコマンドの理解、文学の創造、一般的な数学、知識の記憶、幻覚への耐性などの能力が目に見えて向上しました。具体的には、コード生成理解能力が30％増加、幻覚誘発耐性が14％増加、数学的論理推論能力が10％増加、中国語と英語の百科事典知識が5％増加しました。

競争が激しい大型モデルの分野では、小さな改善がより大きな競争上の優位性を意味するため、大手メーカーは常により高い技術指標へとアップグレードしています。このような状況下で、アリトン・イー・チエンウェンは、完全な後れから部分的にリードするまでにわずか6か月余りしかかからず、これは非常に価値のあることだ。今後3～5年で、アリババがこのような急速な発展の勢いを維持できれば、国内のAI大型モデルのトップに到達し、新たな技術時代の第1位に再びなるチャンスが得られるだろう。

破壊不可能な「技術的堀」を構築する

前述のように、大規模な AI モデルはもはや資本やマーケティングではなく、真の技術革新に依存しています。中核的な優位性を持たない企業は、テクノロジーが急速に進化するにつれて、徐々に歴史の流れの中で消え去っていくでしょう。「千集団戦争」の結果と同様、ごく少数の大手モデル企業だけが「最後まで笑っていられる」のです。最も早く「ハードテクノロジー」に転換したインターネット大手の一つとして、アリババは10年以上の技術蓄積を経て、サイクルを越えるための条件をすでに備えていた。

大規模な AI モデルには、データ、アルゴリズム、計算能力という 3 つの中核となる技術的リンクがあります。中国最大のインターネット大手の一つであるアリババは、データ、特に取引の詳細を含む電子商取引データにおいて当然の優位性を持っており、その点でアリババの優位性はさらに明白です。アルゴリズムに関しては、アリババは少し遅れてスタートしましたが、現在では GPT-4 に非常に近づいており、一部のセグメントではそれを上回っています。歴史的に見ると、中国企業はデータアルゴリズムの分野で一度も負けたことがないので、この分野で追い抜くのはもうすぐです。

データやアルゴリズムと比較して、最も重要なのは計算能力です。現在、大規模企業がコンピューティング能力を構築する唯一の方法は、より高度なコンピューティングインフラストラクチャを購入することです。コンピューティングインフラストラクチャの最も重要なコンポーネントは、AI コンピューティングチップです。現在、AI コンピューティングチップでは NVIDIA が最高です。最新の H200 は 141GB のメモリと最大 4.8TB/秒の処理速度を備え、全体的なパフォーマンスは前世代の 2 倍です。このチップは、AI 大規模モデル企業に大きな助けをもたらすでしょう。

図: NVIDIA H200 のパフォーマンス

しかし、よく知られている理由により、Nvidia H200などの最先端の米国製AIチップは中国企業に販売できません。中国企業が新たな産業変革の主導権を握りたいのであれば、自立が必須となっている。

中国では、ファーウェイ以外ではアリババが独自のチップを開発し、成果を上げている数少ない企業の一つだ。同社が強く推奨するHanguang 800は、かつては世界で最も強力なAI推論チップとなった。近年、アリババ傘下のチッププラットフォームであるPingtou Geは、Iron 910とWujian SoCプラットフォームを相次いでリリースした。先月、アリババのXuantie RISC-Vは、AIマトリックス拡張を初めて実現したC907、Vector1.0規格に準拠したC920、リアルタイムプロセッサR910という3つの新しいプロセッサを発売しました。現在までに、アリババの平頭閣は合計30億個のRISC-Vチップを販売しており、世界市場シェアの30%を占めている。そのうち、ヘマタイトCPUの出荷量は25億個を超え、中国国内で最も応用規模が大きい国産CPUとなっている。

図：アリババの平頭峰チップ製品一覧

平頭閣が国内で無視できないチップになったことは間違いありません。チップ分野でブレークスルーを達成するということは、コンピューティングインフラストラクチャの構築においてより大きなイニシアチブを持つことを意味します。これにより、アリババは大型モデルの分野で破壊不可能な「技術的堀」を築くことができるだけでなく、外国の独占を打ち破り、他の関連国内企業の自主的な革新に強力なサポートを提供することができます。今後もアリババクラウドは独自の産業エコシステムを拡大し続け、業界全体の推進役へと発展していきます。

実際、Tongyi Qianwenだけでなく、中国の大手モデル企業の半数が現在Alibaba Cloud上で運営されています。アリババクラウドのCTOである周景仁氏は、アリババクラウドは今後もプラットフォーム機能を開放し、より多くの企業がビッグモデルの商業的価値を実現できるよう支援していくと述べた。

アリはそう言って、そうしました。例えば、アリババクラウドが最近リリースしたワンストップの大規模モデルアプリケーション開発プラットフォーム「アリババクラウド百聯」は、国内外の主流の高品質大規模モデルを統合し、モデルの選択、微調整トレーニング、セキュリティスイート、モデルの展開、フルリンクアプリケーション開発ツールなどのサービスを提供し、ユーザーにとって基盤となるコンピューティングパワーの展開、モデルの事前トレーニング、ツール開発などの複雑なタスクを簡素化します。開発者は 5 分以内に大規模なモデルアプリケーションを開発し、数時間でエンタープライズ固有のモデルを「改良」できるため、アプリケーションのイノベーションにさらに集中できます。

図：アリババクラウド百聯プラットフォーム

2023年10月現在、アリババクラウドは60社を超える業界大手パートナーと緊密な協力関係を築き、オフィス、文化・観光、電力、政府関係、医療保険、交通、製造、金融、ソフトウェア開発などの分野で「同益前文」の実現を推進しています。この結果は、間違いなく、再びほとんどの競争相手を上回りました。つまり、独自の技術的優位性とエコロジカルなレイアウトを備えた Alitong Yi Qianwen は、業界のリーダーになる可能性が最も高い大型モデルです。

結論は：

生成AIはますます普及しており、何千ものモデル間の戦いが加速しています。最も早く「ハードテクノロジー」に転換したインターネット大手の1つであるアリババは、10年以上にわたって蓄積した技術優位性により、データ、アルゴリズム、コンピューティングパワーの3つのコアリンクで破壊不可能な堀を築きました。また、業界最強の720億パラメータのオープンソース中国大型モデルQwen-72Bの発売をリードしました。今後、アリババクラウドのエコシステムが成長を続けるにつれ、アリトン・イー・チエンウェンは業界のトップに到達する可能性が最も高いビッグモデルになるでしょう。中国の産業高度化の観点から見ると、アリババのAI分野への継続的な投資は、間違いなく再び正しい流れに賭けたものとなっている。この巨大企業アリババが、産業変革の新たな局面で、その変革と変貌を成功裏に成し遂げられることを祈っています！（終わり）

<<:

>>: DetZero: Waymo の 3D 検出リストで 1 位、手動ラベル付けに匹敵!