Alibaba Cloud が Tongyi Qianwen 2.0 をリリース、パフォーマンスが加速して GPT-4 に追いつく

Alibaba Cloud が Tongyi Qianwen 2.0 をリリース、パフォーマンスが加速して GPT-4 に追いつく

2023年杭州雲奇大会において、アリババクラウド最高技術責任者の周景仁氏は、数千億のパラメータを持つ大規模モデル「Tongyi Qianwen 2.0」を発表した。 10 件の権威ある評価において、Tongyi Qianwen 2.0 の総合的なパフォーマンスは GPT-3.5 を上回り、GPT-4 に追いつくまでに加速しています。

過去6か月間で、Tongyi Qianwen 2.0のパフォーマンスは飛躍的に向上したと報告されています。4月にリリースされたバージョン1.0と比較して、Tongyi Qianwen 2.0は、複雑な指示の理解、文学の創作、一般的な数学、知識の記憶、幻覚への耐性などの機能が大幅に向上しました。現在、Tongyi Qianwenの総合性能はGPT-3.5を超え、GPT-4に追いつくべく加速しています。

MMLU、C-Eval、GSM8K、HumanEval、MATHを含む10の主要なベンチマーク評価セットにおいて、Tongyi Qianwen 2.0の総合スコアはMetaのLlama-2-70Bを上回りました。OpenAIのChat-3.5と比較すると9勝1敗、GPT-4と比較すると4勝6敗となり、GPT-4との差がさらに縮まりました。

中国語と英語を理解する能力は、大規模言語モデルの基本スキルです。英語タスクに関しては、Tongyi Qianwen 2.0はMMLUベンチマークで82.5点を獲得し、GPT-4に次ぐ成績を収めました。パラメータ数を大幅に増やすことで、Tongyi Qianwen 2.0は複雑な言語構造と概念をよりよく理解し、処理することができます。中国語タスクに関しては、Tongyi Qianwen 2.0はC-Evalベンチマークで最高得点を獲得し、明らかな優位性を発揮しました。これは、モデルがトレーニング中により多くの中国語コーパスを学習し、中国語の理解力と表現力がさらに向上したためです。

数学的推論やコード理解などの分野では、Tongyi Qianwen 2.0 は大きな進歩を遂げました。推論ベンチマークテスト GSM8K では、Tongyi Qianwen は強力なコンピューティングおよび論理的推論能力を発揮して 2 位にランクされました。HumanEval テストでは、Tongyi Qianwen は GPT-4 および GPT-3.5 に僅差で続きました。このテストは主に、大規模モデルがコード スニペットを理解して実行する能力を測定します。これは、プログラミング支援や自動コード修復などのシナリオに大規模モデルを適用するための基礎となります。

<<: 

>>:  ロボティック・プロセス・オートメーションは大きな問題でしょうか?

ブログ    
ブログ    

推薦する

AI搭載のレンガ積みロボットが建設業界に革命を起こす

現在、建設部門は大規模なプロジェクトによって活性化しており、大きな成長を牽引しています。しかし、これ...

人工知能をめぐる世界的競争におけるヨーロッパの立場と戦略分析

[[357807]]人工知能は世界的な競争の焦点となっている。この重要な戦略的機会を捉えるために、欧...

2019年の人工知能予測

[[253703]]プライバシーやデータバイアス規制などの問題から、モデルのトレーニングやセルフサー...

JD Search EE リンクの進化

検索システムにはヘッド効果が存在する可能性が高く、高品質のミッドテールおよびロングテール製品が十分な...

Raspberry Pi を搭載した MIT のヤドカリ型ロボットは「何でもできる」

[[392157]]ロボットは通常、設計された特定のタスクを非常にうまく実行する特殊なツールですが、...

食品サービス機器業界の主な動向

[[442813]]画像ソース: https://pixabay.com/images/id-673...

NVIDIA の最も強力な汎用大型モデル Nemotron-4 が登場! 15Bが62Bに勝ち、ターゲットはA100/H100です。

最近、NVIDIA チームは、8T トークンでトレーニングされた 150 億のパラメータを持つ新しい...

人工知能は人間の生活水準をどのように向上させることができるのでしょうか?

米国を例にとると、10年後には、成人一人当たり人工知能ビジネスから年間13,500ドルの利益を得るこ...

2023年以降を一変させる5G IoTテクノロジートップ10

IoT 分野の拡大と発展により、多くの変革的テクノロジーがもたらされるでしょう。家庭から自動車、ウ...

...

人工知能専攻では主に何を学ぶのですか?キャリアの方向性と展望は何ですか?

人工知能専攻は、工学専攻の下にある電子情報専攻に属します。ここでは、人工知能専攻を提供している大学と...

ワークスペースデザインの未来: AI、3Dウォークスルー、リアルタイムコラボレーション

過去 10 年間で、スマート AI ツールの導入により、ワークスペースのデザインは完全に変化しました...

人工知能から新素材まで、IBMが5つの革新的な技術を発表

[原文は51CTO.comより] 2019年のIBM中国フォーラム(シンクサミット)で、IBMは各分...

ヒープソートアルゴリズムの普及チュートリアル

[[121962]]この記事の参考文献: アルゴリズム入門、第 2 版。この記事では、ヒープソートア...