百度グループ副社長ウー・ティエン氏:文心ビッグモデル3.5は機能面でChatGPT3.5を上回った

百度グループ副社長ウー・ティエン氏:文心ビッグモデル3.5は機能面でChatGPT3.5を上回った

7月19日、「新バージョンの文心易言の性能はChatGPT 3.5を上回り、これは我が国の関連技術作業の遂行においても重要な節目となる」と報じられた。百度グループの副社長で、国家深層学習技術応用工学研究センターの副所長である呉天氏は、網易科技などのメディアに語った。

彼女は、IDCが発表した最新の「AIビッグモデル技術能力評価レポート2023」によると、百度文心ビッグモデル3.5は12の指標のうち7つで満点を獲得し、総合スコア、アルゴリズムモデル、業界カバレッジで1位になったことを紹介した。

IDCの評価レポートでは、製品技術、サービスエコシステム、業界応用という3つの側面を中心に、ビッグモデルの10以上の指標を検討していると報じられている。今回の評価には、Baidu、Alibaba、Tencent、Huawei、iFlytek、360、SenseTimeなど、国内主流のビッグモデルメーカー14社が参加した。報告書の結果によると、百度文心はモデル機能、ツールプラットフォーム、エコシステムレイアウト、業界カバレッジにおいて明らかな優位性を持ち、予定より早く商業化探索段階に入った。

呉天氏は、百度は2019年から事前トレーニングモデルの研究開発に深く関わっており、知識を強化した文心シリーズモデルを相次いでリリースしてきたと紹介した。少し前に、百度は文心ビッグモデルの3.5バージョンを正式にリリースし、基本モデル、知識強化、検索強化など、多くのコアテクノロジーでさらなる革新を遂げました。新バージョンでは、さまざまな機能が大幅に向上しています。

具体的には、文心ビッグモデルが「第1位」を獲得したのは、百度の3つの優位性、「チップ・フレームワーク・モデル・アプリケーション」の4層技術スタック、知識強化の中核機能、繁栄したビッグモデルエコシステムのおかげであると述べた。特に、Baidu が独自に開発したディープラーニング プラットフォーム PaddlePaddle は、大規模モデルの効率的なトレーニングと推論を強力にサポートします。 PaddlePaddle と Wenxin の共同最適化により、最新バージョンの Wenxin Big Model 3.5 のモデル性能が 50% 向上し、トレーニング速度が 2 倍、推論速度が 30 倍に向上しました。

ビッグモデルエコシステムに関しては、百度文信が企業、教育、コミュニティを統合したエコシステムを形成していると紹介した。最新のデータによると、Baidu は 750 万人を超える開発者ベースと 20 万人のエンタープライズ エコシステム ベースを持ち、複数のレベルで大規模な人材育成、エンタープライズ エンパワーメント、開発者運用を行っています。 Baidu はまた、ビッグモデルの創造性を奨励し、ビッグモデルのエコシステムを繁栄させるために 10 億ドルのベンチャーキャピタルファンドを設立しました。

彼女は、大規模モデルの産業化は依然として大きな課題に直面していると率直に述べ、それは次の3つの側面に要約できると述べました。第1に、大規模モデルのサイズは確かに非常に大きいため、トレーニングが困難でコストがかかります。第2に、コンピューティングパワーの規模とパフォーマンス要件が非常に大きいです。第3に、データ規模も非常に大きく、これらのデータの収集、マイニング、構築、スクリーニング、クリーニング自体が非常に大規模なプロジェクトです。 「大規模モデルプラットフォームは、高い計算能力を備えた高価なシステムです。実際には、多数の大規模モデルは必要ありません。ユーザーにとっては、アプリケーションごとに大規模モデルを開発する必要はありません。」

「100モデル戦争」の最終結果は?呉天氏は「ここ数ヶ月で、多数の新しい大型モデルが登場したが、これは段階的な現象だ。今後、さまざまな企業や機関が徐々に独自のポジショニングを見つけ、独自のセグメンテーションへと移行するだろう。最終的には、少数の大型モデルに焦点を絞るだけだが、少数の大型モデルに依存して、非常に幅広いアプリケーションエコシステムが出現するだろう」と述べた。(易成)

<<:  人工知能は防衛システムをどのように変えるのでしょうか?

>>:  AI チャットボットと自動テストの重要性

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

企業はデータセンターで人工知能を広く利用する準備ができているでしょうか?

今日、ますます多くのサーバーベンダーが、人工知能を活用したサーバー自動化テクノロジーの開発に取り組ん...

...

パーシー・リャンらによる新しい研究:新しいBingのような生成型検索エンジンはそれほど役に立たないかもしれない

生成型検索エンジンは、入力クエリとオンライン引用に対する応答を直接生成することで、ユーザーの情報ニー...

ビットコインアルゴリズム調整!世界の鉱山会社にとって採掘は困難に:利益は急激に減少

ビットコインの場合、その出力は固定されています。つまり、マイニングする人が増えれば増えるほど、マイニ...

Google CEO ピチャイが、Google 史上最強のモデル「ジェミニ」と人工知能の時代を深く分析

12月7日水曜日、米国現地時間、Googleは新世代の人工知能モデル「Gemini」をリリースした。...

コインの端を歩くこともできます!陸上最小のカニ型ロボットが開発され、将来的には低侵襲手術に利用できるようになる。

この「横歩き」マイクロロボットはとってもかわいいです!サイエンス・ロボティクス誌5月号に、サブミリメ...

国内チームが新たなRLTFフレームワークを提案し、SOTAをリフレッシュしました!大規模なモデルはバグが少なく、より高品質なコードを生成します

「プログラム合成」または「コード生成」タスクの目標は、与えられた記述に基づいて実行可能なコードを生成...

2024 年のデータ テクノロジーのトレンド: 基礎モデルと機密コンピューティング

おそらく、現代のデータ環境を形作る最大の力は、基礎となるモデルの遍在性です。これらのモデルは、外部の...

...

衝撃の2017年!この10日間は中国の人工知能の時代

2017年にはすでに「残高不足」が発生。今年、中国の人工知能開発は多くの進歩を遂げ、実りある成果を達...

YOLOの父は抗議を表明するためにCV業界を辞め、軍事やプライバシーのスヌーピングにAIアルゴリズムを使用することを拒否

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

雁塔区:西部の「最強の頭脳」が人工知能コンピューティングセンターの未来を切り開く

9月9日午前、雁塔区未来工業城で未来人工知能コンピューティングセンターの開設式が行われた。同イベント...

...

人工知能と機械学習の時代に新たなサイバー脅威にどう対抗するか

侵入テスト サービスの必要性は、システムへの攻撃が頻繁に行われるようになった 1 世紀以上にわたって...

...