テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセントは10月26日、テンセント渾源モデルが新たなアップグレードを経て、「文勝図」機能を正式に公開し、自動画像生成分野における同社の優れた能力を実証したと発表した。アップグレード後、Tencent Hunyuan Chinese の総合的な機能は GPT3.5 を超え、コーディング機能は 20% 大幅に向上し、業界をリードするレベルに達しました。

実用的な汎用ビッグモデルとして、Tencent Hunyuan Big Model は豊富で多様なアプリケーション シナリオを備えています。現在、テンセントミーティング、テンセントドキュメント、エンタープライズWeChat、テンセント広告、WeChat検索など、180を超えるテンセント社内業務がテンセントフンユアンに接続されています。最近、QQブラウザはTencent Hunyuanをベースにした「PDF閲覧アシスタント」もリリースしました。これには、インテリジェント要約、インテリジェントQ&A、マルチラウンド質問などの機能があります。

現在、小売、教育、金融、医療、メディア、交通、政府関係など、さまざまな業界の顧客がTencent Cloudを通じてTencent Hunyuan Big Model APIを利用しています。応用分野には、インテリジェントな質疑応答、コンテンツ作成、データ分析、コードアシスタントなど、さまざまなシナリオが含まれます。今年9月に最初の登録が承認されて以来、テンセント・フンユアン・モデルは徐々にCエンドユーザーに開放され、体験できるようになっています。ユーザーはミニプログラムやウェブページを通じてテンセント・フンユアンとコミュニケーションを取ることができます。

今回、テンセントが独自に開発した垂直分野向けの7Bおよび13Bモデルもデビューしました。これらは同じ効果を達成するために必要なトークンが少なく、トレーニング効率も高くなっています。このモデルの実際の中国語と英語の結果は、一般的に国内外のオープンソース モデルよりも優れています。より高いコスト効率と効率でアプリケーションの実装をサポートし、さまざまな垂直シナリオとビジネス ニーズを満たし、テンセントが大規模なモデルを完全に採用するのに役立ちます。

テンセントは、モデルアルゴリズムから機械学習フレームワーク、AIインフラストラクチャに至るまで、フルリンクの自社開発技術を習得しており、大規模モデルの迅速な反復に好ましい条件を提供していると理解されています。テンセントの渾源モデルは、初公開以来、加速的なアップグレードの軌道に乗り始めた。独自開発のアルゴリズムのサポートにより、モデルの安定性と信頼性が着実に向上しました。

テンセントの渾源文勝図が衝撃的な登場を果たし、広告シーンでの応用効果が明らかになった

ヴィンセントグラフは、AIGC 分野の中核技術の 1 つであり、一般的な大規模モデルの機能の試金石でもあります。モデル アルゴリズム、トレーニング プラットフォーム、コンピューティング設備に対する要件が厳しいです。

テンセントは、広告シナリオで AI を使用した画像の自動生成を研究した最初の企業であり、その過程で深い研究開発能力を蓄積してきました。報道によると、テンセント・フンユアンの文生図アプリケーションは、他の大型モデルと比較して、肖像リアリティとシーンリアリティにおいて明らかな優位性があり、同時に、中国の風景、アニメ、ゲームシーンの生成においても優れた性能を発揮する。

テンセント・フンユアンは、業界では難しいと認識されている顔写真生成においても満足のいく結果を達成した。たとえば、プロンプトワードが「綿のドレスを着て、目が大きく、古代中国、写真風、漢服を着たかわいいアジアの4歳の女の子を生成」の場合、Tencent Hunyuan モデルは以下を生成します。

テンセントの渾源モデルは「綿服」や「漢服」などのプロンプトワードに言及された内容をよく理解していることがわかります。同時に、スタイルの面では、建築や風景の背景を通じて「古代中国」のスタイル要求も表現しています。

別の例では、「都市のCBDオフィスビル、モダンなデザイン、高層ビル、ガラスカーテンウォール、クローズアップショット、写真スタイル、写真写真」というプロンプトワードを入力し、Tencent Hunyuan Modelは次の作品を制作しました。

もっと簡単にするために、「船は水墨画風に何千もの山々を通過しました」というプロンプトを入力すると、次の画像が表示されます。

大規模モデルのテキスト グラフィックスの難しさは、プロンプト ワードの意味理解、生成されたコンテンツの合理性、生成された画像の効果にあります。これら 3 つの技術的困難に対応するため、テンセントは特別な技術研究を実施し、生成された画像の可用性と品質を確保するための一連の独自のアルゴリズムを提案しました。

意味理解の面では、Tencent Hunyuan は中国語と英語のきめ細かいバイリンガル モデルを採用しています。このモデルは、中国語と英語を同時にモデル化してバイリンガル理解を実現し、最適化アルゴリズムを通じてモデルの詳細認識と生成効果を向上させ、多文化の違いによる誤解を効果的に回避します。

コンテンツの合理性という点では、AI が生成した人体の構造や手は変形しがちです。渾源文勝図は、アルゴリズム モデルの画像の 2 次元空間位置を認識する能力を強化し、人間の骨格や手の構造などの事前情報を生成プロセスに導入することで、生成される画像構造をより合理的なものにし、エラー率を低減します。

画像のテクスチャに関しては、Hunyuan Wenshengtu はマルチモデル融合の方法に基づいて生成されたテクスチャを改善します。モデルアルゴリズムの最適化後、髪の毛やしわなどの詳細を含む渾源文生図のポートレートモデルは30%改善され、草、木、波紋などの詳細を含むシーンモデルは25%改善されました。

プロンプト: 写真を生成してください: 桂林の漓江の風景、川に小さなボートがある

「実践から生まれ、実践へ」という大型モデルとして、テンセント・フンユアン・ウェンシェントゥの能力は、素材作成、製品合成、ゲームグラフィックスなど多くの業務に活用されています。また、広告業務における複数回の評価において、テンセント・フンユアン・ウェンシェントゥの事例優秀率と広告主採用率はそれぞれ86%と26%に達し、いずれも同様のモデルを上回りました。

Tencent は業界をリードするコーディング能力を備えており、すでに大規模なモデルを使用して社内でコードを「記述」しています。

過去 1 か月で、テンセントの Hunyuan モデルのすべての機能がアップグレードされただけでなく、コーディング機能と数学機能も大幅に向上しました。 32の主流言語のコードファイル、さまざまなコンピュータ書籍やブログを研究し、トレーニングした結果、テンセントのHunyuanコード処理レベルは20%以上向上し、コード処理効果はChatGPTより6.34%優れています。また、HumanEval公開テストセット指標の面でも、Starcoder、Codellamaなどの業界をリードするオープンソースコードモデルを上回りました。

「フロントエンド言語を使用してスネーク ゲームの実装を手伝ってください」などの簡単なコマンドを入力するだけで、Tencent Hunyuan は実行可能コードを自動的に生成し、スネーク ゲームをすばやく作成します。さらに、Tencent Hunyuan は Python、C++、Java、Javascript など複数の言語でのコマンド生成もサポートしています。たとえば、「Python を使用して赤いハート型の線を描画する」と入力すると、Tencent Hunyuan はコードライブラリの選択、コマンドのインストール、コードの描画など、具体的な操作手順をガイドします。

プロンプト: Pythonを使用して赤いハート型の線を描きます

Tencent は現在、Tencent Hunyuan モデルに接続された複数の開発プラットフォームを持っています。エンジニアは Tencent Hunyuan を使用して、コード生成、コード補完、コード脆弱性の検出と修復、テーブル データ処理、データベース クエリなどのタスクを実行できます。

たとえば、IDE プログラミング シナリオでは、Tencent Copilot は、混合要素の大規模モデルに接続することで、コメントに基づいて対応するコードを生成したり、コンテキストに基づいてコードをインテリジェントに補完したりできるため、プログラミング効率が大幅に向上します。 Hunyuan 大規模モデルは、ソフトウェア開発プロセス中にセキュリティを確保するために、コードの脆弱性を検出して修復するのにも役立ちます。

テンセントのHunyuanモデルの継続的なアップグレードは、テンセントが自社開発したワンストップ機械学習プラットフォームであるAngelのサポートと切り離せないものです。自社開発の AngelPTM トレーニング フレームワークは、業界をリードするメモリ使用率とトレーニング スループット効率を備え、効率的な分散トレーニング ソリューションを提供できます。トレーニング速度は業界の主流フレームワークよりも 1 倍高速です。自社開発の AngelHCF トレーニング フレームワークは、蒸留、微調整、圧縮からモデル加速まで完全な機能を備え、複数のモデルを並列でサポートし、モデルの展開を最小限に抑えてスループットを最大化し、推論速度は業界の主流フレームワーク FasterTransformer よりも 1.3 倍高速です。

テンセントは2021年以来、数千億、数兆のパラメータを持つNLPスパース大規模モデルを相次いでリリースし、CLUEリストの3大記録を破り、中国語理解能力の新たな飛躍的進歩を達成しました。 2023年9月のHunyuan Big Modelの発売は、テンセントのビッグモデルの理解と生成チャネルの統合を表しています。文勝図機能の登場により、テンセントの渾源モデルは画像処理機能を追加し、モダリティがさらに充実しました。

大規模モデルのマルチモーダルインタラクション機能は、汎用人工知能を実現する唯一の方法であると考えられており、大規模モデルの能力象限を継続的に拡大するための重要な方向性でもあります。報道によると、テンセントのHunyuan Big Modelは画像、動画、音声などさまざまなモダリティの処理能力を継続的に強化しており、その成果はまもなく外部に公開される予定だという。

<<:  快手は快易のビッグモデルの助けを借りてコメントエリアでのインテリジェントな返信を実現する「AI小快」をテスト中

>>:  何をするにしても使い始めるべき 7 つの超便利な AI ツール

ブログ    
ブログ    

推薦する

Giskard: AI モデル向けのオープンソース品質管理

翻訳者 |ブガッティレビュー | Chonglou実稼働環境で AI モデルの品質を確保することは複...

クラウドネットワークとAIに焦点を当てると、3大通信事業者の財務報告はどのようなことを明らかにするのでしょうか。

少し前に、中国移動、中国聯通、中国電信の3大通信事業者が2023年第2四半期の財務報告書を発表しまし...

顔認識ブームを冷静に考える:倫理的・道徳的問題は熟考する価値がある

[[354407]]科技日報は11月27日、顔認識システムが都市に多くの利便性をもたらしたと報じた。...

...

マイクロソフトは、Bingチャットのベテラン向けにエキスパートモードの導入を検討中:より複雑なUIとより豊富な機能

7月26日、マイクロソフト広告およびウェブサービスのCEOであるミハイル・パラキン氏は、ネットユーザ...

...

...

機械学習がシステム設計に与える影響: 学習したインデックス構造の簡単な分析

顔認識からチェックイン、さまざまなアプリケーションの「あなたの好きなものを推測」まで、現在の機械学習...

Amazon Lexについて

Amazon Lex は、音声とテキストを使用してあらゆるアプリケーションに会話型インターフェースを...

手動設計は不要、検索損失関数をゼロから作成

[[390709]]近年、自動機械学習(AutoML)は、モデル構造やトレーニング戦略など、多くのデ...

ファッション業界に人工知能を応用するには、もう少し想像力が必要かもしれない

[[343916]]現在、ファッション業界における人工知能(AI)技術の応用範囲は、依然としてプロセ...

AIと行動科学がワクチン接種への躊躇にどう対処できるか

Fractal Analytics の共同創設者 Ram Prasad 氏は、AI が問題領域の特定...

Google は、MLM 損失で直接事前トレーニングされた 24 個の小さな BERT モデルをリリースしました。

[[318598]] Google は最近、24 個の合理化された BERT モデルをダウンロード...

Microsoft の 38 TB の内部データが漏洩!秘密鍵と3万件以上の仕事上の会話が漏洩、その背後にある理由は衝撃的

何か大きなことが起こりました!数か月前、マイクロソフトの AI 研究チームは、大量のオープンソースの...

李開復、胡宇、張亜琴の GMIC 2018 対談: AI 戦略と AI 人材育成における中国と米国の違いは何ですか?

[[227402]]人工知能が急成長を遂げている現在、AI人材の不足は中国だけでなく、世界全体が直...