中関村科学技術の張傑氏との対話:大規模モデルを実装するには従うべき「テクニック」がある

中関村科学技術の張傑氏との対話:大規模モデルを実装するには従うべき「テクニック」がある

ゲスト | 張潔

インタビュー | 張小南

編集者 | 徐潔成

制作:51CTO テクノロジースタック(WeChat ID:blog)

「2018年、Transformerの事前トレーニング済みモデルの登場により、自然言語処理(NLP)の学界で主流の見解が形成されました。テキスト分類、テキストマッチング、シーケンスラベル付けなど、NLP分野のさまざまな技術的方向性は、最終的にはテキスト生成という中核タスクに帰属することになります。」これは、インタビューの冒頭で中関村科金科技副社長の張潔氏が述べた重要な洞察です。

中関村科金は、会話型 AI テクノロジー ソリューションの大手プロバイダーとして、2014 年の設立以来、生成型 AI テクノロジーに注力し、エンタープライズ サービス トラックにおける会話型シナリオ サービスの提供に特化しています。過去数年間、当社はAIテクノロジースタックの包括的なレイアウトに基づいて、デジタルインサイトとマーケティング、デジタルサービスと運用、デジタル「インテリジェント」ベースという3つの主要な製品マトリックスを順次構築してきました。

ChatGPTがビッグモデルブームに火をつけた後、AI技術の蓄積が深い中関村科金も初めてビッグモデルを全面的に採用することを選択し、2023年11月に国内初の企業知識ビッグモデル、AgentGraphアプリケーション開発プラットフォーム、AIGCアプリケーションの「スーパー従業員」シリーズを正式にリリースし、中国におけるビッグモデル応用分野の先駆者の1つになりました。

今回のT·TALKインタビューコラムでは、中関村科金科技副社長の張傑氏を特別にお招きしました。この対談を通じて、経験豊富な技術者のAI産業の発展に対する理解と判断、そして大手インテリジェントテクノロジー企業である中関村科金が大規模モデル技術と応用の分野で蓄積してきた貴重な経験をご理解いただければ幸いです。

1. 大規模モデル実装のエントリポイント

張傑氏によると、これまで業界では会話型AIは一般的に企業と顧客とのコミュニケーションの架け橋とみなされていた。特にデジタル変革の文脈では、この架け橋の主な機能は、コミュニケーションの効率とユーザーエクスペリエンスの向上にあると考えられていた。

しかし、ビッグモデル技術の普及に伴い、業界では会話型AIの大きな可能性に徐々に気づき始めています。「中関村科金を例に挙げましょう。私たちは現在、ビッグモデルが提供する理解力と生成力を備えた会話型AIは、会話プロセス中に企業の知識を抽出することで、企業の知識管理、さらには企業のグループインテリジェンスへの入り口にまでアップグレードできると考えています。」

したがって、張潔氏の意見では、大規模モデルの実装のきっかけを作るのに非常に適した現在のエントリ ポイントは、企業向けの知識に関する質問と回答のシナリオです。従来の企業ナレッジベースには、整理やクエリに適さない大量のさまざまなドキュメントが含まれていますが、今では、このナレッジ情報をビッグモデルに渡して処理するだけで、対話を通じて重要な情報を直接取得できます。

これにより、コスト面でのメリットがもたらされるだけでなく、企業は文書に印を付けたり整理したりするために多数の人員を必要としなくなります。さらに、大規模モデルの制御に基づいて、生成された知識情報はコンプライアンスと制御性の点でより優れたパフォーマンスを発揮します。さらに重要なのは、エンタープライズ ナレッジ ミドル プラットフォームは孤立したシナリオではないということです。社内の従業員に権限を与えるだけでなく、マーケティングやカスタマー サービスなど、外部の顧客とのつながりを築くために想像力を働かせる余地も大きくあります。

現在、中関村科金AIGCアプリケーションナレッジアシスタントは、大手証券会社を含む銀行、証券、資産管理などの複数の業界のクライアントにサービスを提供しています。証券業界の実務では、大規模なモデルコンテンツ生成機能に基づいて、さまざまな顧客段階のアカウントマネージャー向けに多様な顧客マーケティングスクリプトが生成されます。マーケティングコピーの作成時間は10分から10秒に短縮され、アカウントマネージャーのビジネス開発を効率的に支援し、顧客サービスにおけるアカウントマネージャーの専門性を向上させます。資産管理業界の実践において、当社はインテリジェントな顧客サービス製品を強化し、顧客サービスシステムの質疑応答の意図認識と応答精度を大幅に向上させ、システム運用作業を70%以上削減し、企業がよりスマートで低コストの顧客サービスを実現できるよう支援します。

「2022年にChatGPTがリリースされて以来、ビッグモデルは学術界から友人の輪へと輪を突破しました。2023年はビッグモデルの氷を砕く段階です。基本的なビッグモデルと現場のビッグモデルメーカーはどちらもパイロットアプリケーションシナリオを積極的に模索しています。そして2024年はビッグモデルのアプリケーションが登場し、さまざまなビジネスシナリオがビッグモデルを採用することを選択する年になる可能性が高いです。」と張潔は述べた。

2. モデルと知識の有機的な組み合わせ

中関村科金は、国内有数の会話型 AI テクノロジー ソリューション プロバイダーとして、長年の事業を通じてエンタープライズ レベルの顧客サービスにおける豊富な経験を蓄積してきました。企業のデジタル変革の過程において、張傑氏は、大型モデルの普及前であろうと後であろうと、製品に対する顧客の態度は、十分に斬新か十分に実用的かの2種類に過ぎないと結論付けた。

したがって、一般的なビッグモデルは、現在のエンタープライズ サービスに対する統一されたソリューションにはなり得ません。一般的な大型モデルは汎用性を重視しています。たとえモデルが強力な総合力を持っていたとしても、「一般的なものは使いやすくなく、使いやすいものは汎用的ではない」という法則に依然として直面しています。したがって、企業のさまざまなビジネス シーンで特定の問題を解決したい場合は、新たな突破口を見つける必要があります。

中関村科金は、ビッグモデル技術の総合的な評価に基づき、「ビッグモデル+ドメイン知識」の発展の道を模索し、ドメインビッグモデルに基づく企業知識ビッグモデルを提案した。多くの知識集約型企業では、モデルに幻覚の問題が発生することを許容しないため、特定のドメイン知識と言語モデルを有機的に組み合わせる必要があります。

エンタープライズ ナレッジ ビッグ モデルは、「エンタープライズ ナレッジ ブレイン」の構築に役立ちます。例えば、製造業では、特定の企業の各部の詳細データを記憶するためのドメインモデルをトレーニングする必要はなく、情報を企業知識ベースに保存するだけで、企業知識モデルが情報をマイニングして読み取り、ユーザーが必要とする知識ポイントをフィルタリングします。

張傑氏は次のように語っています。「エンタープライズ ナレッジ ビッグ モデルは特定の分野に限定されません。さまざまな構造のデータ ソースを処理し、非構造化ナレッジをビッグ モデルが迅速に検索できるナレッジ ベースに変換するために使用されます。ドメイン特性がないため、さまざまな業界のさまざまなビジネス シナリオでより幅広く使用することもできます。」

3. ソフトウェアエンジニアリングの新しいパラダイム

張傑氏によると、企業向けAIの応用シナリオが拡大し続けるにつれて、ビジネス部門で多くの応用アイデアが生まれるようになる。技術部門にすべてのタスクを任せてゆっくりとプロジェクトを立ち上げて開発するのではなく、アイデアを迅速に検証できる、よりシンプルで効率的な研究開発プラットフォームが必要だという。

多様な製品システムと完全な製品マトリックスを持つ中関​​村科金のような企業にとって、大規模モデルアプリケーション開発プラットフォームは、デリバリー担当者が製品の研究開発と反復の効率を改善し、コストを削減するのに役立ちます。そのため、中関村科金は、企業知識ビッグモデルの立ち上げと同時に、AgentGraphアプリケーション開発プラットフォームを立ち上げました。

「エージェントベースのアプリケーション開発プラットフォームは大きなトレンドとなり、ソフトウェアエンジニアリングに新たなパラダイムをもたらす可能性があります。」ソフトウェアエンジニアリング2.0の時代では、データ形式を手動で事前に定義する必要がありますが、ビッグモデルの時代では、モデルによるマルチモーダルデータの理解に基づいて、事前定義されたデータ構造の長年の伝統は必ず覆されるでしょう。

張傑氏はまた、AgentGraph アプリケーション開発プラットフォームの機能について次のように紹介しました。「AgentGraph プラットフォームは 2 つのレイヤーに分かれています。最下層はアトミック機能で、シナリオ コンポーネントには大量の業界ノウハウがカプセル化されています。上層は、ドラッグ アンド ドロップで実現できるゼロ コード プロセス オーケストレーション キャンバスを採用しています。モデル機能とアプリケーション シナリオを低コストでリンクできることが、AgentGraph の核となる利点です。」

張傑氏は次のように述べた。「私たちは、AgentGraph を通じてエコロジカルな開発プラットフォームを構築し、アルゴリズム エンジニアや IT 担当者にアプリケーション開発の権限を開放したいと考えています。ビジネス エキスパートは、ローコードとドラッグ アンド ドロップ方式で基盤となる AI 機能をすばやく呼び出し、シナリオ アプリケーションを実装できます。」

4. 製品革命

それがテクノロジーやツールの進化であろうと、最終的に影響を与えるのは製品の反復と革新です。従来の基本的な AI 技術と比較して、大規模モデルはより強力な言語理解機能を提供できます。つまり、大規模モデルの強化により、従来の AI 製品の機能範囲が質的に飛躍的に向上することになります。

たとえば、一部の顧客サービス品質検査シナリオでは、従来の方法ではキーワード認識を使用して、機密コンテンツや不適切な単語やフレーズが含まれているかどうかを判断します。ビッグモデルの言語理解能力と、ビッグモデルに基づいて構築された品質検査システムを活用することで、センシティブな言葉は含まれていなくても、暴言や違法行為を伴うコンテンツも正確に識別して捕捉できるようになります。

また、私たちがよく知るマーケティングの分野でも同様のことが言えます。もともと、アウトバウンド マーケティング コールでは、事前に製品スクリプトと会話の SOP を設定する必要がありました。しかし、そのような SOP があっても、顧客のさまざまな状態をすべて列挙することは不可能でした。たとえば、顧客が運転中や会議中の場合はどうすればよいかなど、従来のマーケティング システムではこれに対処するのは困難です。基本的に人間の営業担当者のレベルに到達するには、大規模なモデルにパフォーマンスを向上させる音声技術をいくつかトレーニングするだけで十分です。

現在、中関村科金が推進している主要な製品アプリケーションの 1 つは、マーケティング、顧客サービス、管理、財務など、さまざまなビジネス シナリオに対応できる仮想従業員アシスタントです。さまざまなビジネス シナリオの仮想従業員はすべて、同じ一連の技術パスから派生しています。つまり、基礎となる機能は、情報の抽出、テキストの理解、コンテンツの生成をサポートする大規模なモデルと AI アトミック機能から生まれています。

企業が最も懸念する大規模モデルの実装コストとセキュリティの問題について、張潔氏は自身の見解と中関村科金が現在提案している解決策についてもいくつかまとめました。企業内で非公開に展開する場合、多くのシナリオでは大きすぎるサイズの大規模なモデルは必要なく、基本モデルを 0 から 1 までトレーニングする必要もありません。多くの場合、数百億から数千億のパラメータを持つ小さなモデルで特定の問題を解決できます。さらに、クラウド サービスを適用することで、大規模なモデルを展開してトレーニングするための全体的なコストはそれほど高くありません。

セキュリティの面では、中​​関村科金は、データクリーニング、プライバシーの脱感作、コンプライアンストレーニング、エンジニアリング制約リマインダー、従来のコンプライアンス品質検査を含む5層のセキュリティ保護を採用した新しいセキュリティシステムを提案し、大規模モデルと大規模モデルに基づいて構築された一連のアプリケーションが錯覚の問題を可能な限り排除できるようにします。

5. 大規模モデルの応用

「技術とアプリケーションが成熟するにつれて、ビッグモデルの応用シナリオは多様化し、金融、製造、政府関係など知識集約型産業が最初にビッグモデルの実装拠点となる可能性が高い」と張潔氏はビッグモデル分野の今後の発展動向に関する質問に答える際にこのように判断した。

金融業界には、大規模なモデル適用シナリオが数多くあります。これは、金融業界が強力なデジタル基盤を備えており、小さな進歩でも測定可能な利益をもたらすことができるからです。銀行、保険、証券などの業界におけるマーケティング、サービス、その他のビジネス シナリオでは、ビッグ モデルによってビジネス担当者の能力を大いに高めることができます。

また、製造業や政府関係などの分野はまだデジタル化の過程にあるものの、共通しているのは業界内に膨大な情報が存在することです。ビッグモデルを使用してこれらの断片的な知識を収集して記憶し、必要に応じて関連する担当者に権限を与えることで、さまざまなシナリオでビジネス担当者の作業効率を大幅に向上させることができます。

張傑氏は「どんな技術にも、最先端のブレークスルーからエンジニアリング、製品パイロット、大規模実装までのライフサイクルがある。現在、大規模モデル技術は非常に人気がある。応用プロセスで蓄積するには時間がかかるだろうが、この分野は今後3~5年でチャンスに満ちているだろう」と強調した。

<<:  マスク氏はテスラ向けにChatGPTをカスタマイズする予定

>>:  Google の大きな動き!検索結果からAIが生成したスパムをクリーンアップします

ブログ    
ブログ    

推薦する

Google が新モデル EfficientNet をオープンソース化: 画像認識効率が 10 倍に向上、パラメータが 88% 削減

畳み込みニューラル ネットワークは通常、限られたリソースで開発され、その後、条件が許せば、より高い精...

TensorFlow を使用した ML モデルの実装と最適化: 1 秒あたり 3 億回の予測

[[425184]] TensorFlow は最も広く使用されている機械学習フレームワークの 1 つ...

C# はデジタル変換のための中国語アルゴリズムを記述します

C# はデジタル変換のための中国語アルゴリズムを記述します最近、プロジェクト上の理由により、C# で...

ChatGPTを使用して、書類手続き全体を迅速に完了します

1. 論文のテーマに関する詳細な議論質の高いトピック選択は、トップクラスのジャーナルに論文を掲載する...

LK99最新ニュース:完全停止の難しさ、韓国の著者は「超伝導が唯一の可能な説明」と述べ、インドチームは3回の失敗で断念

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

貪欲アルゴリズム: バイナリツリーを監視したい!

[[361051]]バイナリツリーの問題の監視アドレス: https://leetcode-cn....

私たちは人工知能によってどのように制御されているのでしょうか?

1970 年 11 月のライフ誌のインタビューで、ミンスキーは次のように警告しました。「コンピュー...

ビジネスアナリストにとってAIが意味するもの

[[275322]]今日では、人工知能はもはや流行語ではなく、多くの環境ビジネスアナリストやその他の...

AIコミック: 人工知能の3つの主要分野とその産業応用について1つの記事で学ぶ

音声認識 「音声認識」は、私たちが日常生活で使える iPhone の Siri など、コンピューター...

幼稚園のAI教材を公開!プログラミング学習は幼稚園から始まる

AIの学習は幼稚園から始まる最近、インターネット上で「人工知能実験教科書」の写真が流通している。この...

AI大学院生は年間50万元を稼ぐことができるが、彼らの給料は学校を卒業する前からすでに奪われている。

先週末、人工知能が素晴らしい動きを披露した。ボストン・ダイナミクスのロボット「アトラス」は完璧なバク...

売上高2,684億元の背後にあるアリババのAI技術の全貌

先日終了した双十一では、天猫の取引額は2,684億元に達し、前年比25.7%増加した。この成果の裏に...

米国は中国のハイテク製品を全面的に禁止する「2021年戦略競争法」を提案した。

米国の民主党と共和党は常に深刻な対立関係にあるが、両党は中国との対決という一つの問題において稀な一致...

...