周明氏との対話: ラストマイルを解決するために大きなモデルを使用するときは、理想主義にならないでください。

周明氏との対話: ラストマイルを解決するために大きなモデルを使用するときは、理想主義にならないでください。

ゲスト | 周明

執筆者 | Yun Zhao

ある夜、湘源の湧き水が、広大で無限に湧き出しました。 ChatGPT は一夜にして、世界中のイノベーションへの情熱に火をつけました。大きな期待が寄せられているこの新しいエンジンは、サーキット上の多くのプレーヤーにとって重要な焦点となっています。

線路脇から遠くから「観る」だけでは、轟音だけが聞こえて、その本当の魅力を探求することはできません。諺にもあるように、「竜の群れは上流に向かって航行しながら非常に恐れていたため、それが実はムーランの船だとは気づかなかった」。何千もの帆の背後で、トレンドセッターたちはどのようにしてこの巨大モデルをコントロールしているのだろうか?課題と機会は何でしょうか?実際の使用シナリオで何千もの業界を実装し、強化するにはどうすればよいでしょうか?

これを踏まえ、私たちは実用的な姿勢で、「ビッグモデル強国」蘭州科技の創設者兼CEO、中国コンピューター協会(CCF)副会長、イノベーションワークスの主任科学者である周明氏にインタビューする機会を得ました。

周明教授といえば、AI分野の人なら誰でも知っています。彼は世界的に著名な科学者であり、Microsoft Research Asia で 21 年間の勤務を終えた後、Kai-Fu Lee の Innovation Works に加わり、Lanzhou Technology を育成し、大型モデルの分野に専念するテクノロジー「メーカー」になりました。

1. 大きなモデルは難しいが重要なもの

海外で新しいものや技術が登場すると、中国の人々がそれを試そうとするのは珍しいことではありません。人気のため、チャレンジのため、あるいは自己娯楽のためなど、大企業、スタートアップチーム、さらには多くの政府研究機関、さらには一般ユーザーを含む多くのチームが参加しています。

これは中国が新技術と自動運転能力を追求していることを示すものであり、それ自体は良いことだ。しかし、周明氏はここではバブル問題に注意を払うべきだと述べた。良くも悪くもないモデルを改良するために多大な労力を費やすことは、確かに自分自身のための学習プロセスではありますが、社会に直接役立つとは限りません。これを起業に使うと、多くの起業資本と投資を無駄にしてしまう可能性があります。

「誰もが自分の能力に応じて異なる道を選ぶべきです」周明氏の考えでは、正しい答えは、できることをやり、自分に合ったものを選ぶことだ。たとえば、トラックは C と B だけではなく、Developer へのトラックもある場合があります。会社やチームによって遺伝子は異なります。自分の遺伝子に基づいて異なるトラックを選択し、会社と自分に合った成長の道を切り開いてください。

状況を判断する必要があります。時には、ある程度諦めて次の新しい機会を探さなければならないこともあります。しかし、どんなことがあっても、心は常に新鮮な思考を持ち、自発性と内省を維持し、あらゆる批判を受け入れ、絶えず自分自身を調整し、少しずつ自分の発展に適した方向に戻らなければなりません。

2. BとCのどちらを選ぶか

ビッグモデルの時代を迎え、商品・サービスの選択においては、BエンドとCエンドのどちらに重点を置くべきでしょうか?これは、参入者を悩ませる大きな問題です。

「B と C では、モデル、コンピューティング能力、R&D の焦点に対する要件が異なります」と Zhou Ming 氏は説明した。

それに比べると、C 製品は大変難しいと彼は考えています。 OpenAIと競争したいなら、非常に強力なAGI能力が必要です。ハードウェアの面では、1、2千元のカードでは少なすぎるかもしれません。5、1万元のカードがなければ、高い競争力を発揮できません。さらに、難易度は「数千の軍隊が一枚の板の橋を渡る」のに匹敵します。ただやるだけでは十分ではなく、他の人よりも優れた成果を上げなければなりません。他の人も進歩しています。したがって、C エンド製品は、実際には軍拡競争のプロセスです。

しかし、to B は異なります。to B では主にユーザーの言語理解と複数ラウンドの会話能力をテストするため、数百億から数千億のモデルをトレーニングするだけで十分である可能性があります。周明氏はさらに、500元程度のカードでも数百億から数千億に及ぶ大規模なモデルを十分にサポートできることを明らかにした。

一方、B2B製品に対する企業の需要は比較的安定しています。現時点では、大きなモデル自体に焦点が当てられているのではなく、それを企業や業界とどのように統合するかが焦点となっています。成功か失敗かは、ラストマイルにかかっています。

そのため、Bエンド製品のコンピューティングパワー需要の減速は、Cエンド製品とはまったく異なるイノベーションプロセスであり、業界データの構築に多くのエネルギーを費やすことができ、顧客と協力してラストマイルとラストシナリオで良い仕事をすることができ、それによって対応する堀を築くことができます。

3. 産業実装のための基本モデルはハードパワーである

先日終了したWOT世界技術革新会議で、周明氏は「三層大型モデル産業サービスシステム」を提案した。孟子モデルは蘭州のベースモデル、つまりL1モデルであり、業界モデルL2と将来のシーン機能のエンジンL3の基礎でもあります。「私たちはそれを非常に重視しており、ユーザーからのより貴重な提案を歓迎します!」と周明は言いました。

周明氏は、「孟子モデル自体の機能をさらに向上させる必要がある。基本的な機能は問題ないが、まだいくつか問題がある」と認めた。

こうした問題には多くの理由があります。一方で、データをさらに充実させる必要があります。 2 つ目は、将来的にモデルのサイズをさらに拡大する可能性があります。たとえば、現在は 100 億のモデルがありますが、将来的には 300 億や 500 億のモデルを実現できる可能性があります。しかし、企業ユーザーは兆ドルモデルを使用できないこと、推論が遅いこと、コストが高すぎることなどの理由から、兆ドルモデルの開発には慎重です。

私たちの場合、オープンソース モデルのトレーニングには約 1 億人民元のコストがかかります。これは、大規模なモデル チームであれば、非常に慎重にならなければならないことです。

このベースモデルの次のステップについて、周明氏は「孟子」モデルのデータは今後さらに強化され、トレーニング方法もさらに改善されることを提案した。さらに、いくつかの特定の機能とアルゴリズムをさらに統合および改善する必要があり、いくつかの新機能の強化も含まれるため、これが次に検討すべき事項です。

4. シーンに移動してユーザー向けにカスタマイズする

大規模モデルが一般使用から産業界、そしてシナリオへと移行するには、まだ長い道のりがあります。 「大きなモデルを作成し、ユーザーが自由に呼び出せるようにする」ことで、特定の種類の問題を解決するのは理想的ではありません。 ChatGPTでもそれはできません。 ChatGPT を日常生活で「チャット」や「楽しみを見る」ために使用するのは問題ありませんが、ChatGPT に実際の作業を「実行」させると、多くの問題があることがわかります。一般から業界、そしてシナリオへとアイデアをたどり、一歩ずつ前進する必要があります。

次に、すでに業界モデルがある場合、シナリオモデルをどのように作成すればよいでしょうか?

まず、シーンが何であるかを知る必要があります。大きなモデルを構築するチームの多くは、自分たちが何をしようとしているのかわかっていません。たとえば、金融の場合、金融を理解していなければ、金融業界の大きなモデルで何ができるのか全くわかりません。そこで、私たちは華夏基金と共同研究室を設立し、金融業界の人々が日々何を気にしているかを理解しようとしています。彼らが気にしているのは、投資調査、投資コンサルティング、リスク管理、情報抽出、検索、世論分析などです。 「これまでにも誰かがこれをやったことがあるの?どんな問題があったの?」これまで非常に成熟していると考えられていた技術でも、特定の分野に適用すると、実はまだ多くの未解決の問題を抱えていることがわかります。

しかし、これらの「割るのが難しいナッツ」は割るのが難しいのです。周明氏は、実は金融業界にはビッグモデルやAIを理解する人を含め、多くの科学技術人材がおり、多くの経験を積んでいると述べた。金融業界に必要な機能がわかったら、振り返って、既存のビッグモデルがこの業界に必要な機能をサポートできるかどうかを検討してください。表面的に試すだけではうまくいかず、一般的なビッグモデルよりも効果が悪い場合もあります。このとき、他の人と協力して行う必要があります。

次に、これらを理解した上で、データを準備します。大規模な業界モデルの機能を強化するための生データ、あらゆるシナリオでタスクを実行するためのラベル付きデータ、またはプロンプトを記述した後にプロンプ​​トが機能しないことがあり、微調整が必​​要になる場合があります。この作業はすべて、ユーザーのシナリオを理解し、適切な手順を実行し、ユーザーの問題を解決することに基づいた一連の重要なアクションです。周明氏は、蘭州は金融機関と長い間協力し、豊富な経験と教訓を蓄積しており、これについて非常に明確な認識を持っていると述べた。

業界のシナリオに関しては、大規模なモデルには検討すべき価値がたくさんあります。ここで、周明氏はロボットが「具体的な知能」を獲得するのを支援するホテルのシナリオの例を示しました。ホテルには、固有のシナリオ、内部マップ、環境があります。特定の問題が発生した場合、ホテルロボットが実行する必要がある手順は最初に手動で記述され、対話モデルを使用して各手順が完了したかどうかを確認できます。エラーが検出されると、対話モデルはロボットに間違いがあったことを思い出させます。これは、物事をより良く行うようにロボットを誘導することと同じです。ロボットがより賢くなると、次に同じような状況に遭遇したときには、よりうまく対処できるようになります。

5. ラストマイルを解決するのに理想主義は必要ない

一般的なモデルからシナリオ モデルまで、さまざまなレベルのチームにはさまざまな機能要件があります。周明氏は蘭州チームに2つの側面から要件を与えた。蘭州チームでは、L1(一般大モデル)の人は「オタク」と理解できます。業界を理解していなくても大丈夫ですが、データのマイニング場所、クリーニング方法、強化学習の方法など、モデルを洗練させる方法、評価の方法、モデルの変更方法、モデルの調整方法などを知っておく必要があります。

第2層L2(業界モデル)に関しては、業界を理解する必要があります。これらの人々のほとんどは人工知能のバックグラウンドを持っていますが、彼らはどのようにして業界を理解できるのでしょうか?理解できないなら、理解できる人を探せばいい。社内に理解できる人がいなければ、外部からコンサルタントを雇うこともできる。そうしないと、ただ盲目的にやることになる。

業界モデルを作成する場合、理想主義的であってはなりません。業界のデータを掘り起こして大きなモデルを組み立て、それが業界の大きなモデルになるというだけではありません。このアプローチは非常に骨抜きになっており、場合によっては一般的なモデルよりもさらに悪いこともあります。そのためには、私たちのチームが顧客を理解し、顧客に寄り添い、最後の最後まで良い仕事をする必要があります。

したがって、これは彼らの概念、アイデア、作業方法に新たな変化をもたらすでしょう。

6. 将来的には、大規模モデルが複数のエコシステムを形成する

今後、国内ベーシックモデルはどのようなパターンになるのでしょうか?周明氏は、現時点では判断を下すのは時期尚早だと考えている。中国全体に必要なのは 1 つの基本モデルだけであると考える人もいます。 「第一に、技術力、名声、コンプライアンスやセキュリティの面で、そのような企業や企業はまだ存在しないかもしれない。第二に、市場競争のため、巨大企業が他社のエコシステムを利用することはほとんどない」と彼は述べた。

周明氏は、国内の基本モデルのエコシステムは複数存在し、各エコシステムには少なくとも 1 つのモデルが存在すると考えています。一方、B2B分野だけでも、さまざまなエコシステムが発展する余地は十分にあります。 B は広大な海のようなもので、あらゆる流れの中で魚が自由に泳ぎ、快適な生活を送ることができます。 B2Bには、顧客・業界の理解、顧客とある意味での大規模モデルチームとの戦略的パートナーシップの形成、障壁の形成など、いわゆるデータフライホイールや機能フライホイールの形成など、新たな起業機会が数多く存在します。

B2B 分野では、大きなモデルに深く入っていくほど、対応する障壁が高くなります。一見強力な企業も含め、他のどの企業も同様の努力をしなければなりませんが、それは実際には簡単なことではありません。 Microsoft が OpenAI と協力して、あらゆるサブ産業、あらゆる特定のタスク、あらゆるシナリオで優れた成果を上げることは不可能です。まず、それほど強力な能力はなく、人員も限られています。第二に、そうする必要はありません。エコシステムを構築しており、上流と下流にビジネスがあります。そうして初めてエコシステム全体が繁栄し、その恩恵を受けることができます。

そのため、周明氏は、モバイルインターネットを含むインターネットの過去の発展の歴史を考えると、このビッグモデルの時代には、誰もが平和な心構えと、エコシステムを構築する信念と理念を持つべきだと考えています。大規模、中規模、小規模の企業であっても、開発者であってもユーザーであっても、このようなエコシステムを形成し、インテリジェントな副操縦士の仕事をうまく行うことで、ビッグモデルの時代に誰もが恩恵を受けることができるのが最善です。

大規模モデルはまだ初期段階にあり、出発点に過ぎません。 AIはあらゆる側面をカバーしており、従来のインターネットよりも10倍、100倍も大きなチャンスがここにはあるかもしれません。 AIの問題を解決すればすべてが恩恵を受けるでしょう。そのため、彼は社会のあらゆる分野が大型モデルに対して包括的かつ共生的な態度を持ち、大型モデルの開発を共同で推進することを強く望んでいます。

7. 最後に

周明氏は「一般的なビッグモデルと数千の業界のシナリオの間にはギャップがある」と述べた。ビッグモデルの時代には、「ユーザーのシナリオのために最後の1マイルを行う」効率が大幅に向上するだろう。周明氏はこれを新世代のソフトウェア開発のパラダイムと呼んだ。プロンプトは大規模なモデルに基づいているため、多くの機能エンジンを提供できます。 Copilot を使用して開発効率を向上できるようになったので、さらに考慮すべき点があります。明確に考え、独自のユーザー エクスペリエンスを適切に設計すれば、新しい製品の構築が容易になります。

もちろん、有用なモデルは一夜にして作成されるものではありません。大手模型メーカーが顧客をどう理解するか、サービスのラストワンマイルをどう実現するか、業界を真にビッグモデルにするにはどうするか、サービスを低コストでどう提供するか、ビジネスモデルでどう連携するか、ユーザーのプライバシーをどう保護するか、など、すべては、関与する大手模型メーカーが自ら答える必要がある質問です。

——ゲスト紹介——

蘭州テクノロジーの創設者兼CEO、周明氏

蘭州科技の創業者兼 CEO である周明氏は、現在、中国コンピューター学会の副会長、Sinovation Ventures の主任科学者、中国人工知能学会のフェロー、5 つの大学の博士課程の指導者を務めています。同氏は、世界における NLP 分野の第一人者であり、世界で最も多くの ACL 論文を発表している学者の 1 人です。彼は、計算言語学会の会長や Microsoft Research Asia の副社長を務めてきました。長年にわたり、Microsoft Research Asia において NLP 研究をリードし、コンピュータの作成、機械翻訳、検索、推奨、事前学習済みモデルなどの分野で世界をリードする研究成果を上げており、さまざまな Microsoft 製品に広く活用されています。 2021年に認知インテリジェンス企業である蘭州科技が設立されました。同社は、自然言語とマルチモーダル情報の理解と生成、機械翻訳、ナレッジグラフ、質問応答と推論、業界検索、ナレッジサービスなどの技術を含む、最先端の次世代認知インテリジェンス技術の開発に取り組んでいます。

<<:  蘭州テクノロジーの周明氏:大きなモデルは必ずしも大きいほど良いというわけではありません。100億規模のモデルでも十分かもしれません。

>>:  ChatGPTに勝つ? OpenChat が 105.7% のパフォーマンスでスタンフォード AlpacaEval オープンソース リストのトップに

ブログ    
ブログ    

推薦する

TF Learn: Scikit-learn と TensorFlow をベースにしたディープラーニング ツール

[51CTO.comより引用] 海外のデータサイエンス市場に詳しい人なら誰でも、2017年に海外のデ...

...

AIが仕事や生活を奪ったら、人類の未来はどうなるのでしょうか?

AIの発展は、人間の仕事の効率を向上させ、人間の働き方を変え、さらには人類の発展の方向を導く上で大...

...

...

Go 言語 - データ構造とアルゴリズム プロジェクト

[[404457]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...

...

...

...

企業はデータセンターで人工知能を広く利用する準備ができているでしょうか?

今日、ますます多くのサーバーベンダーが、人工知能を活用したサーバー自動化テクノロジーの開発に取り組ん...

...

「AI+教育」の試行錯誤に誰がお金を払うのか?

「AI+教育」の導入は簡単? 2016年はAI(人工知能)元年と言われています。この年、Alpha...

2020年AIの現状調査:25%の企業がAI導入により大幅な収益増加を達成

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...