ゲスト|百度インテリジェントクラウド技術委員会委員長 孫克氏 執筆者 | Yun Zhao 2023年、世界のテクノロジーを荘厳で情熱的な交響曲に例えるなら、ビッグモデルは間違いなく最もエキサイティングなテーマになるでしょう。海外の大型機種大手数社間の熾烈な競争とは異なり、国内の大型機種開発と革新の軌跡は百度そのもののようだ。 リーダーとフォロワーの違いはイノベーションです。 3月16日に文心易言がリリースされて以来、百度は大型モデルの道を猛スピードで突き進み、大きくリードしている。文心製品の社会全体への開放、プラグインマトリックスの発表、そしてGPT4に匹敵するか部分的に上回る10月の文心易眼4.0の正式リリース、そしてAIネイティブアプリケーションの導入まで、それぞれのステップは中国の大規模モデルイノベーションの風向計となっている。 しかし、イノベーションに終わりはありません。人々がAIネイティブアプリケーションが爆発的に増加する2024年をどう迎えるかに苦慮しているちょうどその時、百度は再び業界にサイフォン効果の威力を目の当たりにさせました。12月20日、2023年百度クラウドインテリジェンスカンファレンスとインテリジェントコンピューティングカンファレンスで、百度は大きな動きを見せ、AIネイティブアプリケーション開発ワークベンチである百度スマートクラウド千帆AppBuilderのサービスを全面的に開始すると発表しました。 7 日後、51CTO は幸運にも Baidu ビルに招待され、Baidu インテリジェント クラウド テクノロジー委員会の会長である Sun Ke 氏にインタビューすることができました。Sun Ke 氏は、インテリジェント コンピューティング カンファレンスで AI ネイティブ アプリケーションを数分で構築する方法を実演しました。 イノベーションは観察と検証のプロセスであるAppBuilder のリリース、「全体として、これは観察と検証のプロセスです。」 この開発プラットフォームの開発プロセスを振り返ると、孫克氏は次のように簡潔にまとめました。尋問が続くにつれ、その背景にある物語が明らかになった。 「Baidu では、ビッグ モデルを中心にさまざまなアプリケーションを試してきました。このプロセスで、アプリケーション アーキテクチャと一部の機能が徐々に収束していることが分かりました。また、EB4 に基づく機能が徐々に明らかになるにつれて、この機能は階層化アーキテクチャとして実装できることも分かりました。」 以前、Wenxin モデルを通じて、顧客がわずか 3 分で公式サイトのカスタマー サービスを構築したことが報告されました。 「私たちはこの傾向を1、2か月前から観察し、8月にこれは追求する価値のある方向性であると判断しました。その後、プラットフォームと製品の構築を開始し、10月の世界会議でプロトタイプを発表しました。その後、製品の構造とコンセプトをさらに改良し、12月20日に正式にリリースしました。」 観察と検証の過程で、AIネイティブアプリケーションの敷居を大きく下げる開発ツールが誕生しました。 Baidu は AI ネイティブ アプリケーションについてどう考えているかクラウド コンピューティングがクラウド ネイティブに進化するのと同じように、「アプリケーション + AI」が AI ネイティブ アプリケーションに移行すると、具体的に何が変わるのでしょうか? 孫科氏は、「AIネイティブアプリケーション」という用語は、人々が「モバイルアプリケーション」について話すときと同じように、決まった形式がないのと同じように、AI駆動型アプリケーションの新しい時代を表していると考えています。 しかし、AI主導のビジネスモデルからは、徐々に「AIネイティブアプリケーション」の姿が見えてくるでしょう。 まず、AI をベースに作成する機能、次に質問応答、知識獲得、推奨を行う機能を確認します。これらは 2 つの一般的なビジネス形式です。さらに将来的には、ユーザーはエージェントによって完了される可能性のある GBI などの AI ベースのより複雑なタスクを完了することになります。 さらに、AIネイティブは既存のアプリケーション操作を高速化するのに優れています。ロビンがよく言うように、私たちのGUI(グラフィカルユーザーインターフェイス)メニューは2つのレベルに削減されるべきです。 たとえば、PPT の作成、描画、テキスト スタイルの編集などのシナリオでは、機能を見つけるために 3 番目のレベルのメニューに移動する必要があることがよくあります。ネイティブ AI アプリケーションがリリースされた後、これらの共通機能の GUI インターフェースに表示されるボタンの数は最大 2 レベルのみになり、テーブル ページを切り替える必要がなくなり、操作効率が大幅に向上します。 現在の AI とアプリケーションをどのように組み合わせて、より「ネイティブ」にできるでしょうか?孫克氏は「写真編集」の非常に鮮明な例を挙げた。 Photoshop では、ポートレートの切り抜きなど、面倒で時間のかかる現在の複雑な操作プロセスや固定タスクの一部が、ダイアログボックスを通じて完了するように進化する可能性があると彼は考えています。 「これらの機能を AI のネイティブ機能の背後に隠すことで、これらの操作は簡単な自然言語による記述を通じて迅速かつ自動的に完了できます。」 画像を切り取った後にその位置を移動するなどの単純なタスクの場合、ユーザーは言語コマンドを使用して AI に実行させるよりも、マウスで移動することを好みます。 複雑な機能を AI に任せることで、ユーザーは創造力と創造性にさらに集中できるようになります。 「これは理想的な AI ネイティブの組み合わせです。エージェント駆動型か操作強化型かにかかわらず、将来の製品にこれらの AI ネイティブ機能がなければ、競争力が大きく低下する可能性があります。」 したがって、AI ネイティブ統合があらゆる分野に浸透し、将来の製品の重要な部分となるという、非常に幅広い新しいシナリオを予見できます。 AppBuilder を分解し、次世代の大規模モデル アプリケーションを予測するAIネイティブアプリケーションの展望はすでに明らかになっていますが、AIネイティブ機能に適応したアプリケーション開発フレームワークをどのように構築できるでしょうか? Baidu Qianfan がリリースした Appbuilder には、RAG、GBI、Agent という 3 つの初期のフレームワークが用意されていたことがわかりました。孫科氏は、これら3つを選んだ理由は「市場の需要が製品を動かす」という中核ロジックに基づいていると述べた。 まず、そもそもなぜ RAG フレームワークを作成したのでしょうか?これには2つの理由があります。まず、「現在、大規模モデルアプリケーションに取り組んでいるプレイヤーは、RAG を行うだけでなく、必ず RAG を行うでしょう」。孫克氏は 51CTO に対し、現在、Appbuilder のユーザーの 80% 以上が RAG に取り組んでいるため、ユーザーが最も懸念している最も一般的なニーズを解決するのを支援することを優先する必要があると語った。第二に、RAG は業界で認知され、比較的安定した大規模モデル アプリケーション フレームワークであり、錯覚問題や安定性問題など、大規模モデルのリリース後に発生する一連の問題点を解決するために使用できます。これらは業界ではよく知られており、大規模モデル向けの比較的安定したアプリケーション フレームワークです。 第二に、GBI に対する市場の需要は予想以上に幅広く、10 月 17 日の Baidu World Conference でのリリース以来、Baidu GBI への応募のリードが殺到しています。 Sun Ke 氏は、GBI には現在、開発者、インテグレーター、さらにはこのシナリオに強い要求を持つエンドユーザーなど、さまざまなレベルの需要があると指摘しました。同時に、孫科氏は、GBI は「RAG が前進し、大規模モデルを深く適用する」ための重要なマイルストーンであると考えています。 RAG の「自然言語を使用した自然言語の生成」と比較して、GBI は自然言語を使用して SQL ステートメントを生成し、ユーザーが手続き型操作を実行できるようにします。このようなフレームワークは、大規模なモデルに非常に望ましいものです。一方で、データベース内のテーブルを直接クエリできる完全なアプリケーションとして使用することを望む人も多くいますが、他方では、さまざまな AI ネイティブ アプリケーションにコンポーネントとして統合され、さらには GBI が RAG に統合される予定です。たとえば、検索対象のドキュメントにテーブルが含まれている場合、クエリを実行するには GBI が必要になります。 最後に、エージェントについて、孫克氏は、これは次世代の大規模モデルアプリケーションのプロトタイプであると述べました。現在市場で入手可能なエージェントはまだ完璧ではないかもしれませんが、将来的に大規模モデルがその応用価値を実現するための重要な方向性です。エージェントは、大規模モデルの世界と言語の認識を一連の行動操作アクションに変換し、それを分解、実行、操作して、最終的には実際のアシスタントになります。市場にはエージェントの開発と適用の要件が数多く存在し、開発フレームワークも数多く存在します。「エージェントを選択した目的は、まず誰もが使用して、いつでもフィードバックを提供できるようにすることです。また、フィードバックに基づいて迅速に最適化し、最終的には強力で普遍的なエージェント機能をすべての人に提供したいと考えています。」 つまり、AppBuilder は市場の需要と将来の開発の見通しに基づいてこれらのフレームワークを選択しました。 「将来的に検討する価値のあるフレームワークがさらにあれば、Baidu チームは大規模なモデル アプリケーションの開発を加速するという最終目標を掲げて、引き続き検討していきます。」 「テクノロジーの着陸ライン」を越えて、BaiduはスーパーAIアプリを生み出すのか?時代の到来の背後には、常にテクノロジーの着地点があります。このラインを越えることによってのみ、スーパーアプリケーションのロックを解除できます。スティーブ・ジョブズがタッチスクリーンの iPhone を発売したときと同じように、ユーザーはより柔軟でスムーズな操作性を備えたモバイル インテリジェンスの時代へと突入しました。 同様に、国内の大型モデルを見ると、Baidu ERNIE-Bot 4.0 が最初にこの着陸ラインに到達して越える可能性が最も高いと考えられます。孫科氏は、百度は基礎となるアーキテクチャからモデル効果まで、あらゆる機能を含むAIネイティブアプリケーションにおいて主導的な優位性を持っていると述べた。そして、こうした先行者利益に基づき、Baidu は今後も主導的地位を維持し続けるでしょう。 具体的には、Baidu のチップ、フレームワーク、モデル、アプリケーションの 4 層レイアウトでは、チップとフレームワークが本質的にパフォーマンスに対応し、モデルのユーザー規模の上限を決定します。パフォーマンスが良好であれば、コストを十分に安くすることができるためです。 孫科氏は、多くの大型モデルの呼び出しは安くないと述べた。 「上記のエージェントと GBI は EB4 (ERNIE-Bot 4.0) をベースにする必要があり、各呼び出しを 6 回または 7 回呼び出す必要があるため、呼び出しコストが高くなります。Baidu は、各呼び出しのコストを削減し、最終的に誰もがこれらの複雑な AI ネイティブ アプリケーションを利用できるようにするために、下位レベルで自然な優位性を持っています。」 モデルとアプリケーションの2つの層は、モデルの全体的な効果に反映され、大規模モデルの真に高度な機能をテストします。中国で水平的に見ると、GBIにしろエージェントにしろ、BaiduのERNIE-Bot 4.0は依然として最も強力な機能を備えています。 基礎的な強さの利点は、将来を見据えた実用的な利点も生み出します。例えば、AI クラウドに関して言えば、Baidu は AI 機能を適切な形にパッケージ化し、開発者に迅速に提供する方法について独自の知識と経験を持っています。 では、AI スーパーアプリは Baidu から登場するのでしょうか? この問題は、諸刃の剣とも言える。しかし実際には、Baidu の全体的な観点からは、他の企業が人気のある AI ネイティブ アプリケーションを作成することを期待しています。 「それは百度自身ではなく、他社によって開発されるかもしれない。我々はより多くのインフラを提供する。」 ロビンが百度社内スピーチで述べたように、百度は他社より一歩先を進んでいるため、百度の能力とノウハウを標準化・製品化して社会に公開し、より多くの人々に提供し、優れたAIネイティブアプリケーションを生み出したいと考えている。 さらに、孫科氏の見解では、将来的には AI ネイティブのスーパーアプリケーションが 1 つや 2 つではなく、複数の人気アプリケーションが登場するだろう。 「AI が急成長を遂げる時代において、1 つのアプリケーションが他のアプリケーションを凌駕することはできません。」 一輪の花が咲いたからといって春になるわけではない。孫科氏が本当に期待しているのは、AppBuilder などのツールとプラットフォームに基づいて、誰もが協力し、AI ネイティブ アプリケーションの時代を真に爆発的発展と繁栄へと推し進めることができることです。 「Baidu Smart Cloud と AppBuilder にとって、開発者の効率向上を支援することが最優先事項です。開発者が AI ネイティブ アプリケーションを作成しているのを見るのは非常にうれしいことです。」 AIアプリケーション開発者にはさらなる自由が必要AppBuilder の設計コンセプトについて語る中で、孫克氏は、AI アプリケーション開発者にはより多くの選択肢と自由度が必要なため、フレームワークとコンポーネントは拡張可能かつ分割可能に作られていると述べました。 「安定したフレームワークとスライス戦略を提供するだけでは、明らかに不十分です。まだやるべきことはたくさんあります。記者会見で実演した履歴書アシスタントと同様に、RAG を実行する前に、開発者は履歴書に対して他の処理を実行し、大きなモデルに他の操作を実行させてから、検索を実行する必要があります。」 これらの要求を踏まえると、静的なフレームワークでは解決できないため、開発者が独自のニーズに合わせて自由に組み替えられるフレームワークを用意する必要があります。そのため、Baidu チームはフレームワークの一連のオープンソースリリースを作成しました。 さらに、フレームワーク内のすべてのコンポーネント、つまり、さまざまなモードのコンポーネントを含むコンポーネントが整理されており、開発者は事前注文や事後注文に関係なく、自由にプラグを差し込んだり取り外したり、機能を拡張したりカスタマイズしたりできます。 また、AppBuilderにはコード状態とローコード状態の2つの形式があると報告されています。ローコード状態のツールは、最も一般的なビジネスロジックを提供することを優先しますが、コード状態の開発方法を完全に放棄するわけではありません。 Sun Ke 氏は、「開発者は依然としてビジネス ロジックを調整する必要があるため、ローコードの状態がコードの状態を完全に置き換えることはありません」と述べています。 AppBuilder の本当のコンセプトは、単に開発者が AI アプリケーションを作成できるようにすることではなく、開発者がプラットフォーム上で完全な AI ネイティブ アプリケーションを開発するためのすべてのツールとキットを見つけられるようにすることです。 さらに、AppBuilder はさまざまなタイプの開発者向けにさまざまなサービス戦略も提供します。 まず、大手インターネット企業や、AIネイティブアプリケーションの開発能力に優れた企業など、独自のアプリケーションを開発できる開発者が存在します。このような企業はクラウドへの依存度が低く、プライベートクラウドを使用しており、パブリッククラウドサービスを利用する可能性は低いです。 第二に、自力で開発することができない開発者、主に伝統的な企業や資源ベースの企業にとっては、サービスを提供する外部のサービスプロバイダーが必要です。このような企業はクラウドコンピューティングに対する需要が強くなく、自社の開発能力も比較的弱いため、直接的な顧客ではなく間接的な顧客となります。 また、孫科氏は、AIネイティブアプリケーション開発ツールのコアターゲット顧客グループには、ISV(独立系ソフトウェア開発者)とBtoBスタートアップが含まれると述べた。これらの顧客は主に、第一次産業と第二次産業の大規模な民営顧客と、レストラン、スーパーマーケットなどの多数の第二次顧客にサービスを提供している。 さらに、このプラットフォームは中規模および小規模のインターネット企業にもサービスを提供しています。これらの企業には独自の障壁やリソースがあるかもしれませんが、エンタープライズ インテリジェンスと情報化に対する要求もあります。ターゲット顧客の中には、Cビジネスに特化したAIスタートアップ企業もいくつかあります。これらの顧客は、特定のテクノロジーを自ら構築し、アプリケーションを迅速に構築する必要があるかもしれません。 Sun Ke 氏は、これらの顧客グループの行動プロファイルはほぼ同じであると考えています。いずれも一定の開発能力を持つ企業や個人です。アプリケーション フレームワークや API を使用して、必要なコンテンツを迅速に構築しますが、サービスの目的は異なる場合があります。 一般的に、プラットフォームは、さまざまなタイプの開発者のさまざまなニーズと特性を満たすために、さまざまなサービス戦略を提供します。 小さなステップと素早い進歩で開発者のAIアプリケーション構築を加速ローコード状態とコード状態という2つの側面に焦点を当て、Sun Ke氏はAppBuilderの次期製品計画を紹介しました。 ローコードの観点から見ると、AppBuilder は主に開発能力が比較的弱い開発者を対象としており、アプリケーション構築の高速化に役立ちます。この目標を達成するために、AppBuilder は、エージェント、GBI、RAG のタスク構成機能を強化するなど、機能の強化と柔軟性の向上を継続していきます。さらに、AppBuilder は、開発者が Lingjing などのさまざまな端末シナリオにアプリケーションを公開できるようにするためのコネクタをさらに開発します。 コードの状態に関して言えば、AppBuilder は主に、ディープ デベロッパー向けに効率的で安定したインターフェイスと補助的な開発ツールを提供します。これらのツールには IDE、デバッグ環境などが含まれており、開発者はアプリケーションをより適切に開発、デバッグ、最適化できます。同時に、AppBuilder はより多くの API と構成オプションをリリースし、プレイアビリティと呼び出し効率を向上させます。さらに、AppBuilder では、アプリケーション開発にこれらの API を使用する方法を開発者にガイドする開発テンプレート (クックブックなど) もさらに公開されます。 最後に、Sun Ke 氏は、AppBuilder の反復速度は非常に速く、小さなバージョンがほぼ毎週リリースされていると述べました。新機能のリリースや既存機能の最適化など、メジャーバージョンのアップデートは毎月行われます。具体的なスケジュールを示すことは不可能ですが、AppBuilder は今後も新機能のリリースや既存機能の最適化を続け、開発者がより効率的にアプリケーションを開発できるようにしていくことは間違いありません。 将来:中国最大のAIネイティブアプリケーションエコシステムとなる「百度は中国最大のAIネイティブアプリケーション開発エコシステムになることを目指しており、数百万人の開発者を抱えることを期待しています。」 AIネイティブアプリケーション開発の将来について語るとき、Sun Ke氏は自信に満ち溢れています。彼の意見では、AIネイティブアプリケーション市場はモバイル時代よりも大きくなり、この時代のリーダーになりたいと考えています。 まず第一に、独自のシャベルを作るオタクのチームが存在する可能性は否定できないが、本当の強さを持つプレイヤーの数はまだ限られていると彼は考えている。孫科氏は、中国ではオープンソース エコシステムとクラウド内のすべての開発リソースとのつながりが比較的弱いと考えています。 第二に、孫克氏は「シャベルを作る基本的な論理は、少なくとも大型モデルを運ぶ場所やBOSを運ぶ場所など、基本的なリソースを運ぶ場所が必要だということです。国内市場を見ると、大企業、特にクラウド企業にはこれを実現するチャンスが大きいと思います」と指摘した。 最も重要なことは、百度が行っていることは単なるシャベルではなく、大型モデルなどのインフラストラクチャを含む完全な金採掘設備セットであり、国内のAIネイティブアプリケーション開発エコシステムを真に継続的に促進し、繁栄させることができる革新的なインキュベーターセットであるということです。 |
人生におけるすべてのことは時間と関連しており、連続性を形成しています。シーケンシャルデータ(テキスト...
史上最速の大規模モデル推論を実現するには、1171万ドル(8410万元)の費用がかかりますか? ? ...
導入ほとんどすべての人が、家族や友人と一緒に映画を観ながら余暇を過ごすのが好きです。誰でもこんな経験...
百度が1月30日に発表した公式ニュースによると、百度はウイルスRNAの解析時間を55分から27秒に短...
AI、特に GenAI の急速な発展により、分析および IT リーダーには、データ戦略とデータ管理...
若者に向けて、Lao Huang 氏から 3 つの提案を紹介します。学ぶことをやめず、できる限り最善...
ChatGPTの立ち上げから1年以上が経った今、2023年のAIに関する最大の話題は、技術そのもので...
[[431488]]テルネットTelnet プログラムの目的は、ネットワーク経由でリモート ログイン...
テキスト生成は、多くの自然言語処理アプリケーションにとって重要です。しかし、ニューラル言語モデルの最...