大人気すぎてブレイク中! ByteDanceのGPT部門フローの秘密を解明

大人気すぎてブレイク中! ByteDanceのGPT部門フローの秘密を解明

ノアが編集

制作:51CTO テクノロジースタック(WeChat ID:blog)

「大規模な言語モデルはヘビしかプログラムできませんが、AI エージェントは Honor of Kings のゲームをプログラムできます。」

かつて誰かが AI エージェントの究極の想像力を次のように表現しました。

過去1年間、国内外の無数のテクノロジー企業が大規模なモデル戦争に巻き込まれ、新興のAIエージェントアプリケーションは徐々に新たな「戦場」になりました。

AI分野ではこれまで控えめだったByteDanceが、ひっそりと動き出し、国内市場向けにAIボット開発プラットフォーム「Coze Button」を正式にリリースした。

写真

ByteDance の GPT としても知られるこのプラットフォームは、特定の機能と特定の領域に重点を置いたチャットボットを開発するために設計されています。プログラミングの経験がなくても、パーソナライズされたチャットボットを作成し、さまざまなソーシャル プラットフォームやアプリケーションに展開できます。

写真

「アイデアさえあれば、ボタンを使用して独自のチャットボットをすばやく簡単に構築し、ワンクリックでDoubao、Feishu、WeChatパブリックアカウントなどのチャネルに公開できます。」と主張しています。

それで、Coze は具体的に何をするのでしょうか? ByteDanceがAIボットに「賭ける」意図は何でしょうか? AIエージェントの開発動向は?

1. 独自のAIボットを構築する

チャットボットの機能を拡張するために、Coze はニュースの閲覧、写真や写真撮影、実用ツール、便利な生活、ウェブ検索などの分野をカバーする豊富なプラグイン ツールを提供しています。ユーザーはさまざまなツールを統合することで、パーソナライズされた専用のボットを作成できます。

写真

さらに、Coze のコア機能には、ナレッジ ベース、ワークフロー、データベースなども含まれます。

ナレッジ ベース: Coze は、ボットが独自のデータと対話できるようにする使いやすいナレッジ ベース機能を提供します。 PDF や Web ページのテキストを処理する必要がある場合は、データを保存および管理し、ロボットが関連する知識にアクセスできるようにするためのナレッジ ベースを作成するだけで済みます。

写真

ワークフロー: 革新的なアイデアがたくさんあり、ボットが自分の仕事を代替してくれることを期待している場合は、ワークフローを作成してボットのスキルに変換することもできます。プログラミング方法を知っている場合は、コード スニペットを使用してワークフローに複雑な機能を作成できます。プログラミング方法がわからない場合は、簡単な操作でワークフローを設計することもできます。

作者は、技術情報を毎日定期的にプッシュできるニュースボットを作成しようとしました。

まず、ダイアログ ボックスでボットの機能を説明すると、Coze が「技術情報アシスタント」という名前を提案します。 Coze 氏は何も異議を唱えず、1 分もかからずにボットを作成しました。

写真

その後、必要に応じてさらにデバッグを行うことができます。ボットの役割をさらに改善したり、プラグインを構成したり、冒頭のコメントを変更したり、音色を選択したり、プレビューしたりする必要がある場合は、それらを 1 つずつ調整できます。

写真

もちろん、特別なインスピレーションがない場合は、Bot Store にアクセスして他の開発者の作品をチェックし、インスピレーションを得ることもできます。

写真

2. その背後にあるチーム:AIアプリケーション層に重点を置くFlow

昨年11月、ByteDanceがAIアプリケーション層に重点を置いた新しい部門「Flow」を設立したと報じられた。この部門は技術担当副社長の洪定坤氏が率いており、ビジネスリーダーはバイトダンスの大型モデルチームの責任者である朱文佳氏が務めている。

AI分野では、ByteDanceはそれほど目立ってはいないものの、その投資は侮れない。モデル層からアプリケーション層まで着実に進歩している。言語と画像のモダリティに関しては、言語ビッグモデルチームはByteDance検索部門が主導し、画像ビッグモデルチームは製品R&Dおよびエンジニアリングアーキテクチャ部門のインテリジェント作成チームが主導しています。

Flow 部門の設立は、ByteDance の全体的な AI 戦略にとって重要な補完となります。 「App Factory」として知られる ByteDance は、C エンドのスーパーアプリの作成に長けています。生成AIの発展に伴い、AIアプリケーション層における競争はますます激しくなっています。いかにして中核的な競争力を維持し続けるかが、多くの大企業にとっての焦点となっています。バイトダンスの動きは、同社の今後の行動の方向性をある程度明らかにするだろう。

現在、Flow部門ではAI対話製品「Doubao」を発売しています。過去3か月間に、ByteDanceはCoze、Cici、ChitChop、BagelBellを含む4つのAI製品を海外市場向けに発売した。

Coze と同様に、Cici はユーザーが独自のチャットボットを作成して共有できる AI ボット作成プラットフォームです。 ChitChopもAIチャットボット作成プラットフォームですが、開発・運営会社はPOLIGONです。

最初の 3 つとは異なり、BagelBell は AI キャラクター作成およびインタラクション プラットフォームであり、架空の物語のプロットとテキストを生成できる AI 駆動の仮想世界を作成し、ユーザーがこの世界で物語を作成および探索できるようにします。 ByteDance傘下のシンガポール企業、SPRING(SG)PTE.LTDによって開発・運営されています。

3. バイトAIの推測:トラフィックの喉元を絞める

ByteDanceが発売するAI製品は、国内市場をターゲットにするか海外市場をターゲットにするかに関わらず、機能とトーンの面で統一されたスタイルを維持しています。この濃縮水検査は昆虫の飼育と非常によく似ています。

今年最初のバイトダンス全社員会議で、梁如波氏は「常に起業し、凡庸の重力から逃れる」という年間のキーワードを共有した。平凡さの重力から逃れるにはどうすればいいでしょうか?現時点では、バイトダンスにとって、過去の成功体験に従うことが近道となるかもしれない。

ByteDanceの過去の主力製品を振り返ると、ToutiaoにしろDouyinにしろ、多様で複雑なコンテンツをカバーしているものの、ByteDance自体はプラットフォームに過ぎず、コンテンツ制作の責任を負っていません。 ByteDance の強みはトラフィックの流れをコントロールすることにあります。少し調べてみると、AI ボットが近年最も有望なトラフィックの入り口である可能性があることがわかります。

大規模モデルの分野は再び活況を呈しており、OpenAI は依然として誰もが認めるリーダーであり、そのギャップは 1 日で埋められるものではありません。別の方法を見つけたほうが良いでしょう。そうすれば突破口が開けるかもしれません。

現時点では、ByteDance の考えは比較的明確であるように思われます。無料の AI ボットを踏み台として、まず市場に参入してユーザーに接触し、トラフィックの入り口を習得し、その後、大量のユーザー行動とデータフィードバックに依存して、強力なアルゴリズムの基礎に基づいてモデルを継続的に改善します。

もちろんこれは非常に理想的な考えです。 AI ボット自体に戻ると、実際のところ、ByteDance の「Button」であれ、OpenAI が立ち上げた GPT であれ、市場に出回っている AI エージェントのほとんどは、特定の知識ベースに基づいてチャットボットを構築しているだけです。その実装効果は、アプリケーション シナリオによって依然として制限されます。

これらのインテリジェント エージェント アプリケーションは、質疑応答のやり取りでは優れたパフォーマンスを発揮しますが、プログラムの連携においては依然として多くの課題に直面しています。これには、API 管理ソフトウェアなしでの API アプリケーション、認証、メンテナンス、接続の問題が伴うことが多いため、ビジネス プロセスに真に浸透できる効率的なツールというよりは、むしろ「おもちゃ」のようなものになります。

4. AIエージェントの今後の展開

近い将来、おそらくビル・ゲイツが予測したように、5年以内に誰もがAIパーソナルアシスタントエージェントを持ち、「私たちの生活様式を完全に変える」ことになるでしょう。

エージェントの構築が簡単になるにつれて、C エンド エージェントが爆発的な増加の波を引き起こす可能性があります。しかし現状では、この道の商業化は疑問のままです。また、エージェントの現在の実装効果から判断すると、真に破壊的な機能は存在せず、C エンド ユーザーがそれに対して料金を支払うかどうかは不明です。 AI アプリケーションとしての AI エージェントの商業的可能性については、まだ検証に時間が必要です。

参考リンク:

https://www.coze.cn/home

https://zhuanlan.zhihu.com/p/669171376

https://www.woshipm.com/evaluating/5950019.html

https://www.thepaper.cn/newsDetail_forward_25794699

<<: 

>>:  IoTとAIが出会うとき: テクノロジーの未来

ブログ    
ブログ    
ブログ    

推薦する

ビッグデータ、機械学習、ディープラーニングのためのコマンドラインツールの概要

[51CTO.com クイック翻訳] キーボードを握ってください! マウスや GUI がなくても、O...

百度、検索エンジンアルゴリズムを調整して微博コンテンツのインデックスを強化

情報筋によると、検索エンジンの百度は先週、検索アルゴリズムを調整し、微博のコンテンツのインデックスを...

上位 10 の古典的なソート アルゴリズムの概要 (Java コード実装を含む)

最近、ソートアルゴリズムを勉強していて、多くのブログを読んでいます。インターネット上のいくつかの記事...

...

人工知能はどのようにして銀行をより「インテリジェント」にすることができるのでしょうか?

[[263447]]人工知能技術の継続的な導入は、新たな産業発展の中核的な原動力となり、さまざまな...

...

...

機械学習による建物のエネルギー効率の向上

エネルギー効率などの複雑な建物の問題を、人間の介入なしに解決するにはどうすればよいでしょうか。建物の...

AI は金融業界がランサムウェアに効果的に対抗するのに役立つでしょうか?

[[430265]]ランサムウェアの脅威は目新しいものではありませんが、依然としてニュースの見出し...

Javaで機械学習を始める方法

[[201237]] Java で機械学習を始めるのに最適なツールは何ですか?この質問はしばらく前か...

Google DeepMindは、新しいAIモデルGeminiを開発中であることを明らかにし、「GPT-4よりも強力」であると主張している。

6月28日、先月のGoogle I/O開発者会議で、Googleは開発中の大規模言語モデル「Gem...

Zhihuのホットトピック:最近AmazonのAIチームから大量の人材が去った?李牧自ら事実を明らかにした!

[[326634]]最近、「アマゾンAI李牧のチームから大量の人材が抜けたことについてどう思います...

AI アバターが CES に登場! Samsung の Neon チャットボットは学習、進化、記憶が可能です!

サムスンの待望のスマートヒューマンプロジェクト「Neon」が、ついにCES 2020でデビューしまし...

GPT-4とMidjourneyに加えて、Tan Pingの起業家チームは3D基本モデルを構築したいと考えています。

少し前にOpenAIが驚くべき生成効果を持つグラフィックモデルDALL・E 3をリリースしました。た...