待ちに待った! ByteDance初の大規模モデル製品「Doubao」が公開テスト可能、招待コードは不要!

待ちに待った! ByteDance初の大規模モデル製品「Doubao」が公開テスト可能、招待コードは不要!

ノア著

他の大手企業と比較すると、ByteDanceの大型モデル分野における進歩は常に比較的神秘的であったが、最近、関連プロジェクトにより、ようやく氷山の一角が明らかになった。

ByteDance初のAI会話製品「Doubao」がオンラインになり、一般ユーザーによるテストを開始しました。招待コードは不要で、公式サイト(https://www.doubao.com/)で直接登録できます。Web版のほか、公式サイトのQRコードからアプリをダウンロードすることもできます。

写真

このプロジェクトは以前は「Grace」というコードネームで呼ばれ、北京春天智雲科技有限公司によって開発・運営されていたと噂されています。奇々茶によると、同社は2023年7月26日に設立され、登録資本金は100万元で、北京抖音情報サービス株式会社が100%支配している。

「Doubao」の発売は、ByteDanceにとって大型モデルの分野における新たな一歩となる。百度には文心易言、アリババには同義千文、テンセントには渾源、ファーウェイには盤古があり、そして今やバイトダンスも対話型ビッグモデル製品を発売した。まだテスト段階だが、この動きは間違いなくAIGC市場を活性化させるだろう。結局、もう一つの強力な競争相手が出現したのだ。

携帯電話番号/TikTokアカウントで登録した後、「Doubao」の公式サイトに入ると、チャットインターフェースが非常にシンプルであることがわかります。デフォルトでは、「Doubao」、「万能ライティングアシスタント」、「英語学習アシスタント」、「チャット好きのXiaoning」の4つのダイアログボックスが表示されます。また、ユーザーは新しいダイアログを作成したり、ダイアログ名を独自に編集したりすることもできます。

筆者はWeb版でテストを実施。「ChatGPTとの違いは何か?」と質問したところ、Doubaoの答えは以下の通り。一長一短なく、かなり満足できる答えだと言える。

写真

Doubao は使用中に、受信した返信に対して次のオプションを設定しています。ユーザーは、返信の品質に基づいて「コピー」、「新しい会話を開始」、または「いいね」または「嫌い」を選択できるため、製品の改善に役立ちます。なお、ユーザーが Doubao の回答に満足していない場合や、さらに詳しく知りたい場合は、「検索」機能をクリックして Toutiao 検索ページにジャンプし、ユーザーの質問に対する回答を検索して比較したり参照したりすることもできます。

写真

また、「豆宝」アプリでは音声再生もサポートしており、会話をテキストで提示するだけでなく、同時に音声で放送することもできます。トーンには、「優しい桃色」、「活発な妹」、「歯切れの良い男性の声」、「ナレーターの暁明」など、10種類以上のオプションも含まれています。

言語表現に加えて、Doubao の計算能力もかなり優れています。著者は小学校の算数の問題を取り上げました。「2 つの数字の合計は 572 です。加数の 1 つには 1 の位に 0 があります。0 を削除すると、2 番目の加数と同じになります。2 つの数字は何ですか?」

写真

Doubao は問題解決のプロセスを詳細かつ明確に提示しただけでなく、最終結果も完全に正しいものであったことがわかります。

質問と回答やチャットサービスに加えて、Zidoubao では、チャットが大好きな Xiao Ning、英語学習アシスタント、万能ライティングアシスタントなど、ユーザーが選択できるさまざまな対話キャラクターも提供しています。

「おしゃべり大好きシャオニン」はユーザーと複数回の会話をすることができます。全体的なコミュニケーションは比較的スムーズで、ロジックに大きな問題はありません。

写真

「英語学習アシスタント」はあなたと完全な英語での会話をし、あなたの問題に対する適切な学習提案を提供します。

写真

「オールラウンドライティングアシスタント」は、主にお客様のニーズに合わせてさまざまなタイプのコピーライティングを書くことができます。

たとえば、小説「生きる」についての書評。

写真

たとえば、先延ばしをやめることに関するビデオ スクリプトなどです。

写真

もう一つの例は、草を植えるコピーです。

写真

これらのコピーライティングには、映画レビュー、書評、脚本などが含まれますが、これらに限定されるものではなく、どちらの文章スタイルも比較的流暢で、さまざまなコピーライティングの形式要件に沿っていることがわかります。

これらの対話キャラクターが十分でない場合は、ユーザーは自分の要件をよりよく満たすインテリジェントエージェントを個人的にトレーニングすることもできます。新しい会話を作成し、その新しい会話に名前を付けることを選択すると、自分の興味に基づいて質問をして、まったく新しいインテリジェントな会話の本文を作成できます。会話の内容が増えるにつれて、ユーザーは事実上、自分をよりよく理解する AI の遊び相手を作り出すことになります。

残念ながら、Doubao は現在、テキストプロンプトに基づいて画像を直接生成することはできません。

写真

現在、AIGC分野は活況を呈しています。市場の喧騒にもかかわらず、良品と不良品が混在する状況を無視することはできません。開発動向としては、テキスト生成、画像生成、さらにはビデオ生成が依然として主流となっています。

しかし、既存の技術をビジネスシナリオとどのように組み合わせるか、それを業界で実際にどのように実装するか、そして実際に商業化を達成するかはまだ模索段階にあります。すべての苦労の末、砂がすべて吹き飛ばされた後に金が見つかるでしょう。業界の再編が新たに進むと、波の中から真の金が出現するだろう。

<<:  トークンとメモリを理解することによってのみ、ChatGPT をよりよくマスターできます。

>>:  人工知能とビッグデータ: ビジネス価値に関するデータの洞察を発見

推薦する

于聖奇:顔認識技術のリスクと法的規制

デジタル時代の到来により、顔認識技術の開発は大きく進歩しました。顔認識技術は普及し、多くの分野で広く...

セキュリティ | 機械学習の「データ汚染」を 1 つの記事で理解する

人間の目には、以下の 3 つの画像はそれぞれ異なるもの、つまり鳥、犬、馬に見えます。しかし、機械学習...

...

人工知能(AI)が商業ビルのアプリケーションで成功を収める

[[359215]]今日、ビッグデータやモノのインターネットなどのテクノロジーが広く応用されるように...

実用的なCNN畳み込みニューラルネットワークは、99.5%の精度で検証コードを認識します

1. 背景2年間運営してきた個人プロジェクトですが、最近対象サイトがスキャンコードログインに変更にな...

九張雲吉DataCanvasマルチモーダル大規模モデルプラットフォームの実践と思考

1. マルチモーダル大規模モデルの歴史的発展上の写真は、1956年にアメリカのダートマス大学で開催さ...

...

ケンブリッジ 2020 人工知能パノラマレポート、将来予測される 8 つの AI トレンド

ケンブリッジ大学の「AIパノラマレポート」2020年版がこのほど正式に発表された。ケンブリッジ大学の...

...

ポストエピデミック時代の8つの主要な技術開発トレンド

COVID-19パンデミックは、パンデミック中でも企業や人々の生活が通常通り継続できるようにデジタル...

PaddlePaddle ディープラーニング実践 - 英語-フランス語翻訳マシン

自然言語処理[1]は、コンピュータサイエンスと人工知能の分野におけるもう一つの重要な方向性です。重要...

マイクロソフトは言語モデルをより調和のとれたものにするために複数のツールとデータセットをオープンソース化

Microsoft は最近、AI 駆動型コンテンツ モデレーション システムを監査し、AI モデルの...

大型模型シリーズ - RAGの解釈

RAG は、2023 年に最も人気のある LLM ベースのアプリケーション システム アーキテクチャ...

いくつかのシンプルな負荷分散アルゴリズム

負荷分散とは負荷分散(英語名は Load Balance)とは、複数のサーバーを対称的に構成したサー...