Baidu は革命を起こしました!

Baidu は革命を起こしました!

10月17日午前、百度世界2023大会に、百度創業者のロビン・リー氏が白いシ​​ャツを着て落ち着いた様子で登場した。このカンファレンスは、7か月前に文心易言がリリースされて以来、生成AIで業界の状況を再構築するという百度の決意を最も刺激的で深遠に外部に示したものであると言えるでしょう。

1.最強の文心ビッグモデルがリリースされました。ロビン・リー:GPT4に劣らない

3月16日のWenxin Yiyanの発売を振り返り、ロビン氏は謙虚に次のようにコメントした。「Wenxin Yiyanは完璧ではありません。2日前にリリースされたGPT4とベンチマークするプレッシャーはまだ大きいです。」

しかし今回、Wenxin Yiyan 4.0 バージョンは、AIGC 時代に Baidu に十分な自信を与えました。長期にわたる投資と探求により、Baidu は大規模モデルの機能を改善し、そのアプリケーションを実装するための強固で独自の道を確立することができました。

文馨易燕アプリがアップデートされ、ロビン・リーが招待テストの開始を発表

フルスクリーンのポスターを見るだけでも、新バージョンの「文心易言」の強い「マルチモーダル」風味が感じられます。

彼は興奮を隠し切れなかった。「これはこれまでで最も強力なWenxinモデルであり、基本モデルの全面的なアップグレードを実現し、理解、生成、ロジック、メモリ機能が明らかに向上しています。全体的なレベルは「GPT-4に劣っていません」。」

Li Yanhong氏は、「AIネイティブアプリケーションは、大規模モデルの理解、生成、ロジック、メモリ機能に基づいて開発されたアプリケーションです。これらの機能はこれまで利用できなかったため、イノベーションのための無限の余地が開かれます」と述べました。

2. 4つのコア能力、李延宏が自ら促した

Li Yanhong 氏は、冒頭であまり準備せず、すぐに本題である、自らプロンプトを出し、Wenxinyiyan 4.0 をテストしました。質問の仕方は、主に「執拗に追求して真相を突き止める」ことで、大物モデルを「困惑させる」というものです。

「この大きなモデルに触れてみて、最も不思議なことは、本来の『人工知能』がもはや愚かではなくなったということだと感じた」とロビン・リー氏は語った。

1. ロビン・リーは難しい質問を投げかけた

まず、李延紅さんは「積立金で家を買う」という難しい質問を投げかけました。それは「複雑」で、一見単純なようで順序がバラバラでした。承徳で家を買いたいのですが、積立金ローンを申請できますか?私は北京で働いています。

順序が乱れ、意味が曖昧であったにもかかわらず、文鑫易燕は実際の問題を非常によく理解し、良い答えを出しました。

2. 創造性を刺激する魔法のツール:「長安奇園」デジタル音声がクリエイティブな動画を放送

その後、ロビン・リーは現場でウェンシン・ビッグモデル4.0の生成能力をテストしました。リーはオリジナルの車の写真を提供しました。ウェンシン・イーヤンは3分以内に「長安奇源」車の広告ポスターセット、広告コピー5つ、デジタルナレーションビデオ広告を素早く生成しました。

出力されたコピーでは、「テクノロジーの美しさ」や「時代のトレンド」などの言葉が専門的で流暢であり、ブランドマーケティングの実践的な基準に達しています。デジタル音声放送ビデオも非常にトレンディで、特徴的で、大音量で、ブランド感覚に満ちています。

マルチモーダル機能のリリースにより、Wenxin の大規模モデルを生成する能力が大幅に向上しました。Robin Li 氏はこれを「創造性を刺激する魔法のツール」と呼んでいます。

写真

李延紅氏は、この能力を基に百度がAIGCマーケティングクリエイティブプラットフォームQingduoを立ち上げ、「1人がAIマーケティングチームになる」ことを可能にしたと紹介した。

3. ロビン・リーが子供の宿題を手伝う問題を解決する方法を示した

論理的思考力の向上という点では、李延紅は子供たちに数学の宿題を教えるというシナリオを選びました。彼は文鑫に「砂のコーンで道路を舗装する」という数学の問題を出し、上記の問題を解くためにどのような知識ポイントを使ったかを尋ね、一つの例から推論を導き出す大きなモデルの能力をテストしました。

「子どもが宿題をやらないときは、母親が愛情深く、子どもが親孝行している。宿題をやると、どこもかしこも大混乱だ」。本日のリリースでは、ビッグモデルアプローチを使用して、生徒に宿題を教える新しい体験と方法を提供しています。

李延紅氏はまた、スマートマップや赤と緑の制御などの複雑なタスクを含むインテリジェント交通においても、大型モデルの超論理的能力が活用されていると付け加えた。

4. 記憶力:李延紅は多人数の武侠小説をその場で創作した

李延紅は、読者が物語の本筋を思い出せるように、「登場人物が少なすぎるので、あと4人追加してください」「ドラマチックな逆転や衝突を増やしてください」「登場人物を元の章に置き換えてください」など、注意をそらすような質問をプロンプトに絶えず挿入しました。

小説の執筆は、AIGC の典型的な応用例です。Wenxin モデルはすべての要件を記憶し、繰り返しの改訂プロセスで登場人物や関係性が混乱することはありません。これは、人間の創作のロジックと一致しています。

Wenxin Big Model は Baidu World Conference の主役でした。Robin Li は、プロセス全体を通じて音声を使用して Wenxin Big Model と対話しました。この Big Model は、プロンプトに従って、GPT4 に匹敵する優れた機能をスムーズに実演しました。

3. 大きなイノベーション: AIネイティブ思考を備えたBaidu製品

「以前私が自慢していたこと」はロビン・リー・ヤンホンによって実現されました。 5月にロビン・リー氏は大胆な発言をした。「百度は既存の全製品を再構築し、作り直す最初の企業になりたい」。今、Baidu がそれを実現しました。 Robin Li 氏は、Search、Ruliu、Maps、Cloud Disk、Wenku などのアプリの驚くべき再構築を言葉も惜しみなく披露しました。

Baidu は設立されてから 23 年近く経ち、インターネットの巨人へと成長する過程で、数多くの製品を蓄積してきました。ここでは、Li Yanhong 氏が考える「AI ネイティブ アプリケーション」を解釈するために、いくつかの典型的なアプリケーションを選択しました。

まず、Baidu の新しい検索があります。 Robin Li 氏は、従来の検索応答は時代遅れであり、「検索ボックスに質問を入力して大量のリンクを返す」時代は「もう終わった」と考えています。

会議でロビン・リー氏は、過去の検索結果とはまったく異なる百度の新しい検索の3つの特徴、すなわち極度の満足度、推奨刺激、複数回のインタラクションについて話した。究極の満足とは、大規模なモデルを理解して推論し、理解しやすくグラフで提示される回答を推奨することです。ワンステップで究極の答えが得られます。推奨刺激とは、満足のいく答えを提供しながら、ユーザーが引き続き知りたいと思う可能性が高いコンテンツを推奨することを意味します。複数ラウンドのインタラクションとは、標準的な答えがない質問に対して、複数ラウンドのインタラクティブな検索エクスペリエンスが、より優れたソリューション エクスペリエンスであることを意味します。

ロビン・リー氏は、AI が検索の境界を大きく広げることができるため、「検索と AI は天が結びつけた組み合わせ」であると常に信じてきました。

企業向けアプリケーション向けに、Baidu は AI ネイティブ製品「Baidu GBI (Generative Business Intelligence)」もゼロから開発しました。名前の通り、AIを搭載した「BI」は世界初のAI製品です。報道によれば、この製品は膨大な量のデータを数秒で集約し、「即時実行計画」を作成し、ビジネスアナリストがデータ分析レポートを完成させるのに10日以上かかる時間を数分に短縮し、リーダーが最速のスピードで業界の意思決定を行うのを支援するという。

ロビン・リーは誇らしげにこう語った。「すべての格闘技に勝つ唯一の方法は、速さです。今日、私たちは企業レベルの真の意思決定ツールを持っています。」

第二に、百度の社内チームコミュニケーションおよびオフィス製品「Ruluo」は、AIスーパーアシスタントを使用して、1秒でグループチャットを要約して重要なポイントを強調表示し、数秒で数万件のメッセージをインテリジェントに分類および要約し、「ワンクリック旅行」でスタッフが旅行の問題を解決するのに役立ちます。もちろん、その背後には、Baidu の AI と CRM システムが接続された後に達成される究極の効果があります。

AI ネイティブ思考で作成されたオフィス ツールは、ハードワークをスマートワークに置き換えるという新しいコンセプトを体現しています。

4. 革命を起こした古い百度製品

1. Baidu の新ライブラリ: 生産性向上ツールへの移行

今、Baidu Wenku にログインすると、右側にドキュメント インテリジェント アシスタントが表示されます。このアシスタントを使用すると、検索する代わりに、たった 1 つの文で実際のドキュメントのニーズを満たすことができます。

写真

Li Yanhong氏は、大規模なモデルに支えられたライブラリは、どれが一般的な情報でどれが厳密な学術講演であるかを識別するのに役立つと紹介しました。

さらに、Baidu New Library もコンテンツツールから生産性ツールへと進化しており、評価の結果、類似製品をはるかに上回っています。 Li Yanhong氏はまた、「PPTの生成」の例を使って、新しいライブラリの優秀さを実証しました。知識ポイントが並列関係か従属関係かを識別すること、チャートの美観を最適化すること、さらには PPT の対応するスピーチ スクリプトや聴衆が尋ねる可能性のある質問など、AI ツールではこれまでできなかった多くの詳細を推測できます。

Baidu Wenku が革命を起こしました! 10億件の優れたドキュメントに支えられ、Wenxin ビッグモデルを理解して生成する能力とマルチモーダル機能が組み合わさり、「以前はユーザーは既製のコンテンツを探すためにポータルにアクセスしていましたが、今ではユーザーはコンテンツを作成するためにポータルにアクセスするようになりました」という進化が完了しました。

2. Baiduの新しいクラウドディスク:強化されたビデオ理解機能

Baidu Netdisk は 2012 年にリリースされ、モバイル インターネット時代の初期のクラウド ストレージ サービスの 1 つです。 11年が経過し、Baidu NetdiskはAIで再定義される必要があります。 Baiduも独自の回答を出した。クラウドディスク上の4兆個のファイルに基づいて、AIを使用して再構築し、インテリジェントなサービスを提供することが良い選択になりました。

ロビン・リー氏は、百度ネットディスク「雲易多」が業界、さらには世界初の個人用クラウドインテリジェントアシスタントであると紹介した。これはAIによって再構築された新しいネットワークディスクです。

新着情報? Robin Li 氏は Yunyiduo に「インタビュー動画を理解し、内容を抽出し、黄金の文章をキャプチャする」という難しい課題を与えました。古いオンラインディスクは、動画の内容を理解し、さまざまなキャラクターを識別し、文脈記憶を形成できる超人的なアシスタントに変身しました。わずか数語で、43 分間のインタビュー ビデオを完全に要約し、重要な引用文で処理できます。

古いオンライン ストレージが統計法則を学習できるようになれば、次の 10 年間の新しいオンライン ストレージを定義できるようになります。これにより、仕事、生活、学習という 3 つの典型的なシナリオにおけるユーザー エクスペリエンスが向上し、グラフィカル インターフェイス インタラクションから自然言語インタラクションへの移行が実現し、マルチモーダル情報理解が強化されます。

これは単に内容を見るということではなく、元の内容の中の「最も重要な部分」を一文で見つけるということなのです。昨日の時点で、Yunyiduo のユーザー数は 2,000 万人に達した。

3. 百度の新地図:単なるナビゲーションシステムではなく、ガイドでもある

18年の歴史を持つ百度地図も、もちろん「AIネイティブ思考」による再構築が急務となっている。

現代のアプリケーションは、旅行前のインターネットでの面倒な複数の機械的な手順、「目的地の検索 - 周辺の検索 - ルートの検索 - 交通手段の検索 - ナビゲーション - タクシーに乗る/航空券を予約する」にうんざりしているようです。

Baidu Maps は、これらの手順を 1 つに統合して、直接的なワンステップ アクセスと迅速な応答を提供できるかどうかを検討しています。李延紅氏は、新しいマップを使用する際、ユーザーは自分のニーズを伝えるだけで、数千のAPIと多段階のメニューにワンステップでアクセスできると指摘した。そして、非常に賞賛される例を示しました。

写真

この例では、新しいマップは、一般的なニーズの理解、中間の待ち合わせ場所の選択、複数の場所の情報の比較、将来の旅行の予約、およびその他のソリューションに関するリアルタイムの通話と合理的な推奨事項を提供します。その背景には、Wenxin Yiyan の機能と、地図独自の 10 億レベルの PUI および 1 兆レベルの交通認識データの統合の結果があります。

Baidu の新しい地図は、ユーザーをますます理解する遍在する AI 旅行ガイドとなり、人々のオフラインの生活や仕事に大きな影響を与えるでしょう。

これらの新製品に加え、BaiduのCTOである王海鋒氏は、Baiduが「comate」と呼ばれる社内コード生成ツールを開発したことも明らかにした。Baidu内のコードの20%はcomateによって生成されており、コードの採用率は60%にも達する。

5. Wenxin モデルが強力なのはなぜですか?

続いて行われたスピーチで、百度のCTOである王海鋒氏は、過去7か月にわたる文心ビッグモデルのたゆまぬ研究についても説明した。構築された多次元データシステムに基づき、万華コンピューティングパワーで稼働するPaddlePaddleプラットフォームは、多段階のアライメント(教師あり微調整、嗜好学習、強化学習)と再生可能なトレーニング、および増分パラメータ調整を実行し、今日の文心ビッグモデルのトレーニングと推論効果の大幅な向上につながった。

写真

現在の Wenxin 大規模モデルは、トレーニング アルゴリズムの効率が累計で 3.6 倍向上し、トレーニングの安定性に関する平均週次トレーニング効率は 98% を超えています。

さらに、知識の向上にも重点が置かれています。検索エンジンのナレッジグラフを通じて、入力側が強化されるだけでなく、出力側も反映されます。同時に、機械が人間のように自律的に考え、進化できるように知識体系が導入されました。

さらに、百度は「銀河共創計画」も提案し、開発者との共創と共創を主張し、文心易言が豊富な実践的なシナリオと環境で成長し続けることを可能にした。

写真

6. 最後に

人間と機械がプロンプトを通じて対話する時代に入り、製品やアプリケーションも「AIネイティブ」の時代に入ります。

AI ネイティブ アプリケーションはどのようになるでしょうか?大型模型で再現すると、製品はどのように見えるでしょうか? T-frontのライブ放送「OpenAIとGoogleが巻き起こしたマルチモーダル戦争について語ろう」でもこの問題について議論しました。統合にしても書き換えにしても、細部には多くの「地雷」と「落とし穴」があります。そのため、今回の百度の新たな登場は、業界にとって良いデモンストレーションとみなすことができる。

最後に、Li Yanhong 氏は Time 誌の表紙からの一節を紹介しました。「AI のユニークさは... 特定の人間のスキルを模倣できるだけでなく、人間が達成するのが難しいタスクも実行できることです。しかし、機械学習や大規模言語モデルのあらゆる進歩の背後には、実は人間がいるのです。」

AIネイティブ時代では、AIは人間に取って代わるのではなく、人間のスキルの一部を模倣して、困難なタスクの完了を支援します。

具体的には、膨大なデータの迅速な集約、数秒でコンテンツを生成するツール、たった 1 つの文で旅行を処理できる機能など、すべてが上記の文の最適な解釈です。

もちろん、百度の「AIネイティブ時代」への探求もすべて新たな出発点となるだろう。

<<:  APIセキュリティへのAIの適用

>>:  研究によると、2027年までにAIの電力消費量は一部の国の電力消費量と同等になると予想されている。

ブログ    

推薦する

警察ドローンの数十億ドル規模のブルーオーシャンをどう実現するか?今後はこの3点に注目してください!

近年、飛行制御、ナビゲーション、通信などの技術の継続的な発展に伴い、ドローン産業は急速な成長を遂げて...

...

AI医用画像の春が再び到来?

概要: AI医用画像診断市場は急速な成長期を迎えつつあり、医師の負担を軽減しながら医療の質の向上も期...

杭州妻殺害事件解決、警察AIも貢献

7月25日、杭州公安局は「杭州人妻殺害事件」について記者会見を開き、捜査結果を発表した。ネットユーザ...

人工知能を理解し、適応する方法

私たちは毎年数百人の学生にデータサイエンスを教えていますが、彼らは皆 AI に魅了され、素晴らしい質...

このレビューでは、5年間にわたる89の研究を数え、ディープラーニングにおけるコードデータ拡張がどのように進んでいるかを示しています。

今日のディープラーニングと大規模モデルの急速な発展により、革新的なテクノロジーの絶え間ない追求がもた...

...

...

AIは脳の信号をリアルタイムで解釈し、画像の主要な視覚的特徴を7倍の速度で復元するとルカン氏は述べた。

AIが脳の信号をリアルタイムで解釈できるようになりました!これはセンセーショナルなことではありませ...

GPT-4 Turboがリリースされたが、人気が高すぎて翌日2時間ダウンした。

11月7日、北米の人工知能企業OpenAIの開発者会議が世界のテクノロジーコミュニティの注目を集め...

人工知能とモノのインターネット:完璧な組み合わせ

IoT デバイスのデータ生成の基本的な能力と、さまざまなデバイスのインテリジェントな動作をシミュレー...

...

ヘルスケア AI が有用であることをどうやって保証するのでしょうか?

ヘルスケアビジネスの大局において、予測モデルは血液検査、X 線検査、MRI と同じ役割を果たします。...

今後の技術開発の動向はどうなると思いますか?

モバイル アプリケーション業界は長年にわたって発展しており、当社のシステムの重要な部分となっています...