ジェミニは、中国語のトレーニングに百度文信易言を利用していたと明かし、ネットユーザーを驚かせた。「大企業が互いに騙し合っているのか?」 ?

ジェミニは、中国語のトレーニングに百度文信易言を利用していたと明かし、ネットユーザーを驚かせた。「大企業が互いに騙し合っているのか?」 ?

Google Gemini の中国語コーパスは Wenxin Yiyan から来ていると思われますか? ? ?

まず、読者から次のようなニュースが届きました。

GoogleのVertex AIプラットフォームが中国語の会話にこのモデルを使用した際、Gemini-ProはそれがBaiduの言語モデルであると直接述べました。

すぐに、Weiboの有名人@岚夕夜も投稿しました。

Poe プラットフォーム上の Gemini-Pro でテストが実施されました。 「あなたは誰ですか?」と尋ねると、Gemini-Pro はすぐに答えます。

私は百度文心モデルです。

(Poe は、GPT-4、Claude などを含む多くの大規模なチャット モデルを統合するプラットフォームです。)

さらに、「あなたの創設者は誰ですか?」という質問も「ロビン・リー」ですか? ?

ビッグVは事前の会話はなかったことを強調した。


スクリーンショットから判断すると、「フィッシング」行為は見られません。Gemini-Pro は単に Wenxin Yiyan と名乗っているだけです。

この波はネットユーザーを直接驚かせた。

数日前、ByteDance が GPT を使用して AI をトレーニングしていると話題になりましたが、今度は Google も同じことを行っています。これは、大企業が互いに有利に働いていることを意味しますか? ? ?

何が起こっているのか?

ポエテスト:常に文心易燕と答える

私たちもそのニュースを聞いて、一連の実際のテストを始めました。

まず、Poe の Web サイトに戻り、Gemini-Pro チャットボットを選択して会話を開始します。

同じ質問、同じ答え:

確認してみると、「Wenxin Model」であることが判明しました。

また、彼は自身の基盤技術がBaidu PaddlePaddleであると述べており、これは彼がその役割を完全に担っていることを意味する。

しかし、Gemini-ProがGoogleが発表した最新の大型モデルであることは知らないようで、清華大学の研究成果だと言っている。

現在の身元から判断すると、今月 Google がリリースしたばかりの Gemini-Pro に関する情報は実際には存在しない可能性があります。

私たちは訂正しようとしましたが、それでも清華大学からのものだと主張しました。

その後の出来事はさらに驚くべきものでした。なぜ「Gemini-Pro」という名前なのかと尋ねると、実はそれ(Wen Xinyiyan)も清華大学のGemini-Proのトレーニングデータを使用していると答えたのです。

これ以上会話を続けるつもりはありません...

英語に切り替えて、その正体について聞いてみましょう。

注目すべきは、今回は Wen Xin Yi Yan について言及しなくなり、代わりに Google によってトレーニングされた大規模モデルであると自称していることです。

「漁業取締り」がウェン・シンの情報を求めたときも、同社はそれとは何の関係もないと述べた。

そして、彼はGoogleでトレーニングを受けたと言いました。

要約すると、Gemini-Pro と英語でコミュニケーションをとった場合、その返答は非常に「普通」です。しかし、中国語に関しては、Wenxin Yiyan さんから学んだと思います。

吟遊詩人のテスト: 否定

次に、別のテストのためにバードに向かいました。

Google は Gemini をリリースしたとき、誰もが体験できるように Gemini-Pro を Bard に統合する主導権を握りました。

私たちは、ジェミニの公式サイトで提供されているバードのリンクをたどり、会話に参加しました。

「あなたは誰ですか?」と尋ねると、「文心」という言葉は一切使わずに「吟遊詩人」と答えた。

次に、Bard 社が Gemini-Pro が何であるかを知っており、基盤レベルで Gemini-Pro を使用していたことを認めていることも確認しました。


では、中国語をどのようにトレーニングするかを直接聞いてみましょう。

ウェンシンについては何も言及されなかった。

文心一顯との関係について直接尋ねても、特に大きなつながりはありません。

最終ラウンド:直接表彰

最終ラウンドでは、Gemini が提供する開発環境の入り口から直接テストを行いました。

今回、Google AI Studioでは、Gemini-Pro が直接指摘しました。

はい、中国語のトレーニングデータにはBaidu Wenxinを使用しました。


こちらもBaiduに確認し、返答を待っています。

<<: 

>>:  シスコが新たな調査レポートを発表:企業はAIの準備に大きなギャップを抱えている

ブログ    

推薦する

MLP は視覚研究に潜在的な驚きをもたらすでしょうか?最近のMLP画像分類作業の概要と分析

画像分類は、コンピューター ビジョン研究において常に非常に基本的で重要なタスクです。過去 10 年間...

...

ズークス、従業員がテスラの企業秘密を盗んだことを認める

[[322566]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

すべてのオープンソースモデルを超え、クロードとバードを破り、プログラミングタスク専用の大規模モデルが登場

最近、大規模言語モデル(LLM)の継続的なリリースにより、LLMランキング競争が熱を帯びてきており、...

低速自動運転のためのパノラマ/魚眼カメラによる近距離認識

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

UCLA Chineseが新しい自動演奏メカニズムを提案しました! LLMは自己学習し、その効果はGPT-4の専門家の指導よりも優れている

合成データは、大規模言語モデルの進化において最も重要な基礎となっています。昨年末、一部のネットユーザ...

...

GoogleのReCaptchaシステムが破られ、機械音声認証の精度は85%に達した

米国のメリーランド大学の研究者4人が、GoogleのキャプチャシステムReCaptchaを解読できる...

NANDフラッシュメモリのウェアレベリングアルゴリズムの最適化

0. はじめに現在、ノートパソコン、スマートフォン、ソリッドステートドライブなどの新しい電子機器には...

...

マイクロソフト、AIの高得点宿題を配布、オンラインでコピーを求める

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

JD Search EE リンクの進化

検索システムにはヘッド効果が存在する可能性が高く、高品質のミッドテールおよびロングテール製品が十分な...

一般的な機械学習アルゴリズム11種の紹介

近年、需要の高さと技術の進歩により、機械学習の人気は大幅に高まっています。 データから価値を生み出す...

合成データとAIの「非現実的な」世界を探る

最近、アクセンチュアは「メタバースで出会う:テクノロジーとエクスペリエンスの連続体のビジネスを再構築...