バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。

The Vergeによると:

ByteDanceはOpenAIの技術を秘密裏に利用して、独自の大規模言語モデル(LLM)を開発してきた。

このニュースが公表されて間もなく、The Vergeはさらに、OpenAIがByteDanceのアカウントを停止したと報じた。

具体的には、OpenAIの広報担当者Niko Felix氏は次のような声明を発表しました。

ByteDance による弊社 API の使用は最小限ですが、さらに調査を進める間、同社のアカウントを停止しました。

利用方法が規則に違反していることが判明した場合、必要な変更をお願いしたり、アカウントを停止したりすることがあります。

ここで言及されている「ルール」とは、OpenAI の利用規約に明確に規定されている条項を指し、OpenAI が提供するモデル機能は「自社の製品やサービスと競合する AI モデルの開発」に使用することは許可されていないと規定されています。

ByteDanceはMicrosoftを通じてOpenAIのアクセス権を購入したとされているが、MicrosoftもOpenAIと同様の方針を策定した。

The Vergeは、バイトダンスのアカウントを停止するためにOpenAIと同じ措置を取るかどうかについてマイクロソフトとさらに協議中だと述べた。

それで、この盗作スキャンダルは一体何が起きているのでしょうか?

内部文書が暴露される

The Vergeによると、証拠はByteDanceの内部文書、つまり海外版Feishu Larkのチャット記録から得られたものだという。

この文書は、ByteDanceが「Project Seed」というコードネームの基本的な大規模言語モデルプロジェクトのほぼすべての開発段階(モデルのトレーニングや評価を含む)でOpenAIのAPIに依存していることを示しています。

「Seed Project」は約1年前に立ち上げられ、現在は主に2つの製品を開発しています。1つは中国で発売された「Doubao」、もう1つは現在開発中の商用ユーザー向けチャットボットプラットフォームです。

「Seedプロジェクト」に参加した従業員は、OpenAI APIへの過度の依存がもたらす結果を十分認識していたため、 「データ感度低下」を通じて証拠を美化する方法について議論を始めたという。

従業員が OpenAI API の最大アクセス制限に達することが頻繁にあるほどです。

具体的には、ByteDanceは「Seedプロジェクト」の初期段階でOpenAIの技術をより多く活用しました。

The Vergeは、内部文書に基づき、ByteDanceが数か月前に「モデル開発のどの段階でもGPT生成テキストの使用を停止する」よう命令を出したと報じた。

しかし、ByteDanceが独自の大規模言語モデルDoubaoをリリースしたのもこの頃でした。

しかし、The Vergeは、この時点でもByteDanceは規制違反をやめていないと報じている。

ByteDanceは、Doubaoの背後にあるモデルのパフォーマンスを評価するなど、OpenAIとMicrosoftの利用規約に違反する方法でAPIを使い続けています。

また、バイトダンスの内部状況について直接情報を持つ人物は次のように指摘した。

彼らはすべてが合法であることを確認したいと言いますが、実際には捕まりたくないだけなのです。

バイトダンスは反応した

The Vergeがこの報道を発表した後、バイトダンスの広報担当ジョディ・セス氏は次のように反応した。

GPTによって生成されたデータは、Seedプロジェクトの初期開発中にモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されました。

ByteDance は、GPT API を使用するために Microsoft から許可を取得しました。

当社は中国以外の市場では GPT を使用して製品をサポートしていますが、中国市場では Doubao をサポートするために独自のモデルを使用しています

マイクロソフトの広報担当フランク・ショー氏は次のように述べた。

Azure OpenAI サービスなどの Microsoft AI ソリューションは、当社の限定アクセス フレームワークの一部であるため、すべての顧客が Microsoft に申請して承認を受ける必要があります。

また、当社は標準を開発し、お客様がこれらのテクノロジーを責任を持って、当社の利用規約に従って使用できるようにするためのリソースも提供しています。

当社では不正行為を検出するためのプロセスを導入しており、行動規範に違反する企業を特定した場合は、その企業のアクセスを停止します。

QuantumBitも早急にByteDanceに連絡を取ったが、ByteDanceはまだ正式な返答をしていない。

<<:  有名人のリアルタイムディープフェイク!名前を入力して数秒で顔を変える

>>: 

ブログ    
ブログ    

推薦する

2020年に会話型AIはどのように発展するでしょうか?

会話型 AI は今日のイノベーションに不可欠な要素であり、多くの企業のビジネスを変革するでしょう。 ...

なぜ男性ロボットの方がユーザーに人気があるのでしょうか?その魅力は何でしょうか? 3つの特徴が鍵となる

人類が科学技術の時代に入り、初期の単純な産業時代から複雑で多面的なハイテク産業時代へと進化して数百年...

アルゴリズムは AI の進歩の原動力となることができるでしょうか?

2006年以降、ディープラーニングに代表される機械学習アルゴリズムは、マシンビジョンや音声認識など...

AI分野で世界で最も影響力のある機関トップ100のランキング、中国の機関6つがランクイン

[[243888]]現在、「人工知能」という言葉は主要メディアプラットフォームで頻繁に登場し、注目を...

...

ボストンスポットのミニバージョンを実現するための 3000 行のコード: 殺せないゴキブリになりたい!

ボストンのロボット犬はしばらく前から販売されているが、価格は少々魅力的ではない。インターネット上には...

製造業における人工知能の活用事例トップ10

世界経済の礎である製造業は、人工知能 (AI) が推進する技術革命の最前線にあります。この記事では、...

ガートナー: 2024 年の主要な戦略的テクノロジー トレンド

2024 年までに、AI は企業で主流となり、クラウド サービス、セキュリティ、持続可能性も影響力を...

ニューラルネットワークはなぜそれほど強力なのでしょうか?

普遍近似定理ニューラル ネットワークは非常に強力であることが知られており、ほぼすべての統計学習問題を...

ChatGPT Civilization Simulator が再びオンラインになりました!クリックひとつで、火山噴火の日の古代都市ポンペイにタイムスリップ

GPT-4のアップデート機能により、AIを使って歴史をシミュレートすることは、単なる「テキストロール...

メタバース+AIとデータの未来は明るい

私たちは現在、拡張現実 (AR) と仮想現実 (VR) によって実現される新しい体験によって勢いを増...

データ + 進化的アルゴリズム = データ駆動型進化的最適化?進化的アルゴリズムと数学的最適化

データ駆動型進化的最適化とは何ですか? それは単なるデータ + 最適化アルゴリズムですか? データ駆...

火星探査車「パーセベランス」の火星着陸における人工知能の応用

2月18日に火星への着陸に成功したNASAの火星探査車パーサヴィアランスは、火星での2年間の探査ミッ...

コンピュータービジョンとは何ですか?

映画『マトリックス リザレクション』(2021年)では、主人公のネオがコンピューター生成の世界「マト...