バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。 The Vergeによると: ByteDanceはOpenAIの技術を秘密裏に利用して、独自の大規模言語モデル(LLM)を開発してきた。 このニュースが公表されて間もなく、The Vergeはさらに、OpenAIがByteDanceのアカウントを停止したと報じた。 具体的には、OpenAIの広報担当者Niko Felix氏は次のような声明を発表しました。
ここで言及されている「ルール」とは、OpenAI の利用規約に明確に規定されている条項を指し、OpenAI が提供するモデル機能は「自社の製品やサービスと競合する AI モデルの開発」に使用することは許可されていないと規定されています。 ByteDanceはMicrosoftを通じてOpenAIのアクセス権を購入したとされているが、MicrosoftもOpenAIと同様の方針を策定した。 The Vergeは、バイトダンスのアカウントを停止するためにOpenAIと同じ措置を取るかどうかについてマイクロソフトとさらに協議中だと述べた。 それで、この盗作スキャンダルは一体何が起きているのでしょうか? 内部文書が暴露されるThe Vergeによると、証拠はByteDanceの内部文書、つまり海外版Feishu Larkのチャット記録から得られたものだという。 この文書は、ByteDanceが「Project Seed」というコードネームの基本的な大規模言語モデルプロジェクトのほぼすべての開発段階(モデルのトレーニングや評価を含む)でOpenAIのAPIに依存していることを示しています。 「Seed Project」は約1年前に立ち上げられ、現在は主に2つの製品を開発しています。1つは中国で発売された「Doubao」、もう1つは現在開発中の商用ユーザー向けチャットボットプラットフォームです。 「Seedプロジェクト」に参加した従業員は、OpenAI APIへの過度の依存がもたらす結果を十分認識していたため、 「データ感度低下」を通じて証拠を美化する方法について議論を始めたという。 従業員が OpenAI API の最大アクセス制限に達することが頻繁にあるほどです。 具体的には、ByteDanceは「Seedプロジェクト」の初期段階でOpenAIの技術をより多く活用しました。 The Vergeは、内部文書に基づき、ByteDanceが数か月前に「モデル開発のどの段階でもGPT生成テキストの使用を停止する」よう命令を出したと報じた。 しかし、ByteDanceが独自の大規模言語モデルDoubaoをリリースしたのもこの頃でした。 しかし、The Vergeは、この時点でもByteDanceは規制違反をやめていないと報じている。
また、バイトダンスの内部状況について直接情報を持つ人物は次のように指摘した。 彼らはすべてが合法であることを確認したいと言いますが、実際には捕まりたくないだけなのです。 バイトダンスは反応したThe Vergeがこの報道を発表した後、バイトダンスの広報担当ジョディ・セス氏は次のように反応した。 GPTによって生成されたデータは、Seedプロジェクトの初期開発中にモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されました。 ByteDance は、GPT API を使用するために Microsoft から許可を取得しました。 当社は中国以外の市場では GPT を使用して製品をサポートしていますが、中国市場では Doubao をサポートするために独自のモデルを使用しています。 マイクロソフトの広報担当フランク・ショー氏は次のように述べた。
QuantumBitも早急にByteDanceに連絡を取ったが、ByteDanceはまだ正式な返答をしていない。 |
<<: 有名人のリアルタイムディープフェイク!名前を入力して数秒で顔を変える
編集者注: 「水は船を運ぶこともできるが、転覆させることもできる。」この古いことわざは、誰もが知って...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
GenAI は人間に取って代わるのではなく、熟練労働者、つまり GenAI を管理し最大限に活用する...
[[390356]]ポジティブなゲーム体験を生み出すために、ゲームデザイナーはゲーム内のバランスを繰...
著者についてCtrip アルゴリズムの専門家であるライアンは、パーソナライズされた推奨事項、スマート...
機械学習の応用は急速に成長しており、医療、電子商取引、銀行業務などのさまざまな分野で不可欠な要素とな...
エンタープライズ テクノロジーの将来は、業界を変えるほどの大きな革新をもたらすでしょう。 5G から...
この記事の目的は、現在の機械学習アルゴリズムの実用的かつ簡潔な一覧を提供することです。この記事の内容...
近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...