ロイター通信は12月13日、著作権侵害訴訟の新たな文書によると、メタ・プラットフォームズは何千冊もの海賊版書籍を使ってAIモデルを訓練することには法的リスクがあることを知っていたにもかかわらず、それでもそうすることを主張していたと報じた。 IT Homeによると、この訴訟はコメディアンのサラ・シルバーマン、ピューリッツァー賞受賞者のマイケル・シェイボン、その他の有名作家らが共同で今年の夏に起こした。彼らは、Metaが彼らの作品を許可なく使用して人工知能言語モデルLlamaのトレーニングを行ったと訴えた。この訴訟は今週、別の同様の訴訟と統合された。 先月、カリフォルニア州の判事はシルバーマン氏の訴訟の一部を却下したが、著者が訴訟を修正することを認めると述べた。新たな苦情には、Meta の研究者が Discord チャット サーバー上でデータセットの入手について話し合っているチャット記録が含まれており、これは Meta が書籍の使用に伴う潜在的な著作権リスクを認識していたことを示す重要な証拠となる可能性がある。チャットログの会話を見ると、海賊版書籍を使用して AI モデルをトレーニングすることの法的リスクについて話し合っていたことがわかる。その中で、Metaの研究者であるティム・デトマーズ氏は、 Metaの法務部門の弁護士が、これらの書籍をAIモデルのトレーニングに使用した場合、法的問題が生じる可能性があると述べたと述べています。弁護士らは、そのデータを使用することはできず、また、たとえ使用されたとしてもそのモデルは公表できないと述べた。 今年、いくつかのテクノロジー企業は、生成AIモデルの構築時に著作権を侵害したとしてコンテンツ制作者から同様の申し立てに直面している。 これらの訴訟が成功すれば、AI モデルの構築コストが増加し、AI 企業がアーティスト、著者、その他のコンテンツ作成者に作品の使用料を支払わざるを得なくなる可能性があり、生成 AI の開発に悪影響を及ぼす可能性があります。 一方、人工知能に関する欧州連合の新たな暫定規則により、企業はモデルのトレーニングに使用するデータを開示するよう強制される可能性があり、より大きな法的リスクにさらされる可能性がある。 Metaは今年2月にLlama大規模言語モデルの最初のバージョンをリリースし、「ThePile」データセットの「Books3」部分を含む、トレーニングに使用されるデータセットのリストを発表しました。訴訟によれば、データセットの作成者は、データセットには196,640冊の本が含まれていると主張した。同社は、今夏に商用ユーザー向けに提供を開始した最新モデル「ラマ2」のトレーニングデータを公開しなかった。 |
>>: 製造業におけるロボット:脅威か、それともチャンスか?
(1)要素が0から65535までの任意の数値であり、同じ値が繰り返し出現しない整数列。 0 は例外で...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
スマート シティが将来のアイデアだけでなく現実のものとなるにつれ、人工知能 (AI) が台頭してきて...
5G が推進し主導する、デジタル技術変革の新世代が正式に到来しました。今日、インターネットの急速な変...
顔認識技術の応用を標準化するため、2023年8月8日、中国サイバースペース管理局が起草した「顔認識技...
【51CTO.com クイック翻訳】継続的インテグレーション (CI)/継続的デリバリー (CD)...
人工知能 (AI) は、建物の管理と制御の方法に革命をもたらし、これまで以上に効率的でコスト効率の高...
コンピュータが人間を騙して自分は人間だと信じ込ませることができるなら、そのコンピュータは知的であると...
人類の生産性の発展の歴史をみると、肉体労働の時代、機械化の時代、電化の時代、自動化の時代を経て、現在...
ビデオセグメンテーションは、自動運転、ロボット工学、ビデオ編集などのアプリケーションシナリオの基本的...
よりスマートで高速なサービスを求めて、IT 部門は社内のサービス提供を改善するための新しい方法とプロ...