ロイター通信は12月13日、著作権侵害訴訟の新たな文書によると、メタ・プラットフォームズは何千冊もの海賊版書籍を使ってAIモデルを訓練することには法的リスクがあることを知っていたにもかかわらず、それでもそうすることを主張していたと報じた。 IT Homeによると、この訴訟はコメディアンのサラ・シルバーマン、ピューリッツァー賞受賞者のマイケル・シェイボン、その他の有名作家らが共同で今年の夏に起こした。彼らは、Metaが彼らの作品を許可なく使用して人工知能言語モデルLlamaのトレーニングを行ったと訴えた。この訴訟は今週、別の同様の訴訟と統合された。 先月、カリフォルニア州の判事はシルバーマン氏の訴訟の一部を却下したが、著者が訴訟を修正することを認めると述べた。新たな苦情には、Meta の研究者が Discord チャット サーバー上でデータセットの入手について話し合っているチャット記録が含まれており、これは Meta が書籍の使用に伴う潜在的な著作権リスクを認識していたことを示す重要な証拠となる可能性がある。チャットログの会話を見ると、海賊版書籍を使用して AI モデルをトレーニングすることの法的リスクについて話し合っていたことがわかる。その中で、Metaの研究者であるティム・デトマーズ氏は、 Metaの法務部門の弁護士が、これらの書籍をAIモデルのトレーニングに使用した場合、法的問題が生じる可能性があると述べたと述べています。弁護士らは、そのデータを使用することはできず、また、たとえ使用されたとしてもそのモデルは公表できないと述べた。 今年、いくつかのテクノロジー企業は、生成AIモデルの構築時に著作権を侵害したとしてコンテンツ制作者から同様の申し立てに直面している。 これらの訴訟が成功すれば、AI モデルの構築コストが増加し、AI 企業がアーティスト、著者、その他のコンテンツ作成者に作品の使用料を支払わざるを得なくなる可能性があり、生成 AI の開発に悪影響を及ぼす可能性があります。 一方、人工知能に関する欧州連合の新たな暫定規則により、企業はモデルのトレーニングに使用するデータを開示するよう強制される可能性があり、より大きな法的リスクにさらされる可能性がある。 Metaは今年2月にLlama大規模言語モデルの最初のバージョンをリリースし、「ThePile」データセットの「Books3」部分を含む、トレーニングに使用されるデータセットのリストを発表しました。訴訟によれば、データセットの作成者は、データセットには196,640冊の本が含まれていると主張した。同社は、今夏に商用ユーザー向けに提供を開始した最新モデル「ラマ2」のトレーニングデータを公開しなかった。 |
>>: 製造業におけるロボット:脅威か、それともチャンスか?
[[347833]]近年、人工知能は急速に発展し、新たな科学技術革命と産業変革を主導する中核的な原動...
米国のボルチモア市で検討されている条例は、民間人だけでなく法執行機関や政府機関による顔認識技術の購入...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
導入人工知能(AI)の急速な発展により、AIは多くの業界、特に情報セキュリティの分野で重要なツールと...
この熱光起電力セルは、太陽電池パネルに似ており、白熱熱源から高エネルギー光子を受動的に捕捉し、電気に...
1. 背景GPTなどの大規模モデルの登場後、言語モデルのTransformer +自己回帰モデリング...
機械学習の基本的な概念を説明するとき、私はいつも限られた数の図に戻ってしまいます。以下は、私が最も啓...
今日、現代科学技術の出現と発展、そしてさまざまなインテリジェント技術の登場により、人類の宇宙旅行はよ...