ロイター通信は12月13日、著作権侵害訴訟の新たな文書によると、メタ・プラットフォームズは何千冊もの海賊版書籍を使ってAIモデルを訓練することには法的リスクがあることを知っていたにもかかわらず、それでもそうすることを主張していたと報じた。 IT Homeによると、この訴訟はコメディアンのサラ・シルバーマン、ピューリッツァー賞受賞者のマイケル・シェイボン、その他の有名作家らが共同で今年の夏に起こした。彼らは、Metaが彼らの作品を許可なく使用して人工知能言語モデルLlamaのトレーニングを行ったと訴えた。この訴訟は今週、別の同様の訴訟と統合された。 先月、カリフォルニア州の判事はシルバーマン氏の訴訟の一部を却下したが、著者が訴訟を修正することを認めると述べた。新たな苦情には、Meta の研究者が Discord チャット サーバー上でデータセットの入手について話し合っているチャット記録が含まれており、これは Meta が書籍の使用に伴う潜在的な著作権リスクを認識していたことを示す重要な証拠となる可能性がある。チャットログの会話を見ると、海賊版書籍を使用して AI モデルをトレーニングすることの法的リスクについて話し合っていたことがわかる。その中で、Metaの研究者であるティム・デトマーズ氏は、 Metaの法務部門の弁護士が、これらの書籍をAIモデルのトレーニングに使用した場合、法的問題が生じる可能性があると述べたと述べています。弁護士らは、そのデータを使用することはできず、また、たとえ使用されたとしてもそのモデルは公表できないと述べた。 今年、いくつかのテクノロジー企業は、生成AIモデルの構築時に著作権を侵害したとしてコンテンツ制作者から同様の申し立てに直面している。 これらの訴訟が成功すれば、AI モデルの構築コストが増加し、AI 企業がアーティスト、著者、その他のコンテンツ作成者に作品の使用料を支払わざるを得なくなる可能性があり、生成 AI の開発に悪影響を及ぼす可能性があります。 一方、人工知能に関する欧州連合の新たな暫定規則により、企業はモデルのトレーニングに使用するデータを開示するよう強制される可能性があり、より大きな法的リスクにさらされる可能性がある。 Metaは今年2月にLlama大規模言語モデルの最初のバージョンをリリースし、「ThePile」データセットの「Books3」部分を含む、トレーニングに使用されるデータセットのリストを発表しました。訴訟によれば、データセットの作成者は、データセットには196,640冊の本が含まれていると主張した。同社は、今夏に商用ユーザー向けに提供を開始した最新モデル「ラマ2」のトレーニングデータを公開しなかった。 |
>>: 製造業におけるロボット:脅威か、それともチャンスか?
[[216696]]一般的に言えば、未来そのものを予測することは難しいため、技術動向を明確に予測す...
今日、言語を超えた効果的なコミュニケーションはこれまで以上に重要になっています。企業が新しい市場に進...
10月16日、既存の大規模言語モデルをさまざまなユーザーニーズに合わせて修正することで、関連モデルの...
実際、AI と ML はほとんどの人間によるやりとりを置き換えつつあります。市場にはチャットボットや...
インターネットとモバイルインターネット時代の「ビジネスモデルの革新」がもたらす投資配当は、マクロ経済...
計算能力、データ、アルゴリズムは、現代の機械学習 (ML) の進歩を導く 3 つの基本的な要素です。...
[[187107]]人工知能技術は飛躍的に進歩していますが、人工知能間のコミュニケーションの問題は...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
新しいGTAゲームの予告編を見ましたか?この予告編は3つのギネス世界記録を破り、再生回数は1億回を超...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
2025年までに、世界中に約750億個のIoTデバイスが存在すると予想されています。スマートデバイス...