OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI はおそらく歴史上最も困難な AI 著作権訴訟に直面している。

原告のニューヨーク・タイムズは、22万ページに及ぶ添付書類を添えた訴状を地元の裁判所に提出した。

あるセクションには、ChatGPT の出力がニューヨーク タイムズのニュース コンテンツとほぼ同じであることを示す確固たる証拠が 100 個もリストされています。

このニュースはすぐにネットワーク全体の注目を集め、OpenAI を驚かせました。広報担当者は、これは事実だと答え、「状況がこのように発展するとは予想していませんでした」と述べました。

驚きと失望にもかかわらず、彼らは「他の多くの出版社と行ってきたように、相互に有益な協力方法を見つけることを期待している」とも述べた。

マイクロソフトも訴えられている。おそらく今回は、他の出版社の場合のように簡単に訴訟を放棄することはできないだろう。

TechCrunchによると、ニューヨーク・タイムズはOpenAIとマイクロソフトに対し、著作権を侵害する素材を含むモデルとトレーニングデータを破棄し、ニューヨーク・タイムズの独自かつ貴重な作品の違法なコピーと使用に関連する「法定および実際の損害賠償金として数十億ドル」の責任を負うよう求めた。

ニューヨーク・タイムズは、知的財産権紛争で生成AI企業を訴えた最初の出版社ではないが、強力な証拠と強力な法務チームを擁し、これまでこうした訴訟に参加した最大規模の出版社の一つである。

ネットユーザーらは「AI侵害の画期的な事例を目撃する」ことも呼びかけた。

別の弁護士である@Cecilia Ziniti氏も、訴状を詳細に分析した後、「これは、生成AIを侵害で訴えるこれまでの最良のケースだ」と述べた。

この場合、何に注目する価値があるか見てみましょう。

「AI侵害の画期的な事例となる可能性がある」

セシリア・ジニティ氏は、この件で OpenAI にとって不利ないくつかの重要な点を分析しました。

  • ニューヨークタイムズの記事が AI のトレーニングに使用できる単一のデータセットを構成しているという証拠があります。
  • 証拠は十分であり、視覚的に明確で目を引くものである。
  • ニューヨークタイムズの詳細な記事は創造性を反映しています。
  • 訴訟では、OpenAI は営利志向の企業である一方、ジャーナリズム業界は一定の公共福祉の性質を持っていると説明されている。
  • モデルは幻覚を起こし、偽のニュースを捏造します。
  • 強力な弁護士チーム。

これらについて一つずつ詳しく説明しましょう。

まず、訴状には著作権侵害の主張が明確に記載されており、 ChatGPT の成果物とニューヨーク タイムズの記事との間の「アクセスと実質的な類似性」が強調されています。

重要な事実:ニューヨーク タイムズの記事は、インターネット データをスクレイピングするためのオープン プラットフォームであるCommon Crawl から GPT をトレーニングするために使用された最大の単一の独自データセットです。

第二に、訴状に記載されている盗作の証拠は視覚的に極めて明確で目を引くものである。 GPT によって生成された新しい単語は黒でマークされ、コピーされたテキストは赤でマークされます。このコントラストは陪審員の判断に影響を与える可能性があります。

セシリア・ジニティ氏は個人的に、OpenAIが指示を大幅に変更せず、法廷で技術的原理を詳細に説明しなければ、同社がこの行為を弁護するのは非常に困難になると考えている。

彼女の意見では、OpenAI にとって、裁判ではなく和解を選択する方がより合理的なアプローチとなるだろう。

さらに、OpenAIにとって不利な点として、今回の訴訟の原告がニューヨーク・タイムズ紙であり、記事そのものだけでなく、独創性や創作プロセスも問題となっていることが挙げられます。

訴状にあるように、タクシーローンに関する徹底的な暴露など、ニューヨーク・タイムズの徹底的な調査報道は労働の成果であるだけでなく、核心的な創造性を反映している。

重要な点は、著作権は努力そのものではなく、イノベーションを保護するということです

タクシーの記事にある600件のインタビューは確かに印象的ですが、法的な観点から見ると、より重要なのは報告アプローチの革新性です。これは、わずか数行のオープンソースコードしか関係しなかった GitHub Copilot に対する訴訟とはまったく対照的です。

しかし、交渉が失敗すれば、ニューヨーク・タイムズは莫大な損失を被る可能性がある。

ニューヨーク・タイムズは4月にOpenAIとの交渉を試みたが失敗し、OpenAIは合意に達することを拒否したと言われている。特にOpenAIの利益増大や同様の訴訟の増加を考えると、その金額は莫大なものになる可能性が高い。

セシリア・ジニティ氏の大胆な推測では、OpenAI は 7 桁から 8 桁の金額でこの問題を解決できると考えていた可能性があるという。しかし、ニューヨーク・タイムズが求めているのは、より高い報酬と継続的な著作権収入なのかもしれない。

この苦情では、OpenAI が営利を追求する閉鎖的な企業であるとも描写されており、この点はジャーナリズムの公共心との対比によって強調されている。

苦情には、取締役会とサム・アルトマン氏との間の論争についても言及されている。

セシリア・ジニティは、この物語は著作権の社会的価値と技術革新の間のトレードオフを探求しているため、法廷で非常に大きな影響力を持つ可能性があると主張している。

もう一つの非常に重要なポイントは、モデルの錯覚です。

訴状では幻覚が紹介され、それを根拠にニューヨーク・タイムズの記事から捏造された要素を引用している。

最も印象的な例の 1 つとして、Bing は、オレンジ ジュースがリンパ腫を引き起こすという記事をニューヨーク タイムズが掲載したと主張しました。

最後に注目すべき点が 1 つあります。ニューヨーク タイムズは非常に優秀な法務チームを雇用しています。 Susman Godfrey LLP は、挑戦的なテクノロジー企業において卓越した評判と豊富な経験を誇ります。

この訴訟は、ChatGPT がリリースされてから 1 週間後に提起された訴訟のような利益追求型の訴訟ではなく、戦略的な法的挑戦です。

さらに、より多くのネットユーザーが訴訟に関連するコンテンツを追加しました。例えば、米国のデジタルメディアエージェンシーDCNのCEO、ジェイソン・キント氏は次のように指摘した。

マイクロソフトも明らかに同じです。この文書には、ニューヨークタイムズの記事からそのままコピーされたコンテンツの例が示されています。

これは、Microsoft 独自の検索エンジンを使用した検索比較です。コンテンツの重複の処理の違いはすぐに明らかであり、議論の余地はありません。

ウォートン校のイーサン・モリック教授も次のように指摘している。

トレーニング データと出力結果の複雑な関係は、OpenAI に対するニューヨーク タイムズの訴訟で明らかになっています。 ChatGPT は、有名なニューヨークタイムズの記事の正確な内容を再現できる一方で、ChatGPT には誤った記事や誤った記事を生成する可能性があることも指摘しています。

数十億ドルの責任

冒頭で述べたように、ニューヨーク・タイムズは賠償額がいくらなのか直接言及しなかったものの、OpenAIとマイクロソフトが「数十億ドルの法的損害と実際の損害」に対して責任を負うことになるだろうと示唆した。

では、これらの損失はどこから来るのでしょうか?

ニューヨーク・タイムズは、AIが自社の記事の内容を再現するのは著作権料ほど単純なことではないと指摘し、「OpenAIとマイクロソフトは実際にニューヨーク・タイムズの成果を利用して、ニュース出版社の競争相手を構築している」と述べた。

AIはサブスクリプションベースの情報を提供するだけでなく、適切に引用されないことが多く、商業的な利益のために利用されることもあり、ニューヨークタイムズが手数料を得るために使用する関連リンクを削除することもあります。

これはニューヨークタイムズにとって直接的な損失です。

さらに、モデルは誤った情報を提供するため、ブランドに影響を与え、大きな損失にもなります。

今回、OpenAIとMicrosoft AIが権利を侵害したという確固たる証拠があるようです。しかし、OSSキャピタルの創設パートナーであり知的財産顧問のヘザー・ミーカー氏は、ニューヨーク・タイムズがこの訴訟に勝つ可能性は低いと指摘した。

彼は、苦情の中で、ChatGPT が 2012 年のレストランレビュー記事の内容を再現するために使用された例を指摘しました。ユーザーはまず ChatGPT にレビューの最初の段落について質問し、次に次の文について質問します。

ミーカー氏は、 AIに元の入力内容を繰り返すように誘導することは、侵害の合理的な根拠にはならないと考えています。ユーザーが意図的に AI にコンテンツをコピーさせた場合、その責任はユーザーにあります。

「だからこそ、このような訴訟のほとんどは失敗する可能性が高いのです。」

もう一つ

OpenAIとMicrosoftがデータをめぐって訴訟を起こしている一方で、Appleは問題を解決するために金銭を支払っているだけだ。

Appleは最近、大手出版社数社と合意に達し、同社のコンテンツデータをAIのトレーニングに利用できるようになると報じられている。

アップルはまた、長期契約を締結したいとしており、提案されている取引額は少なくとも3億5,700万ドルとなる。

「AppleGPT」と呼ばれるモデルは社内でテスト中と言われており、来年のSiriの新バージョンに導入される可能性がある。

最近のデータはすごくいいですよね〜

<<:  2024年までにAIがすべての仕事をどう変えるのか

>>:  バイトマルチモーダル大規模モデル PixelLM: SA に頼らない効率的なピクセルレベル推論

推薦する

...

...

2年後には「ロボット」が人間の活動の80%以上をこなすようになるのでしょうか? AIに関する専門家の見解を聞く

写真:人工知能カンファレンスフォーラム 撮影:新民晩報主任記者 劉欣 「私は生産性を変革し、新しい...

アマゾンが新しいAlexa音声アシスタントをリリース、よりスマートで自然な会話

9月21日のニュース、水曜日、アマゾンは毎年恒例の新製品発表会で、生成型人工知能技術を統合した一連の...

...

機械学習による建物のエネルギー効率の向上

エネルギー効率などの複雑な建物の問題を、人間の介入なしに解決するにはどうすればよいでしょうか。建物の...

...

OpenAIに勝る完璧な埋め込みモデルであるNomic Embedが、重み、データ、コードがすべてオープンソースで利用可能になりました。

1週間前、OpenAIはユーザーに特典を配布しました。GPT-4が怠惰になる問題を修正した後、より...

カスタマー サービス チーム向けの人工知能と機械学習ツール

どのビジネスリーダーも、顧客サービスがビジネスの最優先事項になっていることを認めるでしょう。同社は、...

IoTが発展するために機械学習が必要な理由

ビッグデータや人工知能などのテクノロジーがもたらす機会と脅威、そしてその将来に対する懸念については、...

機械学習の収益は2023年までに803億ドルに達すると予想されている

機械学習を活用したソリューションとプロセスは、医療、情報技術 (IT)、農業、教育、エレクトロニクス...

...

...

...

オープン性とクローズ性の戦い: Baidu と Google のどちらの AI プラットフォームが優れているか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...