OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI はおそらく歴史上最も困難な AI 著作権訴訟に直面している。

原告のニューヨーク・タイムズは、22万ページに及ぶ添付書類を添えた訴状を地元の裁判所に提出した。

あるセクションには、ChatGPT の出力がニューヨーク タイムズのニュース コンテンツとほぼ同じであることを示す確固たる証拠が 100 個もリストされています。

このニュースはすぐにネットワーク全体の注目を集め、OpenAI を驚かせました。広報担当者は、これは事実だと答え、「状況がこのように発展するとは予想していませんでした」と述べました。

驚きと失望にもかかわらず、彼らは「他の多くの出版社と行ってきたように、相互に有益な協力方法を見つけることを期待している」とも述べた。

マイクロソフトも訴えられている。おそらく今回は、他の出版社の場合のように簡単に訴訟を放棄することはできないだろう。

TechCrunchによると、ニューヨーク・タイムズはOpenAIとマイクロソフトに対し、著作権を侵害する素材を含むモデルとトレーニングデータを破棄し、ニューヨーク・タイムズの独自かつ貴重な作品の違法なコピーと使用に関連する「法定および実際の損害賠償金として数十億ドル」の責任を負うよう求めた。

ニューヨーク・タイムズは、知的財産権紛争で生成AI企業を訴えた最初の出版社ではないが、強力な証拠と強力な法務チームを擁し、これまでこうした訴訟に参加した最大規模の出版社の一つである。

ネットユーザーらは「AI侵害の画期的な事例を目撃する」ことも呼びかけた。

別の弁護士である@Cecilia Ziniti氏も、訴状を詳細に分析した後、「これは、生成AIを侵害で訴えるこれまでの最良のケースだ」と述べた。

この場合、何に注目する価値があるか見てみましょう。

「AI侵害の画期的な事例となる可能性がある」

セシリア・ジニティ氏は、この件で OpenAI にとって不利ないくつかの重要な点を分析しました。

  • ニューヨークタイムズの記事が AI のトレーニングに使用できる単一のデータセットを構成しているという証拠があります。
  • 証拠は十分であり、視覚的に明確で目を引くものである。
  • ニューヨークタイムズの詳細な記事は創造性を反映しています。
  • 訴訟では、OpenAI は営利志向の企業である一方、ジャーナリズム業界は一定の公共福祉の性質を持っていると説明されている。
  • モデルは幻覚を起こし、偽のニュースを捏造します。
  • 強力な弁護士チーム。

これらについて一つずつ詳しく説明しましょう。

まず、訴状には著作権侵害の主張が明確に記載されており、 ChatGPT の成果物とニューヨーク タイムズの記事との間の「アクセスと実質的な類似性」が強調されています。

重要な事実:ニューヨーク タイムズの記事は、インターネット データをスクレイピングするためのオープン プラットフォームであるCommon Crawl から GPT をトレーニングするために使用された最大の単一の独自データセットです。

第二に、訴状に記載されている盗作の証拠は視覚的に極めて明確で目を引くものである。 GPT によって生成された新しい単語は黒でマークされ、コピーされたテキストは赤でマークされます。このコントラストは陪審員の判断に影響を与える可能性があります。

セシリア・ジニティ氏は個人的に、OpenAIが指示を大幅に変更せず、法廷で技術的原理を詳細に説明しなければ、同社がこの行為を弁護するのは非常に困難になると考えている。

彼女の意見では、OpenAI にとって、裁判ではなく和解を選択する方がより合理的なアプローチとなるだろう。

さらに、OpenAIにとって不利な点として、今回の訴訟の原告がニューヨーク・タイムズ紙であり、記事そのものだけでなく、独創性や創作プロセスも問題となっていることが挙げられます。

訴状にあるように、タクシーローンに関する徹底的な暴露など、ニューヨーク・タイムズの徹底的な調査報道は労働の成果であるだけでなく、核心的な創造性を反映している。

重要な点は、著作権は努力そのものではなく、イノベーションを保護するということです

タクシーの記事にある600件のインタビューは確かに印象的ですが、法的な観点から見ると、より重要なのは報告アプローチの革新性です。これは、わずか数行のオープンソースコードしか関係しなかった GitHub Copilot に対する訴訟とはまったく対照的です。

しかし、交渉が失敗すれば、ニューヨーク・タイムズは莫大な損失を被る可能性がある。

ニューヨーク・タイムズは4月にOpenAIとの交渉を試みたが失敗し、OpenAIは合意に達することを拒否したと言われている。特にOpenAIの利益増大や同様の訴訟の増加を考えると、その金額は莫大なものになる可能性が高い。

セシリア・ジニティ氏の大胆な推測では、OpenAI は 7 桁から 8 桁の金額でこの問題を解決できると考えていた可能性があるという。しかし、ニューヨーク・タイムズが求めているのは、より高い報酬と継続的な著作権収入なのかもしれない。

この苦情では、OpenAI が営利を追求する閉鎖的な企業であるとも描写されており、この点はジャーナリズムの公共心との対比によって強調されている。

苦情には、取締役会とサム・アルトマン氏との間の論争についても言及されている。

セシリア・ジニティは、この物語は著作権の社会的価値と技術革新の間のトレードオフを探求しているため、法廷で非常に大きな影響力を持つ可能性があると主張している。

もう一つの非常に重要なポイントは、モデルの錯覚です。

訴状では幻覚が紹介され、それを根拠にニューヨーク・タイムズの記事から捏造された要素を引用している。

最も印象的な例の 1 つとして、Bing は、オレンジ ジュースがリンパ腫を引き起こすという記事をニューヨーク タイムズが掲載したと主張しました。

最後に注目すべき点が 1 つあります。ニューヨーク タイムズは非常に優秀な法務チームを雇用しています。 Susman Godfrey LLP は、挑戦的なテクノロジー企業において卓越した評判と豊富な経験を誇ります。

この訴訟は、ChatGPT がリリースされてから 1 週間後に提起された訴訟のような利益追求型の訴訟ではなく、戦略的な法的挑戦です。

さらに、より多くのネットユーザーが訴訟に関連するコンテンツを追加しました。例えば、米国のデジタルメディアエージェンシーDCNのCEO、ジェイソン・キント氏は次のように指摘した。

マイクロソフトも明らかに同じです。この文書には、ニューヨークタイムズの記事からそのままコピーされたコンテンツの例が示されています。

これは、Microsoft 独自の検索エンジンを使用した検索比較です。コンテンツの重複の処理の違いはすぐに明らかであり、議論の余地はありません。

ウォートン校のイーサン・モリック教授も次のように指摘している。

トレーニング データと出力結果の複雑な関係は、OpenAI に対するニューヨーク タイムズの訴訟で明らかになっています。 ChatGPT は、有名なニューヨークタイムズの記事の正確な内容を再現できる一方で、ChatGPT には誤った記事や誤った記事を生成する可能性があることも指摘しています。

数十億ドルの責任

冒頭で述べたように、ニューヨーク・タイムズは賠償額がいくらなのか直接言及しなかったものの、OpenAIとマイクロソフトが「数十億ドルの法的損害と実際の損害」に対して責任を負うことになるだろうと示唆した。

では、これらの損失はどこから来るのでしょうか?

ニューヨーク・タイムズは、AIが自社の記事の内容を再現するのは著作権料ほど単純なことではないと指摘し、「OpenAIとマイクロソフトは実際にニューヨーク・タイムズの成果を利用して、ニュース出版社の競争相手を構築している」と述べた。

AIはサブスクリプションベースの情報を提供するだけでなく、適切に引用されないことが多く、商業的な利益のために利用されることもあり、ニューヨークタイムズが手数料を得るために使用する関連リンクを削除することもあります。

これはニューヨークタイムズにとって直接的な損失です。

さらに、モデルは誤った情報を提供するため、ブランドに影響を与え、大きな損失にもなります。

今回、OpenAIとMicrosoft AIが権利を侵害したという確固たる証拠があるようです。しかし、OSSキャピタルの創設パートナーであり知的財産顧問のヘザー・ミーカー氏は、ニューヨーク・タイムズがこの訴訟に勝つ可能性は低いと指摘した。

彼は、苦情の中で、ChatGPT が 2012 年のレストランレビュー記事の内容を再現するために使用された例を指摘しました。ユーザーはまず ChatGPT にレビューの最初の段落について質問し、次に次の文について質問します。

ミーカー氏は、 AIに元の入力内容を繰り返すように誘導することは、侵害の合理的な根拠にはならないと考えています。ユーザーが意図的に AI にコンテンツをコピーさせた場合、その責任はユーザーにあります。

「だからこそ、このような訴訟のほとんどは失敗する可能性が高いのです。」

もう一つ

OpenAIとMicrosoftがデータをめぐって訴訟を起こしている一方で、Appleは問題を解決するために金銭を支払っているだけだ。

Appleは最近、大手出版社数社と合意に達し、同社のコンテンツデータをAIのトレーニングに利用できるようになると報じられている。

アップルはまた、長期契約を締結したいとしており、提案されている取引額は少なくとも3億5,700万ドルとなる。

「AppleGPT」と呼ばれるモデルは社内でテスト中と言われており、来年のSiriの新バージョンに導入される可能性がある。

最近のデータはすごくいいですよね〜

<<:  2024年までにAIがすべての仕事をどう変えるのか

>>:  バイトマルチモーダル大規模モデル PixelLM: SA に頼らない効率的なピクセルレベル推論

ブログ    

推薦する

AIベースの顔認識は工場にとって次の技術的マイルストーンとなる

新型コロナウイルス流行の影響で、人工知能(AI)は工場にとって必須のものとなった。 Google の...

Daguan Data: NLP の概要と自動テキスト分類アルゴリズムの詳細な説明

自然言語処理は人工知能の分野で常に重要なトピックであり、2018年も話題となりました。大量のテキスト...

人工知能の「ホットテクノロジー」をどう応用するか

人工知能が詩と連句を作曲、神経医学人工知能研究の最新の進歩、人工知能交通融合認識とデジタルツインソリ...

...

家庭用ロボットを作り、独自の研究開発の道を歩む

ロボットを作ることは私の子供の頃からの夢でした。 2011年に私はハルビン工業大学に入学し、そこが私...

人工知能を使って手作業を置き換え、コストを削減し、効率を高めることは、まさに賢いことだ

「大丈夫ですよ。」 15年間工場で働いてきた「古い」労働者として、今日は人工知能についての私の見解を...

人工知能が物流業界に革命を起こす5つの方法

人工知能は物流業界の変革において重要な役割を果たしていることが証明されています。グローバル化が加速す...

重力波検出からRNAシークエンシングまで、AIが科学的発見を加速させる方法

[[433235]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

...

人工知能は企業の組織化の方法をどのように変えるのでしょうか?

[[184562]]企業への人工知能の浸透はまだ始まったばかりですが、すでにビジネスリーダーたちは...

...

...

マイクロソフトの無料 AI エッセイ採点ソフトウェアがアップグレード: IELTS、CET-4、CET-6 に使用可能

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...