OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

IT Homeは1月10日、ChatGPTの開発元であるOpenAIが最近、ChatGPTのようなAIツールの開発は著作権で保護された素材と切り離せないものであることを認め、これらの素材がなければこれらのツールは生まれなかっただろうと述べたと報じた。デイリー・テレグラフによると、OpenAIは英国貴族院通信・デジタル問題特別委員会の大規模言語モデルに関する調査に提出した文書の中でこの声明を発表した。

ChatGPTや画像ジェネレーターDALL-EなどのAIモデルが強力なのは、膨大な量のコンテンツでトレーニングされているからである。そのコンテンツの一部はインターネット上で公開されているコンテンツから収集されており、必ずしも著作権者の許可を得ているわけではない(OpenAIはトレーニングコンテンツの一部にライセンスを与えている)。この「自由な」クローリング手法は、学術的な機械学習研究において長い歴史がありますが、最近、ディープラーニング AI モデルが商用化されるにつれて、厳しい監視を受けるようになりました。

「現在、著作権はブログ投稿、写真、フォーラム投稿、ソフトウェアコードの一部、政府文書など、人間の表現のほぼすべてをカバーしているため、著作権で保護されたコンテンツを使用せずに今日の主要なAIモデルをトレーニングすることは不可能だ」とOpenAIは貴族院への提出書類で述べた。

OpenAIはさらに、トレーニングデータが「1世紀前の」パブリックドメインの書籍や図面に限定されている場合、「現代の市民のニーズを満たす」AIシステムをトレーニングすることは不可能であると述べた。

IT Homeは、昨年12月にニューヨーク・タイムズがOpenAIとOpenAIの主要投資家であるマイクロソフトを相手取り、同紙のコンテンツを自社製品で許可なく違法に使用したとして訴訟を起こしたことを報じた。 OpenAIは月曜日に自社のウェブサイトでこの訴訟に反応し、訴訟には根拠がないとし、ジャーナリズムと報道機関との提携に対する支持を改めて表明した。

OpenAIの抗弁は主に「フェアユース」という法理に基づいており、これは特定の状況下で著作権者の許可なく著作権で保護されたコンテンツを限定的に使用することを許可するものだ。同社は、著作権法ではそのような素材をAIモデルのトレーニングに使用することを禁止していないと主張している。

「AIモデルのトレーニングにインターネット上で公開されている素材を使うのはフェアユースだという見解は、長年にわたり広く受け入れられてきた前例によって裏付けられている」とOpenAIは月曜日に公開したブログ記事に記した。「この原則はクリエイターにとってフェアであり、イノベーターにとって必要であり、アメリカの競争力にとって極めて重要であると私たちは信じている」

OpenAIがAIトレーニングデータに関してフェアユースの抗弁を主張したのは今回が初めてではない。 8月には、OpenAIはコメディアンのサラ・シルバーマンによる著作権訴訟に対して、フェアユースを理由に公開素材の使用を擁護した。 OpenAIは、このコメディアンが著作権の範囲を「誤解」しており、大規模言語モデルのような最先端のAIイノベーションが発展するために必要な余地を残す「公正使用」などの制限や例外を考慮に入れていなかったと主張した。

<<:  マルチモーダル LLM を自動運転の意思決定者として使用すると、説明可能になります。 SenseTimeの特別なシナリオの純粋なエンドツーエンド処理よりも優れています

>>:  コードコーパス、大規模モデル、インテリジェントエージェントの魔法の杖を振ると、より強力なエネルギーが呼び出されます

ブログ    
ブログ    

推薦する

...

蹴り倒せない!家庭用ヒューマノイドロボットが誕生、価格は9万ドル未満

最近、障害を乗り越えるヒューマノイドロボットのビデオが話題になった。ビデオでは、ヒューマノイドロボッ...

スマートヘルスケアの 6 つの主要な応用分野は何ですか?

スマートヘルスケアで使われる主なAI技術は画像とデータ分析機能ですが、その応用範囲は次の6つを含めて...

...

自律的で制御可能なAIフレームワークは信頼性が高いが、すべてのAIコンピューティングセンターが同等というわけではない

現在、人工知能の発展レベルは、都市の競争力と将来の発展の可能性を測る新たな指標となっている。その結果...

マスク氏:ロボットが雇用を奪い、ユニバーサル・ベーシック・インカムが必須に

億万長者のイーロン・マスク氏は最近、一連のツイートで、ロボットが人間の仕事を奪うなら、政府による普遍...

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索...

大きなモデルには堀がない? OpenAI の「LLM City」に侵入し、防御する方法

著者: ベン・ディクソン翻訳者 | 李睿レビュー | Chonglou制作:51CTO テクノロジー...

2021 年に知っておくべきすべての機械学習アルゴリズム

機械学習に関する知識が増えるにつれて、機械学習アルゴリズムの数も増えました。この記事では、データ サ...

機械学習によって IoT アプリケーションのセキュリティはどのように向上するのでしょうか?

モノのインターネットの世界は手の届くところにありますが、それには良い面と悪い面の両方が伴います。機械...

データセキュリティの向上における人工知能の役割

現在、コンピューティング能力、ストレージ容量、データ収集能力の急速な向上により、人工知能はさまざまな...

ChatGPT は EDR 検出を回避する変異型マルウェアを作成します

ChatGPTは昨年末のリリース以来、世界中で大きな話題を呼んでいます。しかし、消費者やIT専門家の...

...

【機械学習を図解で解説】誰でもわかるアルゴリズムの原理

アルゴリズムの式はかなり面倒で、機械学習は苦痛すぎる。機械学習を初めて学ぶ人は、複雑な数式やわかりに...

ディープラーニングをすぐに始められる、やりがいのあるプロジェクト18選

AlphaGoとイ・セドルの戦いの後、ディープラーニング技術は国内で非常に人気が高まった。多くの技術...