OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

IT Homeは1月10日、ChatGPTの開発元であるOpenAIが最近、ChatGPTのようなAIツールの開発は著作権で保護された素材と切り離せないものであることを認め、これらの素材がなければこれらのツールは生まれなかっただろうと述べたと報じた。デイリー・テレグラフによると、OpenAIは英国貴族院通信・デジタル問題特別委員会の大規模言語モデルに関する調査に提出した文書の中でこの声明を発表した。

ChatGPTや画像ジェネレーターDALL-EなどのAIモデルが強力なのは、膨大な量のコンテンツでトレーニングされているからである。そのコンテンツの一部はインターネット上で公開されているコンテンツから収集されており、必ずしも著作権者の許可を得ているわけではない(OpenAIはトレーニングコンテンツの一部にライセンスを与えている)。この「自由な」クローリング手法は、学術的な機械学習研究において長い歴史がありますが、最近、ディープラーニング AI モデルが商用化されるにつれて、厳しい監視を受けるようになりました。

「現在、著作権はブログ投稿、写真、フォーラム投稿、ソフトウェアコードの一部、政府文書など、人間の表現のほぼすべてをカバーしているため、著作権で保護されたコンテンツを使用せずに今日の主要なAIモデルをトレーニングすることは不可能だ」とOpenAIは貴族院への提出書類で述べた。

OpenAIはさらに、トレーニングデータが「1世紀前の」パブリックドメインの書籍や図面に限定されている場合、「現代の市民のニーズを満たす」AIシステムをトレーニングすることは不可能であると述べた。

IT Homeは、昨年12月にニューヨーク・タイムズがOpenAIとOpenAIの主要投資家であるマイクロソフトを相手取り、同紙のコンテンツを自社製品で許可なく違法に使用したとして訴訟を起こしたことを報じた。 OpenAIは月曜日に自社のウェブサイトでこの訴訟に反応し、訴訟には根拠がないとし、ジャーナリズムと報道機関との提携に対する支持を改めて表明した。

OpenAIの抗弁は主に「フェアユース」という法理に基づいており、これは特定の状況下で著作権者の許可なく著作権で保護されたコンテンツを限定的に使用することを許可するものだ。同社は、著作権法ではそのような素材をAIモデルのトレーニングに使用することを禁止していないと主張している。

「AIモデルのトレーニングにインターネット上で公開されている素材を使うのはフェアユースだという見解は、長年にわたり広く受け入れられてきた前例によって裏付けられている」とOpenAIは月曜日に公開したブログ記事に記した。「この原則はクリエイターにとってフェアであり、イノベーターにとって必要であり、アメリカの競争力にとって極めて重要であると私たちは信じている」

OpenAIがAIトレーニングデータに関してフェアユースの抗弁を主張したのは今回が初めてではない。 8月には、OpenAIはコメディアンのサラ・シルバーマンによる著作権訴訟に対して、フェアユースを理由に公開素材の使用を擁護した。 OpenAIは、このコメディアンが著作権の範囲を「誤解」しており、大規模言語モデルのような最先端のAIイノベーションが発展するために必要な余地を残す「公正使用」などの制限や例外を考慮に入れていなかったと主張した。

<<:  マルチモーダル LLM を自動運転の意思決定者として使用すると、説明可能になります。 SenseTimeの特別なシナリオの純粋なエンドツーエンド処理よりも優れています

>>:  コードコーパス、大規模モデル、インテリジェントエージェントの魔法の杖を振ると、より強力なエネルギーが呼び出されます

ブログ    
ブログ    

推薦する

WeBank AI 主任科学者 NeurIPS の論文で「最新のニューラル ネットワーク盗難防止技術」が明らかに

保護されていないニューラル ネットワークは、誰でも運転できるロックされていない車のようなものです。...

MITはAIを活用して3Dプリント用の新素材の発見を加速

[[430184]]さまざまなアイテムの製造における 3D プリントの人気が高まるにつれ、特定の用途...

人工知能はプログラムを記述するためにコードを「盗む」ほど賢いが、プログラマーは職を失うことを心配する必要はない

人工知能システムはますます賢くなってきています。囲碁をしたり株を取引したりできるだけでなく、今ではコ...

機械は倫理的な判断を下せるのか?

ロボットや機械が下す決定は必ずしも道徳的に正しいとは限りません。テクノロジー企業が機械倫理に注目する...

微調整の必要はありませんか? 3つのサンプル、LLMアライメントを修正するための1つのヒント、エンジニアのヒント:すべて戻る

教師なしテキストコーパスのみで事前トレーニングされた基本的な大規模言語モデル (LLM) は、通常、...

ヨーロッパは大規模な国際顔認識システムを構築中

過去15年間、欧州で犯罪者を追う警察は、指紋、DNAデータ、自動車所有者の詳細を相互に共有することが...

自然言語処理技術により、機械はより人間的な視点から問題を解決できるようになる。

編集者注: テクノロジーは、数学や物理学に関連する問題を解決する上で重要な役割を果たすことができます...

今日のAIの優れた使用例

企業は AI パイロットを実施し、AI を本番環境に移行しています。大手組織はここに賭けており、すで...

音声によるやりとりをより自然にするにはどうすればよいでしょうか?まずはこれら 6 つの重要な知識ポイントをマスターしましょう。

最近、ロボットに関する非常に良い記事をいくつか読んだので、自分の考えを書き留めながら翻訳してみようと...

AIも催眠術をかけられるのか?

いつか、おそらく数十年以内に、人工ニューラル ネットワークを使用して、人間の脳をリアルにシミュレート...

AI スタートアップの品質を測定するにはどうすればよいでしょうか?

編集者注: Zetta Venture のパートナーである Ivy Nguyen 氏は最近、Tech...

古代東洋の究極の秘密 - 知的な美しさ

[51CTO.com からのオリジナル記事] 伝説によると、古代の神秘的な東洋の世界には、秘密で偉大...

100倍速い!ディープラーニングトレーニングツールであるDetermined AIがオープンソースになりました。より速く、よりシンプルに、より強力に

ディープラーニングの研究者として、私はモデルのトレーニングに深く悩まされています。モデルを何日も何晩...

...