AIが私の本を盗作してAmazonで販売したのですか? !

AIが私の本を盗作してAmazonで販売したのですか? !

ビッグデータダイジェスト制作

出典: theguardian

すべての作家にとって、盗作はおそらく最も許されないことの一つであると考えられるでしょう。

特に本を出版した作家の方に。

元 BBC テクノロジー記者のロリー・セラン・ジョーンズ氏は、自分が書いた回顧録について非常に心配している。「ほとんどの作家と同じように、私もアマゾンでの販売状況を頻繁にチェックしています。」

そしてこの本が生まれました。

その日もいつものように本の売れ行きに注目していた彼は、アマゾンでセラン・ジョーンズの伝記を見つけた。表紙のデザインはとても子供じみていて、著者も聞いたことのない人物だった。

「これは変だ、誰が私の伝記を書くんだ、と思いました」とセラン・ジョーンズはオブザーバー紙に語った。「私は自分をだましているわけではありません。私自身についての本を売るのに苦労してきましたが、他の人に私についての本を売ってもらうのはなおさらです。」

写真

しかし、しばらくすると、セラン・ジョーンズが彼の回顧録を利用して利益を得ようとする試みの犠牲になったことが明らかになります。なぜなら、この本のテキストは明らかに人工知能によって生成されたものであり、ChatGPT 以降に登場した多数の人工知能の 1 つによって生成されたものであり、これによって、人間がわざわざテキストを書かなくても、数ページにわたるテキストを素早く生成することが可能になるからです。

AIが本を盗作して出版、Amazonは盗作した人にその本を推奨

セラン・ジョーンズ氏の著書『ラスキン・パーク:シルビア、私、そしてBBC』には、彼が母親から父親との情事を詳しく記した手紙が入った靴箱を見つけた経緯が記されている。彼の父親はBBCのテレビディレクターで、彼の母親は23歳のときに彼と知り合った。この本は「シングルマザーと不在の父親のもとで育った物語」である。

しかし、父親が学者で母親が教師であるセラン・ジョーンズ氏は、家族向け探偵小説に例えられるこの本は「完全なフィクション」だと語った。

写真

するとアマゾンから「この本はあなたにも気に入るかもしれません」というメールが届いた。彼らのアルゴリズムは、彼が一生懸命に取り組んだ本を推奨するのではなく、これが彼が欲しがっている本だと判断したのです。

Amazon は本質的にジャンク本の存在を容認し、それを最も嫌う人々に推奨しているのです。

数日のうちに、アマゾンは偽著者の伝記やその他の作品を削除したが、低品質の本を排除するためのフィルターをすり抜けた作品がさらに多くあった。

Amazon の Kindle Direct Publishing (KDP) システムを使用して、1 日に数十冊の本を出版する「著者」もいます。

たとえば、スティーブン・ウォルリンという人物は、30冊以上の本を出版しているが、そのほとんどは特定のブランドのカメラの使い方に関する意味のない繰り返しのガイドであり、ファンタジーロマンス小説も数冊出版している。そのうち15冊は5月の同じ日に出版された。現在、Amazon によって削除されています。

人工知能はクリエイターを「脅かす」

アマゾンは、出版が阻止された書籍の数や、棚から撤去された書籍の数については明らかにしなかった。

「アマゾンは、AIが生成した製品がストアに溢れかえっており、明らかに大きな課題に直面しており、追いつこうとしているようだ」と、米国作家協会(SoA)のニコラ・ソロモン最高経営責任者(CEO)は述べた。

数週間前、同社はKDPの新刊書の出版社はAI生成コンテンツが含まれているかどうかを宣言する必要があり、出版は1日3冊までに制限すると発表しており、ソロモン氏はこの動きを歓迎した。

「しかし、こうした小さな修正は、読者や人間の著者よりも、アマゾンのプロセスに利益をもたらすようだ」と彼女は付け加えた。 SoA は、Amazon が製品に AI 生成のラベルを明示的に付け、読者が AI 生成のタイトルを除外できるようにすることを望んでいます。

この問題は、ストリーミングサービスにホワイトノイズをアップロードする人々とのSpotify使用料をめぐる競争に直面しているミュージシャンが直面している問題と似ている。

マーガレット・アトウッド、ヴィエット・タン・グエン、フィリップ・プルマンなどの作家たちも、自分たちの作品が同意も報酬もクレジットもなしに人工知能の訓練のための大規模言語モデルに使用されていることを懸念している。

公認IT団体BCSグループの最高経営責任者ラシク・パーマー氏は、AIが生成した素材にデジタル透かしを入れ、簡単に追跡できるようにする法律を閣僚らが制定する必要があると述べた。

「もし法律が英国のIT専門家に高い倫理基準を示す手助けとなるなら、英国は責任あるコンピューティングの本拠地となるのにふさわしい立場にある」とパーマー氏は述べた。

「『ブリティッシュ・コード』は何か特別なもののニックネームになるのでしょうか?」

アマゾンの広報担当者は、すべての出版社は同社のコンテンツガイドラインを遵守しなければならないと述べた。 「当社は、ガイドラインが遵守されていることを確認し、ガイドラインに準拠していない書籍を削除するために多大な時間とリソースを投入しています。当社は AI 生成コンテンツを許可していますが、顧客体験を失望させるなど、当社のコンテンツガイドラインに違反する AI 生成コンテンツは許可していません。」

関連レポート:

https://www.theguardian.com/technology/2023/sep/30/authors-shocked-to-find-ai-ripoffs-of-their-books-being-sold-on-amazon

<<:  テレンス・タオ:不等式定理を証明するためにGPT-4を使いました。論文はarXivにアップロードされます。

>>:  スマートオフィス管理におけるAIの役割

ブログ    
ブログ    

推薦する

...

...

...

Pythonを知らない人は、人工知能時代の新たな「文盲」になるだろう

各段階で、「文盲」の定義は異なります。以前は、漢字を知らないことが文盲とみなされ、後には、英語を話せ...

AIが医療業界に参入すると、人間は看護師の仕事を失うのでしょうか?

AIに取って代わられにくい、人間の「鉄の飯碗」を探し続けていきましょう。医療業界では、AI と自動...

Nvidia テルアビブ AI サミットが中止に!黄氏の社内メールが明らかに:Nvidiaの従業員も誘拐された

少し前、25歳の中国系イスラエル人少女、ノア・アルガマニの誘拐事件がネットユーザーの間で白熱した議論...

ヒントン、ルカン、ベンジオは、ディープラーニングの過去、現在、未来に関する1万語の記事を共同で発表した。

2018年、ACM(米国計算機協会)は、コンピュータディープラーニング分野への貢献を称え、ヨシュア...

毎日 12 時に出勤し、ガールフレンドと過ごすために定時に退勤するプログラマーである私が、なぜいつも残業するのでしょうか。 !

社内で髪の多いプログラマートップ3の1人として、私はいつも髪に頼って残業しています。若い人たち、なぜ...

ペアデータなしで学習!浙江大学らは、マルチモーダルコントラスト表現C-MCRの接続を提案した。

マルチモーダル対照表現 (MCR) の目標は、異なるモダリティからの入力を意味的に整合された共有空間...

2頭のアルパカが頭と尻尾を切り落とし、それをくっつけてハギングフェイスリストのトップに

HuggingFace が再びオープンソースの大規模モデルのリストのトップに躍り出ました。最前列は、...

RELX: 回答者の95%がAI人材の採用は課題であると考えている

海外メディアは、情報分析プロバイダーRELXの新しいレポートによると、回答者の95%が人工知能の人材...

マイクロソフトのGitHubはAIを使ってソフトウェア開発者の心を理解しようとしている

コード共有サービス GitHub は、ソフトウェア開発者向けの人工知能アシスタント「GitHub C...

TensorFlow でトレーニングしたモデルを保存および復元する方法

ディープ ニューラル ネットワーク モデルの複雑さが非常に高い場合、保有するデータの量、モデルを実行...

テキストマイニング前処理におけるベクトル化とハッシュトリック

[[201071]]序文「テキスト マイニングにおける単語分割の原理」では、テキスト マイニングの前...