AIが史上初の小説を創った。読んでびっくりしました。

AIが史上初の小説を創った。読んでびっくりしました。

[[248937]]

AI が書いた初の小説が登場。予想通り奇妙な内容

小説家ロス・グッドウィンは、文豪ジャック・ケルアックを真似てアメリカ大陸を横断するロードトリップをし、小説『ザ・ロード』を執筆したが、主たる筆者は彼ではなくAIだった。結果はあまり満足のいくものではなかった。グッドウィン氏は、AIが人間レベルの小説を書けるようになるまでにはまだまだ長い道のりがあると語った。

昨年、ある小説家がアメリカ大陸を横断するドライブ旅行をした。この旅は、ジャック・ケルアックに倣って、旅をしながら何か大切なものを見つけ、その経験について書こうとする試みでした。

ジャック・ケルアックは1948年から1950年にかけてアメリカ中を旅し、最終的にメキシコシティに到着して『路上』を執筆した。

しかし、このライターは平均的なライターとは大きく異なります。マイク、GPS、カメラ、ラップトップだけです。

人工知能や機械学習によって人間が失業することはないと考える人の多くは、人間の創造性を模倣するのは難しいと楽観視しています。非常に古典的な見方は、機械が反復的な手作業から私たちを解放したのと同じように、機械学習は反復的な知的作業から私たちを解放するというものです。

これにより、仕事中に趣味に没頭したり、大切な人と充実した時間を過ごしたりするための自由な時間が増えることになります。

しかし、考えてみてください。創造性は人間の基本的な能力なのでしょうか?それとも機械学習でもそれができるのでしょうか?

もし AI が私たち自身よりも私たちを理解できるとしたら、AI によって書かれた小説はこれまで読んだ中で最高の小説になるでしょうか?

AIが生成した小説は「ビーチで読む本」ではないかもしれない

もちろん、これは未来学者の見解です。ロス・グッドウィンのキャデラックがそのロードトリップで持っていた間に合わせの装備が証明したように、現実にはまだまだ遠い。

ロス・グッドウィン氏は、機械で作成した小説について、「これは非常に不完全な文書で、簡単なプロトタイプ プロジェクトにすぎません。成果物は完成していません。人間が書いた小説でも、小説らしいものでもないと思います」と述べている。現在、この AI で作成された本「The Road」は販売されている。

ニューラル ネットワークがトレーニングされると、作成者が望む任意の長さのテキストを生成できるようになります (ランダムに、または特定のシード ワードまたはフレーズから)。グッドウィンは、これらの種を提供するために、ロードトリップの光景と音を利用しています。小説は、イメージ、場所、マイクでの会話、さらにはコンピューター内の時計に基づいて、一度に 1 文ずつ書かれています。

結果はまちまちです。

この小説は、冒頭の文章を、時間に関する適切な形で終わらせている。「午前9時17分、家は重苦しかった。」アルゴリズムに入力されたFoursquareのデータセットに基づいて、AIは場所の説明を始めるが、すぐに主題から逸れて非現実的になる。文学的な実験は素晴らしいことですが、経度と緯度の座標を繰り返し引用してもブッカー賞を受賞できる可能性は低いでしょう。

データを入力してアートを出力する?

ニューラル ネットワークには、クリエイティブ エージェントとしていくつかの利点があります。大規模なデータセットでトレーニングし、データセット内のパターンを認識し、同じルールに従った出力を生成することに優れています。 AI によってインスピレーションを受けたり作成されたりした音楽は、音楽創作の形態としてますます普及しており、人間とコンピューターのコラボレーションによって作成されたポップミュージック アルバム「Songularity」さえあります。

ニューラルネットワークは、数時間でバッハとモーツァルトの作品を全て「聴く」ことができ、また、シェイクスピアの作品から自らを訓練して学習し、「まあまあ」の作品を作り出すこともできる。人工的に創造するというアイデアは、非常に一般的になり、ニューラル ネットワークの「ボット」を人間の文章サンプルで強制的にトレーニングさせ、面白い結果を生み出す人もいます。

ニューヨークからニューオーリンズまで歩き回ったAIは、LSTM(Long Short-Term Memory)ニューラルネットワークでした。 デフォルトでは、単一のニューロンに含まれる情報が保存され、ニューロンを完全に上書きするのではなく、単一の時間ステップで小さな部分のみを「忘れる」または「学習する」ことができます。

手書きや音声認識などのタスクでは、LSTM アーキテクチャは従来の再帰型ニューラル ネットワークよりも優れたパフォーマンスを発揮します。ニューラル ネットワークとそのプログラマーは、文学の影響をさらに研究し、6,000 万語 (360 メガバイト) のオリジナルの文学作品を吸収しました。グッドウィンの理論によれば、そのうち 3 分の 1 は詩、3 分の 1 は SF、残りの 3 分の 1 は「ダーク」文学でした。

このように、グッドウィンはプロジェクトに対してある程度の創造的コントロールを持っています。ソース資料はマシンの語彙と文章構造、そして作品の調子に影響を与えます。

言葉の裏に込められた思い

AI小説家が抱える問題は、チューリングの時代からコンピューター科学者が解決しようとしてきた問題、つまり会話型AIと同じです。機械は人間よりも複雑なパターンを理解して再現できますが、それらのパターンが何を意味するのかはわかりません。

グッドウィンのニューラル ネットワークは、ラップトップに接続された小型プリンターで、一文字ずつ文章を出力します。ニューラル ネットワークが追跡する統計的関連性により、文字を単語に、単語を文にすることができますが、登場人物やプロットについては何も知りません。

チャットボットと会話する場合、コードは以前に何が言われたかを実際には理解しておらず、数十億通りの会話すべてを通してトレーニングするのに十分な大きさのデータセットもありません。

事前に決められた一連のオプションに限定しない限り、1、2 回の返信で会話の流れがわからなくなってしまいます。同様に、創造的なニューラル ネットワークは、自分が書いている内容を実際に把握しておらず、全体的な一貫性や物語性のあるものを作成する方法がありません。

グッドウィンの実験は、カメラやWeChatを介してAIに絶えず刺激を与えることで、AIの「小説」に一貫した流れを加えている(ニューラルネットワークによって動かされるアメリカの風景は、テーマ的なつながりと物語を提供している)。グッドウィン氏は、このアプローチは旅そのものの継続性と一貫性を生かすものだと考えています。

AIは質の高い小説を書く上で人間に取って代わることはできない

首尾一貫した語調と意味的な「スタイル」があれば、なんとなく説得力のある十代の詩を生み出すのに十分かもしれないし、Google が行ったようにニューラル ネットワークを使用した実験的なフィクションは、興味深い結果を生み出すかもしれない。しかし、その時代のシュールな AI 散文を読み進め、目新しさを超えた意味やテーマを探すのは、フラストレーションのたまる経験になることがあります。

おそらく機械は、人間の心と脳の複雑さを学んだり、感動的または面白い散文の書き方を学んだりするだろう。ニューラル ネットワークは、ディケンズやドストエフスキーのような魅力と機知に富んだ複雑な作品を書くことはできないかもしれません。

AIが人間の文学作品の創造レベルに到達するまでには、まだ長い道のりがあります。

<<:  百度脳産業イノベーションフォーラムが深圳に移転、今回はAIを活用して不動産イノベーションを支援

>>:  馬化騰と李延紅の対談:基礎技術は巨大産業の変革の基盤

推薦する

人気のディープラーニングライブラリ23選のランキング

[[209139]] Data Incubator は最近、Github と Stack Overf...

医療提供者はなぜインテリジェントオートメーションに投資する必要があるのでしょうか?

インテリジェント オートメーション (IA) は、人工知能とオートメーションを組み合わせたものです。...

中国情報通信科学院の張琳琳氏:AIセキュリティの標準化は、今後も基本的かつ規範的、主導的な役割を果たし続けるべきである。

最近、「強力なイノベーション、新しいことに挑戦、未来の共有」をテーマにしたチャイナモバイルの第4回テ...

開発者の能力を最大限に引き出すAISpeech DUIオープンプラットフォームがリリースされました

[51CTO.comからのオリジナル記事] Tmall Genie X1、Xiaomi AIスピーカ...

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]序文Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベル...

異常検出に機械学習を使用する際に尋ねるべき 7 つの質問

導入異常検出に関するいくつかの入門的な質問。質問することは学習するための最良の方法の一つです。しかし...

...

自律飛行ロボットが浙江大学から集団で飛び立ち、サイエンス誌の表紙に登場

最近、浙江省安吉市の竹林で、一群の超小型知能ドローンが集団で派遣され、ジャングルの中を楽々と移動した...

...

40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

先日行われた世界的に権威のある多言語理解評価XTREME(Cross-Lingual Transfe...

...

Qi Lu: 私はこれらの4つの技術トレンドに最も楽観的です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

13歳の天才少年がAIスピーカーを開発。2010年代以降の世代は単純ではない

現代のティーンエイジャーにとってクールなものは何でしょうか?おそらくそれは AJ シューズを履くこと...

Google の具現化された知能に関する新たな研究: RT-H が登場、RT-2 より優れている

GPT-4などの大規模言語モデルがロボット研究と統合されるにつれて、人工知能はますます現実世界に進出...

...