AI がまた本を出版しました。今回は専門家向けの教科書です。 科学技術系出版社のひとつ、ドイツのシュプリンガー社は今月初め、完全に機械学習で書かれた教科書『リチウムイオン電池:最新研究の機械生成要約』を出版した。 247ページにわたる本書は、過去3年間のリチウムイオン電池分野における150件以上の優れた研究成果をAIがまとめ、写真と文章でまとめたものです。
この本の著者であるベータ・ライターは、ドイツのフランクフルト・ゲーテ大学の応用計算言語学(ACoLi)研究所のAI研究者によって開発されたアルゴリズムで、特定のトピックに関する大量の文献をレビューし、重要な詳細を自動的に選択して提示できるようになりました。 Spring 社は、今後このアルゴリズムを使用して、さまざまな科学研究分野を対象とした書籍をさらに出版する予定です。 この要約形式の教科書は、関連する科学研究者がこのホットな業界の進歩を迅速に理解するのに役立ちますが、その内容は一般の人々にとっては専門的すぎて遠いものです。 この記事では AI ライティングについて説明します。以下で述べる AI は、特にライティング AI を指します。 教材だけでなく、ジョーク、小説、脚本、歌詞、詩など、AIライティングはすべてをカバーします 今回出版された教科書は、AIによる画期的な取り組みではありません。AIは既にテキスト作成において活躍しています。 私たちの日常生活に最も関係のある構成はニュースです。一般的なニュースやスポーツイベント、経済動向、証券情報などの簡単なレポートは、AIによって作成される可能性があります。 AIはイベントやデータを公開できるだけでなく、関連する科学普及知識や一連のレポートを検索することもできます。プロセス全体を通じて人間による監督はなく、自動イラストや組版により、実際の人間の作品と区別することは困難です。 ニュース記事は文学的な質に欠けており、AI の創造的な側面を反映する可能性は低いです。 AIはジョークを言うこともできます。 1990 年代に、プログラマーは JAPE と呼ばれる会話セグメント ジェネレーターを開発しました。その後、AIを搭載した改良版のジョーク生成器がトーク番組の文章構造やオチを分析してジョークを生成した。研究チームはこれを利用して、人々が笑う理由を研究したいと考えている。 AIはジョークを書くだけでなく、科学者が人間の脳内の笑い神経を研究するのにも役立ちます。 AIはすでに小説を書いています。 2007年、ニューヨーク大学のAI研究者グッドウィン氏は、小説を書くためのニューラルネットワークを訓練した。ドライブ旅行中、車内にGPS、カメラ、マイクセンサーを入力として設置した。旅行後、彼はAIが一言も変えずに書いた6000万語の「1 the Road」を出版した。これは人工知能が書いた最初の小説とされている。この小説の筋は完全には意味をなさず、GPS の位置データが混ざっており、スペルの問題もあります。この小説はチューリングテストに合格していないものの、その詩的なアプローチにより、文学における AI の応用に関する新たなアイデアを切り開きます。 1 ロードカバー AIが書いた小説は賞を受賞するチャンスがある。 2016年、日本の数チームが、指定されたキーワードと大枠に基づいてAIが生成した数編のSF小説を選び、日本の第3回「星新一賞」に応募した。作品の一部は、情報に疎い審査員による予備審査を通過した。日本のSF作家、長谷敏樹さんは「小説を完結できたのは衝撃的。100点満点なら60点。将来が楽しみだ」と語った。今回、AIはチューリングテストに合格しただけでなく、人間の作家と競争することができました。 AIが脚本家を務め、脚本を丁寧に短編映画化しました。ロンドン国際SF映画祭(SFL)48時間テーマ映画コンテストへの出品作である「サンスプリング」の脚本は、グッドウィンが訓練したAIロボットのベンジャミンによって書かれ、未来の世界を舞台にした3人の主人公の三角関係を描いた物語である。この映画はプロの監督と有名な俳優を主演に迎えたが、評価は賛否両論だった。否定的なレビューでは、理解不能で意味不明と書かれていたが、肯定的なレビューでは、これはAIの偉業であり、AIが書いたSF映画ほどSFらしいものはない、と書かれていた。この実験の革新性は、最終結果の質よりも重要です。 サンスプリングの静止画 AIは詩の分野でも成果を上げています。 2017年、マイクロソフトリサーチアジアの仮想AIアシスタントであるXiaoIceが書いた139の現代詩がまとめられ、初の人工知能詩集『The Sun Lost the Glass Window』として出版された。トレーニング サンプルは、1920 年以降の 519 人の現代中国詩人の詩すべてです。素人にとっては美しく、詩人が書いたものと区別するのは難しいが、現代詩に詳しい人たちは、まだ改善の余地が大いにあると考えている。楽曲面では、Xiaoiceは多くのテレビ局やインターネット企業とコラボレーションしてシングルをリリースしています。 「日光はガラス窓を失った」のページ また、他の文学・芸術系のAIも使いやすいです。たとえば、連句や古代の詩は、古代の才能ある人々を悩ませることが多かったのですが、平行性とリズムの厳格な要件があるため、このタイプの文章は、口語よりも AI にとって簡単です。連句や頭韻詩などをオンラインで生成できるウェブサイトは、もはや目新しいものではありません。 AIライティングの背後にはAI技術の進化の歴史がある AIはいくつかのジャンルの作品を非常に上手に書くことができますが、他のジャンルで人間を超えることは困難です。これは、AIの背後にあるプログラムアルゴリズムと切り離せないものです。小説を例にとると、初期にRNNとLSTMを使用してトレーニングされたモデルネットワークはチューリングテストにほとんど合格できませんでしたが、後に日本のチームが使用した新しいアルゴリズムはプロの審査員を欺くことができました。 人工知能ニューラルネットワーク 自然言語の処理は総称して NLP (自然言語処理) と呼ばれ、大きく分けて音声認識 STT (音声テキスト化)、自然言語理解 NLU (自然言語理解)、自然言語生成 NLG (自然言語生成) の 3 つの部分に分けられます。私たちが主に議論するライティングには、NLG と一部の NLU が含まれます。 初期の頃は、コンピューターに書き込ませるには、事前に設定されたテンプレートが必要でした。元のテンプレートは、英語の試験で行われる穴埋めテストのようなものです。記事を書き終えた後、変更部分を空白にしておき、データに基づいてコンピューターに空白を埋めさせます。たとえば、一般的な天気予報には、特定の都市の今日の天気、最高気温と最低気温が何度か、空気の質が何レベルかなどが含まれます。空白スペースのある固定したテンプレートの使用を避けるために、科学者は文法規則を人工的にモデル化し、同じ意味を表現するときに、人間が事前に設定した限られた規則の範囲内で文の構造に複数のバリエーションを持たせることができるようにしました。 現在、AI は統計的手法を使用しています。大量の実際のコーパスを入力し、確率統計を使用することで、最も可能性の高い語彙の順列と組み合わせが予測され、モデル ネットワークが自動的にトレーニングされます。このモデルでは、手作業による記述は必要ありません。文法に加えて、品詞の判断、エンティティの区別、キーワードと文の抽出、感情分析なども含まれています。モデルが利用可能になると、NLP のさまざまな下流タスクを実装できるようになり、さまざまなパラメータを通じて NLG を細かく制御できるようになります。 実装の詳細については説明しませんが、既存の最良のモデルの機能のみを検討します。 OpenAI が GPT-1.0 をオープンソース化して以来、改良された BERT と GPT-2.0 は現在、NLP 業界で最高レベルとなっています。 Googleが2018年10月にオープンソース化したBERTモデルは11の記録を破り、その読解力の一部は人間の能力を上回った。今年2月にOpenAIが発表したGPT-2.0は、より大規模なトレーニングを通じてBERTよりも高いスコアを達成し、与えられた書き出しに基づいて記事を書き続けることさえできる。学術、ニュース、小説の種類を問わず、公式サイトで公開されている書き出しの例はどれも非常に優れており、「ゴミのリサイクルは世界に有害である」などの誤解を招くトピックを書き続けることさえできる。 OPT-2.0は「リサイクルは地球にとって有害である」というテーマを継続します 外国人モデルは中国語の理解力がやや劣り、中国でもローカライズの研究が行われています。中国語の文字は、単語を区切るためにスペースを使用しない珍しい言語であり、品詞やエンティティを理解するには特別な処理が必要です。 BaiduのPaddlePaddleプロジェクトは今年3月にERNIEモデルをリリースした。百科事典や情報、会話などのコーパスを入力し、意味知識を直接モデル化することで、モデルの意味表現能力が強化され、中国語に対する効果はBERTよりも優れていた。 まとめると、AI技術は発展・向上しており、文章作成技術も絶えず向上しており、今では本物と区別がつかないほどになっています。 AIライティングはあらゆる分野で使用でき、あらゆる応用シナリオをカバーします AIは現在、テキスト制作の効率化を図るためにさまざまな場面で活用されています。 プレスリリースやルポルタージュなど、比較的機械的で標準化されたテンプレートの文章は、日常生活に密接に関係しています。 AI編集者は多くの新聞社や報道機関に採用されています。海外では、AP通信のWordSmith、ワシントンポストのHeliograph、ニューヨークタイムズのBlossomなどがあり、国内では、新華社の「快比小新」、中国ビジネスネットワークの「DT高王」、南方都市報の「小南」、バイトダンスの小明ボット、テンセントファイナンスのDreamwriterなどがあり、いずれも急速に発展している。 新華社が発表した「速筆小新」 AIもあらゆるところでレポートを作成しています。サービス会社やコンサルティング会社などが、裏付け資料や詳細なレポートなどを提供する必要があるシナリオでは、各ドキュメントを手動で作成するのではなく、関連するデータを NLG に入力すると、仕様に従って生成されます。たとえば、セルフサービス照会機で印刷される個人信用レポートは、NLG によって生成されます。 NLG によりサービスと処理の効率が大幅に向上し、組織がより良いサービスを提供してビジネスを拡大できるようになります。 ニュースで取り上げられているAIの要約生成能力は、科学研究に活用できるだけでなく、ビジネスと組み合わせることでより大きな活力を発揮することができます。 AL はビジネス インテリジェンス (BI) の分野で広く使用されています。 Arria NLG、Automated Insights、Narrative Scienceなどの企業が開発したNLGモデルは、企業の日常業務や財務情報をAIに入力することで、カタログやチャートなどの構造を含む財務諸表を自動生成し、特定の事業特有の損益ポイントや理由を指摘することができます。会社の日常業務にこのようなヘルパーを配置することで、PPT レポートを作成するという不要な作業が軽減され、経営陣がタイムリーに戦略を調整するのに役立ちます。 ARRIA NLG分析レポートの例 AIは広告においても非常に効果的です。 Phrasetechなどの海外企業は、企業サイトや商品紹介ページ、商品検索結果サマリーの自動生成などのサービスを提供しています。 2018年、JD.comとAlibabaは相次いで「Shakespeare」と「AI Smart Copy」というコピー生成システムを発表した。これらは商品番号やキーワードに基づいて複数の商品コピーを自動生成し、異なるスタイルを設定することもできる。 AI組版や写真編集と組み合わせることで、中小企業や事業所のデザイナー不足や業務不足の問題を解決します。 AI が十分に能力を発揮できない状況では、AI はより目立たない方法で人間を助けることもできます。 AI による執筆支援は、人間の執筆効率も向上させます。現在、百度や今日頭条などの自前メディアは独自の人工知能執筆プラットフォームを持っており、主に意味論に基づいて後からエラー訂正を行うために使用されています。執筆時に、AIペン神などの製品は、各単語や文を入力すると、その意味に基づいてインスピレーションワードクラウド、詩や引用、小説のあらすじなどの情報を提供し、著者がインスピレーションや素材を得て、執筆をスムーズに行うのに役立ちます。 AIは商業利用だけでなく、日常生活にも役立ちます。インテリジェントな入力方法は、入力中に次に何が起こるかを推測し続けます。場合によっては、文頭を入力するだけで、候補となる単語をすべて選択して文を完成できることもあります。スターを追いかけるようなニーズでも、NLG を使用すると、イベントの詳細やスターの人生経験を整理し、スターのあらゆる詳細を把握することができます。 要約すると、AI はテキスト分野で広く使用されており、人間の作業を部分的に置き換えたり支援したりすることができます。 AIライティングは非常に強力で、いくつかの面では人間には太刀打ちできない AIが人間に取って代わることは徐々に現実のものとなりつつあり、これはAIの特性と切り離せないものです。 AIは大量のデータを入力できます。私の人生は限られていますが、私の知識は無限です。人間の作家が持つ知識の蓄えとエネルギーには限りがあり、未知の領域に遭遇すると知識を補充する必要があります。 AI は、データからマイニングされたデータ情報の全量を入力として使用できるため、あらゆる詳細を理解し、広範囲にわたる参照を行うことができます。 AI は入力内容に関して客観的です。 AIは不親切で、すべてを藁人形のように扱います。人間は経験や知識レベルが異なるため、入手したコンテンツや情報に対する見解を完全かつ客観的に持つことはできません。 AI はトレーニングされたモデル ネットワークに従い、すべての入力を完全に分析します。同じモデルとパラメータの下で AI によって提供される結果はまったく同じです。つまり、同じ AI は、あらゆる入力に対して同じ評価基準のセットを使用します。 時間やコストを選択する必要はありません AIは高速な出力を実現できます。稲妻のように速い。現代のコンピューター技術によってもたらされた強力な計算能力により、AI は数秒でエッセイを書くことができます。リアルタイムのデータマイニングと収集により、すぐに AI に送信されて処理され、結果が即座に出力されます。人間の編集者が積極的に検索し、読み、単語や文章を選択するのに費やす時間と比較すると、AI の時間コストは無視できます。 AIは人間の労力を節約できます。昨日は取り戻すことはできませんが、今日に取り組まなければなりません。 AI は自動または半自動の書き込みを実現します。企業にとっては人件費の削減につながります。全人類にとって、技術の進歩は人間を退屈で反復的な労働から解放し、他の創造的な活動を行うことを可能にしました。 まとめると、AI のさまざまな利点により、スピードと正確性が求められる一部のライティング シナリオでは、人間が AI に置き換えられることは避けられません。 現時点では、AI ライティングはまだ未熟であり、法律が存在しないことから、AI ライティング技術は依然として使用され、悪用されています。 現段階では、AIにはまだ多くの限界があり、社会の理解や受容も高くありません。 現在の AI 技術は、データサイエンスの確率的統計手法を使用して文学記事の文章を分析し、人間と同等のレベルに到達することを目指しています。原則として、言語は数学的手法を使用して解決できる有限の単語の集合です。この方法は実践を通じて部分的に実現可能であることが証明されていますが、将来的にボトルネックが発生するかどうかを検証する方法はありません。 エンターテインメント業界の小さなホットスポットが偶然証拠となった。 2018年、交通大学の博士課程の学生、李洪野氏はテレビ番組で「クロストークの公式」を提唱し、郭徳剛氏に対抗し、社会で白熱した議論を巻き起こした。彼は数学的手法を用いてクロストークを研究した本を 3 冊出版しており、理論体系は完成しています。観客の反応は良かったが、彼のクロストークは15年間人気がなく、この事件の後再び姿を消した。 李洪野は番組で彼のやり方を披露した 現在開発されているAIにはまだまだ多くの問題が残っています。 まず、AI によって書かれた記事の品質は比較的低いです。幽霊や怪物は人々の失敗を好みますが、作家は人々の成功を嫌います。単純なジャンルと、ニュースや小説など、プロットやキャラクターの展開が求められる厳密なジャンルでは、AI のパフォーマンスに大きな差があります。 AIが書いた小説や詩などは、内部の論理や感情が欠けていることが多く、人々を混乱させます。 第二に、AIには独創性が欠けています。李白や杜甫の詩は口伝で広く伝えられたため、もはや耳に新鮮ではなくなった。 AIモデルの学習が完了したら、文章構造などが決定されます。数は多いかもしれませんが、制限があります。 AI モデルの使用中、すべてのデータ、意見、その他の情報は入力から取得され、ジャンプなしで削除および再編成プロセスを経て出力されます。 最後に、AI のトレーニングには莫大な投資が必要です。一度に一石飲む人は、その量を貴重だと考える。優れた AI モデルを作成するには、現在のアルゴリズムで必要な初期トレーニング コストが膨大になります。トレーニングに使用するコーパスは大きく、できれば品質を向上させるために事前に選択しておく必要があります。トレーニング中に大量のデータを処理するには、高価な GPU コンピューティング時間が必要になります。より速くトレーニングするには、プロセスを加速するための GPU 機械学習クラスターを構築する必要があります。現在、大企業がこの作業を行い、モデルを無料で公開していますが、OpenAIはGPT-2.0のソースを閉鎖したため、このようなモデルが持続可能かどうかが懸念されています。 テクノロジーは発展する過程で問題に直面し、人間がテクノロジーをどのように使用するかも問題となります。 AIは技術として誰でも利用できます。それをどうするか、どのような責任を取るか、倫理基準や法制度はまだ完璧ではありません。 AIはフェイクニュースの作成に利用される可能性があります。 AIにどのような命題が入力されても、AIはきちんとした、一見よく考えられた記事を書くことができるため、真実と虚偽を区別することが難しくなります。 AI は、関連部署に連絡したり専門家の助けを求めたりしてデータや情報の信頼性を確認することもできないため、すべての入力を信じてしまいます。手動で誤った情報を入力すると、AI がそれをそのまま受け入れてしまうため、バイアスが生じてしまいます。 AIは記事の盗作に利用される可能性があります。 AIは元の記事を入力すると、文の構造や語順を変更し、記事の言い換えを出力しますが、新しい価値はありません。 AI 盗用は、セルフメディアの提出、大学の論文、レポートの執筆において大きな需要があります。現在、市場では、論文の独創性と疑似独創性、論文の盗作チェックと盗作防止チェックなど、公式 AI 勢力と民間 AI 勢力の間で戦いが繰り広げられています。 AIは民主的な投票を操作しているとさえ非難されている。米国の選挙でも英国のEU離脱国民投票でも、ソーシャルメディア上にターゲット広告を出す勢力があるという声がある。 AI はユーザーの履歴を分析して、ユーザーにとって最も適切な選挙活動戦略を見つけ、NLG を通じて選挙活動のコピーと画像を生成した後、それをユーザーにプッシュします。たとえば、ソーシャル ネットワークのユーザーが移民を好まない場合、AI は「英国が EU に残留した後、何人の移民が英国に押し寄せるか」などの移民に関するトピックに基づいてテキストを生成し、画面をスワイプし続け、浮動票の獲得を目指す。これは、テレビ演説を通じて投票を集めるという従来の方法よりもはるかに効果的です。 映画「ブレグジット:理不尽な戦い」は、ソーシャルネットワーク上のターゲット広告が投票にどのような影響を与えるかを詳細に描いている。 これらは、法律が不十分な場合に AI が悪用される可能性のある多くの方法のうちのほんの一部です。立法プロセスにおいては、定義が難しい問題が多く、議論の焦点の 1 つは AI 作品の著作権の所有権です。 AI は、テクノロジー企業のプログラマーが作成したプログラムを使用します。アルゴリズムは、専門家や学者が論文で公開しています。トレーニング サンプルは、有名な書籍、百科事典、フォーラムのコメントなどから取得されます。出力は、プログラマーが理解できないブラック ボックス モデルです。最終的に、企業はモデルをオープンソース化し、モデルを使用するユーザーが独自のデータを入力します。最終的な記事の著作権を定義するのは困難です。 まとめると、AI は現在開発の初期段階にあり、解決すべきさまざまな問題があります。 長期的には、AI ライティングが広く応用されれば、明るい未来が期待できます。 現在の AI のレベルは低いですが、将来の可能性は予見できます。 技術的には、AIが作成できるようになると予想されます。中核原理は偽造できず、AI の再編成および模倣能力は実証されているため、将来的にはアルゴリズムの最適化とハードウェアの計算能力の向上により、AI が創造能力を獲得できるようになる可能性があります。 AIが創造力を獲得すると、文学、音楽、テレビ、映画などの業界は大きな変化を遂げるでしょう。 応用面では、AI は将来的にその技術を組み合わせてより強力な機能を実現し、使用シナリオを拡大できるようになります。音声認識やデータマイニング技術と組み合わせることで、AIはライブスピーチやニュース放送などのシナリオでリアルタイムの事実確認と同期出力を実行できるようになるかもしれません。画像、音声、動画認識技術と組み合わせることで、AIはさまざまなメディアの物語説明を生成し、映画、テレビ、ゲームを小説、脚本、要約に復元できるようになります。ユーザーが娯楽コンテンツを選択するのがより便利になり、一部の障害者グループの娯楽ニーズにも対応できます。情報伝達の基本的な媒体として、テキストはさまざまなシナリオで活用できます。 社会においては、倫理的、法的問題が解決されれば、AI は障害を取り除き、健全かつ無害な形で発展することができるでしょう。 AIの誤用を抑制することで、AIに対する一般の受容性を高めることができます。著作権の帰属が解決されれば、実際の利益は技術開発にフィードバックされる。AIは一部の仕事を置き換える一方で、新たな産業や雇用機会も生み出すだろう。 まとめると、AIは広大な世界で大きな役割を果たすことになるでしょう。 結論 弱い人工知能の段階では、AI が芸術作品を創り出すことを期待するのはまだ非現実的ですが、既存の技術の利点をうまく活用することには、依然としてかなりの応用価値があります。 AIはさらに深く研究する価値があり、将来には想像の余地が非常に大きいです。 |
<<: 血みどろの惨劇を突破できるのは誰か?自動運転プレイヤーが腕前を披露!
>>: PaddlePaddle をベースに構築された産業グレードの ICNET アプリケーションの予測速度は、TensorFlow を 20% 上回ります。
[[348542]]韓国の新人歌手ハヨンが10月8日、人工知能作曲ロボットEvoMがプロデュースし...
2012 年、AI 研究者はコンピューター ビジョンで大きな進歩を遂げ、ImageNet として知ら...
アルファ囲碁が中国の囲碁の天才柯潔に3連勝した後、ロボット脅威論がますます広まりました。電話接客、デ...
12月11日、テンセントクラウドは北京で新しいビッグデータAI製品発表会を開催した。テンセントクラウ...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
[51CTO.com クイック翻訳] 過去数年間にわたり、多くの企業がデータ主導のアプローチを採用す...
[[421561]]マスク氏は科学研究に本当に多大な貢献をしてきました!最近、イスラエルの研究者が新...
Theano、TensorFlow、Torch、MXNetから最近人気のPyTorchなど、ディープ...
フォーブスは10月2日、寄稿者ティム・バジャリン氏による記事を掲載し、中国ロボットの利点と、中国と米...
2021年人工知能と教育に関する国際会議では、人工知能と教育・指導の深い融合を推進し、人工知能を利用...