2016 年には、財務報告書に基づいてプレスリリースを書くという、人間と機械によるライティング コンテストがありました。 対戦相手は、自然言語生成会社Automated Insightsが開発したロボット「WordSmith」と、アメリカの公共放送の記者スコット・ホースリー氏だ。 コンテストの最終結果は、ロボットが人間の2倍以上の速さで書いたというものでした。 もちろん、2つのプレスリリースを比較すると、スコットが書いたものの方がより鮮明で、詳細かつ感情的です。 原稿に基づく翻訳 数年前から、訓練された人工知能が人々のニーズに合わせてさまざまな記事を生成できるようになったことがわかります。 今では、1日に数千語のオンライン記事を作成することも問題ありません。 地球上で最も強力な言語モデルである GPT-3 は、毎日 45 億文字を作成できます。 ただし、これらの言語モデルのほとんどは、ユーザーに対して限定的なインタラクティブ サポートしか提供できません。 さらに、機能ごとに言語モデルを個別にトレーニングするのはコストがかかりすぎます。 上記の問題を解決するために、Google Research のチームは、AI 駆動型のクリエイティブ ライティング アシスタントである Wordcraft テキスト エディターを提案しました。 Wordcraft は、ほんの少しのサンプル学習と対話で、さまざまなユーザーインタラクションを提供し、さまざまなストーリー執筆タスクをサポートするほか、ライターがストーリーのアウトラインを計画し、執筆および編集するのを支援することもできます。 例えば、学校で一番大変だったことは、記事を書き続けたり書き直したりすることでした。 さらに、チームは、一般的な言語モデルの代わりに会話モデルを使用するという Wordcraft 独自の利点を調査しました。 ストーリー作成環境では、モデルの予期しない出力が創造の一形態であるため、言語モデルの機能と限界を探索できます。 人間とコンピュータの相互作用の観点から、Wordcraft は、人々が言語モデルとどのように相互作用するか、モデルに対する人々の要件、モデルが生成できるもの、そして人々の最終的な作品にどのようにフィードバックするかを学習できます。 研究チームはまた、トレーニング ループに人間からのフィードバックを組み込み、その後のトレーニングと評価のために動的なデータセットを収集する予定です。 Google AI ワードアシスタントGoogle の研究者は、作成のさまざまな段階でユーザーに自然言語生成サポートを提供できる AI アシスタントを構築しました。
AIアシスタントを搭載したテキストエディターは見た目が非常にシンプルで、左側に空白の書き込み領域があり、右側にAIガイドによる操作ボタンとAI生成テキストが表示されます。 ユーザーのニーズに応じて、エディターはさまざまなインタラクション オプションを提供します。 1つの質問、1つの答え、簡単に解決著者は、Meena と GPLM という 2 つの言語モデルをテストしました。Meena は、以前の会話の内容を入力として受け取り、次の会話を予測します。一方、GPLM は、与えられた以前のテキストに基づいて書き込みを続けます。 実験の結果、著者らは、Meena が、同様のサイズだがそのようなタスクでの対話についてトレーニングされていない一般言語モデル (GPLM) よりも優れていることを発見しました。 そのため、研究者たちは最終的にミーナを選択し、ストーリー作者とアシスタント間の会話を模倣するこの形式が、ユーザーのストーリー作成にさらに役立つと考えたのです。 著者は、各タスクごとに、異なるタスクのための複数のフェーズの対話を作成しました。 ユーザーは「剣」を書き直すように要求し、モデルは対応する対話環境にストーリーを添付し、AIに応答を求める 著者らは、人間は会話の形式に慣れているため、数回の学習だけで非常に自然な出力を生成できることを発見しました。 さらに、対話モデルがタスクを理解できない場合、またはさらに情報が必要な場合は、単に「それを言う」だけです。
著者らは、このような応答はユーザーがプロンプトを改善する方法を理解するのに役立つと考えています。 GPLM が不明瞭なプロンプトに遭遇すると、意味のない継続が生成されることがよくあります。 さらに、会話中にユーザーは「キャラクターは対立を解決するために何をすべきか」と尋ねるかもしれません。 この場合、ユーザーは、単にテキストを続けるためのモデルではなく、ライティングパートナーを探していることは明らかです。 継続 継続は、言語モデルによって実行される最も基本的なタスクです。 会話モデルがタスクをよりよく理解できるように、著者らは説明的なテキストを使用して質問を改良しました。
上記の入力に基づいて、モデルは次のことを推奨します。
充填記入は難しい作業です。たとえば、ユーザーが段落を書き終えた後、AI アシスタントにストーリーの新しいアイデアを考え出させたり、いくつかの単語を置き換えたりしてもらいたい場合があります。
モデルは、ユーザーが選択したテキストに基づいて質問を書き換え、それを AI に渡して処理します。
そこでAIは次のように応答しました。
興味深い答えですが、あまり効果的ではありません。 2 番目の応答は、メタテキストを生成するモデル、つまりストーリーを書くのではなくストーリーについて話すモデルの問題を示しています。 メタテキストの生成を最小限に抑えるために、著者らは AI が学習するためのプロンプトをいくつか構築しました。 この時点では、AI の出力は正確には 4 語ではありませんが、改善されています。
12 語を出力するように依頼すると、AI はより長い提案をしました。
拡大執筆プロセスの一部には、特定のストーリー要素に詳細を追加するなど、すでに書かれた内容を拡張することが含まれます。
この例では、ユーザーは老人についての詳しい情報を知りたいので、AI は次のように応答します。
リライトさらに、作者はAIに物語のトーンを書き換えさせることも試みました。
モデルは対応する出力を生成します:
話をもっと面白くするよう頼まれると、モデルはこう答えた。
言葉の技巧は始まりに過ぎないユーザー生成記事は、AI ライティング アシスタントと連携するライターの将来も反映しており、ライターが自分の語り口を修正したり、文章を書き直したりするのにも役立ちます。 AI アシスタントの執筆の方向性は、作家にインスピレーションを与える可能性が高いです。 あらゆる利点には欠点がある。 Wordcraft も完璧ではありません。その最大の欠点の 1 つは、Meena と GPLM の言語品質が作成プロセス中に一定にならないことです。 少し前にAIダンジョンゲームでGPT-3が人間の道徳的要求に沿わない内容を提案したのと同じように、言語モデルの驚くべき模倣能力も人工知能のダークサイドを明らかにすることになるでしょう。 Wordcraft によって生成されるテキストも、主に言語モデルがインターネットのテキストからトレーニングされるため、偏りが生じる可能性があります。 トレーニングテキストに偏った内容や差別的な内容が含まれていても、レビューやフィルタリングが行われなければ、言語モデルはそれらの内容を学習してしまいます。これらの問題が解決されて初めて、Wordcraft は正式に使用できるようになります。 |
>>: 上海交通大学のオープンソーストレーニングフレームワークは、大規模な集団ベースのマルチエージェント強化学習トレーニングをサポートします。
[[256196]] [51CTO.com クイック翻訳] このチュートリアルでは、Stackove...
進化するインテリジェントな世界では、データの機密性と AI 倫理の融合が企業と社会にとって大きな懸念...
[[385182]]中国人民政治協商会議第13期全国委員会第4回会議が2021年3月4日に北京で開催...
検索エンジンは一般的に、各 Web ページに対して一連の情報フィンガープリントが計算されるという考え...
2019 年 10 月末時点で、HanLP と呼ばれる自然言語処理ライブラリが GitHub で ...
ロシアのスプートニク通信は12月17日、米空軍が最近、U2戦闘機の副操縦士として初めて人工知能を使用...
平均と分散のマップ削減一連の数値の平均と分散の式は誰にとっても明らかだと思います。マップ関数とリデュ...
現在、メタバースの分野は、誇大宣伝と新規プロジェクトの立ち上げ数の点で急速に成長しており、業界の市場...
中国の医療サービス市場の規模は巨大です。中国の医療サービス業界は、国家政策の推進により、デジタル化と...
[[189519]]インテリジェントな需要は2つの側面に反映されるモバイル インターネットの発展が新...
[51CTO.comからのオリジナル記事] モノのインターネットの台頭により、スマートハードウェアと...
[51CTO.com より引用] RSA カンファレンスは、世界の IT セキュリティ動向のバロメー...