OpenAIは4月7日、公式サイトで最新の研究結果を発表し、感情表現を効率的に学習し、現在Amazonのレビューで次の文字を予測できる教師なしシステムを紹介した。 研究者らは線形モデルを使用して、小規模ながら広く使用されているデータセット (スタンフォード感情ツリーバンク) で非常に高い感情分析精度を達成しました。OpenAI は 91.8% の精度を達成しましたが、これまでの最高精度は 90.2% でした。このパフォーマンスは以前の教師ありシステムと同等ですが、ラベル付けされたサンプルの使用量も 30 ~ 100 倍少なくなります。 さらに、OpenAIは、そのモデルの表現には、ほぼすべての感情信号を含む独立した「感情ニューロン」も含まれていると述べた。 OpenAIは、「当社のシステムは、最小限のトレーニングデータでも、スタンフォード感情ツリーバンクでテストされた他のシステムよりも優れた結果を達成しています」と述べています。 完全教師あり学習の効果を実現するために、OpenAI のモデルはラベル付けされたサンプルを表す 2 つの変数 (緑と青の線) を選択し、各変数に対して 6920 個のサンプルをトレーニングしました (灰色の点線)。 OpenAI の L1 正規化モデル (Amazon ユーザーレビューを使用して教師なし方式で事前トレーニング済み) は、わずか 11 個のラベル付きサンプルでマルチチャネル CNN (畳み込みニューラル ネットワーク) と競合でき、232 個のトレーニング サンプルで最先端の CT-LSTM アンサンブルのレベルにまで達します。 OpenAIは、このモデルがAmazonのユーザーレビューの次の文字を予測するだけでなく、実際に感情の概念につながる可能性のある特徴を学習したので驚いたと述べた。 OpenAI は、この現象はこのモデルに特有のものではなく、入力の次のステップや次元を予測するようにトレーニングされることが多い一部の大規模ニューラル ネットワークの一般的な特性であると考えています。 トレーニング方法 Leifeng.com は、OpenAI がまず Amazon の 8,200 万件のユーザーレビューを使用して、4,096 ユニットの乗法 LSTM (mLSTM) をトレーニングし、短いテキスト内の次の文字を予測したことを知りました。チームは、1 時間あたり 12,500 文字を処理できる 4 つの Nvidia Pascal GPU を使用し、トレーニングには合計 1 か月かかりました。 これらの 4096 個のユニット (実際には浮動小数点数のベクトル) は、モデルによって読み取られた文字列の特徴ベクトルと見なすことができます。 mLSTM をトレーニングした後、OpenAI はこれらのユニットを線形に結合し、既存の教師ありデータを通じて結合の重みを学習し、元のモデルを感情分類器に変換します。 感情ニューロン OpenAI は、L1 正則化を使用して線形モデルをトレーニングしているときに、驚いたことに、使用している学習ユニットが非常に少ないことに気づきました。さらに調査を進めた結果、研究者たちは、モデルの中に感情的価値を正確に予測できる「感情ニューロン」が実際に存在することを発見した。 モデルはテキスト内の次の文字を予測するようにのみトレーニングされていますが、モデル内の感情ニューロンはレビューを否定的または肯定的として分類できます。 他の同様のモデルと同様に、OpenAI のモデルを使用してテキストを生成できますが、違いは、OpenAI はニューロンの値を書き換えることで合成テキストの感情を制御できることです。 上の画像は、トレーニングされたモデルによって生成された合成テキストの例です。研究者らはまず感情ニューロンの値を決定し、次にモデルからサンプルをランダムに選択してコメントの感情を判定した。下の図に示すように、研究者は「わかりませんでした」という接頭辞もモデルに渡して、非常に類似したサンプルのみを選択しました。 例 次の図は、感情ニューロンによって表される各文字の値を示しています。赤は負、緑は正です。 「最高」や「ひどい」などの強い示唆を与える単語は、濃い色で強調表示されます。 文章やフレーズを完成した後、システムが頻繁に更新を行うことは注目に値します。たとえば、「そして、そのうちの約 99.8 パーセントは映画の中で失われました」という文では、「映画の中で」自体には感情的な内容はありませんが、モデルは「失われた」の後に否定的な更新を行い、文の終わりの後に別の大きな更新を行います。 教師なし学習 ラベル付けされたデータは機械学習の原動力となります。データの収集は簡単ですが、大規模にラベル付けするのは困難です。大規模なデータのラベル付けは、機械翻訳、音声認識、自動運転など、目に見える効果と利益がある分野でのみ実現可能です。 機械学習分野の研究者は長い間、データセットの正確な表現を学習できる教師なし学習アルゴリズムを開発し、ラベル付けされたデータがほとんどない問題を解決したいと夢見てきました。 OpenAI の研究は、大量のデータを使用して大規模な教師なしの次のステップ予測モデルを単純にトレーニングすることが、優れた表現学習機能を備えたシステムを作成するための優れたアプローチである可能性があることを示唆しています。 次のステップ OpenAI の研究結果は、一般的な教師なし表現学習における前進を表しています。研究者たちは、言語モデル化を通じて高品質の表現を学習できるかどうかを探り、慎重に選択されたデータセットで既存のモデルを拡張しているときに、この結果を偶然発見しました。しかし、研究者たちはこの潜在的な現象の具体的な原因についてはまだよくわかっていません。 これらの結果は、長いドキュメントを含むデータでは適切に機能しません。 OpenAI は、彼らのモデルが数百、あるいは数千の時間ステップにわたって情報を記憶するのに問題があるのではないかと推測しています。階層モデルは対応する時間スケールに適応できるため、次のステップは階層モデルを試すことであると彼らは考えています。これらのモデルをさらに拡張すると、感情分析や同様のタスクにおける表現の忠実度とパフォーマンスがさらに向上する可能性があります。 入力テキストとレビュー データの違いが大きいほど、モデルのパフォーマンスは低下します。テキストサンプルのコーパスを拡張することで、より広範囲のドメインに適用できる同様に有益な表現を得られるかどうかを検証することは価値があります。 OpenAI の結果は、大規模な次のステップ予測モデルが優れた教師なし表現を学習できることを示しています。大規模なビデオ コレクションを使用して、大規模なニューラル ネットワークをトレーニングし、次のフレームを予測すると、オブジェクト、シーン、アクション分類子の教師なし表現が生成される可能性があります。 一般的に、モデル、そのトレーニング方法、データセットのプロパティを理解することが重要です。そうすることで、同様の優れた表現が得られる可能性が高くなります。 |
>>: 李開復氏独占インタビュー:10年後には人間の仕事の50%がAIに置き換えられる
[[353999]] AI がもたらす自動化の脅威によって仕事が奪われる一方で、AI は新しい職種...
2018年6月27日、Xunzhong Holdingsの完全子会社であるYunxun Techno...
「再帰的に自己進化する AI が人間を支配する」という問題に対する解決策はあるのでしょうか? !多く...
自動化はテクノロジーを利用して、人間がより多くのタスクを完了できるようにします。物流の自動化をあらゆ...
10月10日、2019 AIIA人工知能開発者会議の記者会見が北京で開催されました。 2019年AI...
工業情報化部のウェブサイトは13日、「産業ビッグデータ発展に関する指導意見」(以下、「意見」)を発表...
[51CTO.com クイック翻訳] 現在、世界中のデジタル広告代理店は、ニュースサイト、検索エンジ...
業界における人工知能(AI)の応用シナリオは増え続けており(日常的なスマート製品から大規模なイノベー...
最近、「被験者 3」について多かれ少なかれ耳にしたことがあるかもしれません。握手、軽く捻挫した足、リ...
おそらく今回、私たちは本当に人類の歴史における特異点に立っているのかもしれない。最近、MIT のカー...
先日開催された2018年上海世界モバイル大会で、中国移動は2020年までに5Gネットワークの正式...
[[413351]] UDPとTCPの違い前回の記事では、TCP の接続を確立するための 3 ウェイ...
[[408717]]ディープラーニングが再び認知されて以来、多くの機械学習フレームワークが登場し、...