生成的敵対ネットワークがなぜ必要なのでしょうか?

生成的敵対ネットワークがなぜ必要なのでしょうか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。

ニューラル ネットワークに多数の人物と車の画像を見せ、どれが車でどれが人物であるかを伝えます。最終的に、ニューラル ネットワークは人物と車を区別することを学習します。車や人物の新しい写真が入力されると、それが人物か車かを知らせてくれます。

[[347866]]

図 1.1 に示すように、基本的にこのニューラル ネットワークが行うことは、意味のある構造を構築することです。このニューラル ネットワークに、これまでに見たことのない人物や車の新しい写真を生成するように要求した場合、図 1.2 に示すように、それを実行することができません。

図1: 畳み込みニューラルネットワーク

多くの場合、同じ入力分布から新しいサンプルを生成する必要があり、そのためには生成モデルが必要です。

生成ネットワーク

図2: 生成ネットワークの入力データ

これら 3 種類のデータ (図 2) を生成ネットワークに入力すると、ネットワークの学習モデルは図 3 のようになります。このトレーニング済みの生成ニューラル ネットワークを通じてサンプルを生成しようとすると、図 4 が生成されます。これは、図 4 のモデルが上記の 3 つの入力分布モデルの平均に似ているためです。

しかし、観察すると、このサンプルはどの入力データ分布タイプにも属さないことが明確にわかります。この問題をどうやって解決するか? 答えはランダム性です。つまり、生成モデルはランダム性を追加することで非常に類似した結果を生成します。

図3: 学習モデル; 図4: 生成ネットワークの出力

敵対的ネットワーク

ニューラル ネットワークをトレーニングして 0 から 9 までの数字を正しく認識できるようにしたい場合、まず大量の数字の画像を用意する必要があります。トレーニング中、ネットワークは正しく予測した場合に報酬を与えられ、誤って予測した場合にはフィードバックが与えられ、それに応じて重みを調整します。このプロセスは、すべての数字のすべての画像に対して繰り返されます。

しかし、私たち人間がこの過程を経る場合、実際にはそうではありません。あなたが教師で、子供に 0 から 9 までの数字の認識方法を教えているとします。 0、2、3、4、5、6、8、9 の数字については、彼は 70% の確率で正解を出します。しかし、1 と 7 の数字が出てくると、確信度は 50% しかありません (違いがわからない場合もあります)。なぜなら、彼にとって、数字の 1 と 7 は非常によく似ているからです。

あなたはこれに気づき、生徒が直面している主な問題である 1 と 7 に焦点を当て始めます。しかし、同じ質問をし続けると、最終的にはやる気を失って諦めてしまいます。このバランスは人間では一般的ですが、ニューラル ネットワークではそうではありません。ニューラル ネットワークには感情がないのです。エラー率が他の数字のエラー率と同じレベルに下がるまで、これらのエラーについてネットワークを何度もトレーニングすることができます。

現実には、先生が同じ質問をし続け、不合格になり続け、さらには先生が不合格を望んでいると感じるような状況に遭遇する人もいるかもしれません。これは実際には逆の動作です。

では、ニューラル ネットワークで同様のシナリオを再現するにはどうすればよいでしょうか? 実際には、真の敵対的ネットワークを構築することができます。もし実際にニューラル ネットワークにできるだけ多くの間違いを起こさせ、上記のような反応を起こさせ、何らかの弱点を発見するプログラムがあったとしたら、そのプログラムは学習者にその弱点をなくすように具体的に学習させるでしょう。

生成的敵対ネットワーク

生成的敵対ネットワークは、生成モデルと識別モデルの 2 つのモジュールで構成されます。生成的敵対ネットワークをトレーニングする場合、2 つのネットワークは実際には互いにゲームを行い、判別モデルのエラー率という唯一のパラメーターを競い合います。生成モデルは重みを調整してエラーを大きくし、識別モデルは学習を通じてエラーを減らそうとします。

生成的敵対ネットワークのトレーニングプロセス

贋作者は偽の絵画を作成し、それを高値で売ろうとした。同時に、絵画の真贋を検査し、判断する責任を負う検査官もいます。

最初、偽造者は紙の上にランダムに数本の線を引いただけで、検査官はこの時点では真贋を判断できませんでした。なぜなら、最初は識別モデルも生成モデルも学習を行っていないからです。

その後、贋作者は、本物そっくりの絵画を制作するために、より多くの異なる種類の絵画技法を学び、検査官は、偽物と本物を見分けるための細かい模様を学びました。贋作者が新たに作成した絵画を検査すると、検査官はその絵画が偽物であると認識し、それを拒否し、このプロセスが繰り返されます。

最終的には、偽造者がオリジナルに非常に近い画像を作成し、検査官がその真正性を判断できないという状況が発生します。これは、ニューラル ネットワーク内で生成モデルが元の絵画とまったく同じ絵を生成する一方で、識別モデルの出力が 0.5 となり、絵が本物か偽物か区別できないことを示すものとして現れます。この時点で、識別モデルをニューラル ネットワークから削除することができ、非常にリアルに見える絵画を生成できる完全にトレーニングされた生成モデルが得られます。

さらに、大量の車の画像を生成的敵対的ネットワークに入力して新しい車のサンプルを生成すると、1 つ確かなことがあります。それは、生成的敵対的ネットワークが車が何であるかを理解するということです。

[[347870]]

画像ソース: unsplash

ネットワークは潜在空間に構造を構築するため、これは特徴ベクトルとも呼ばれます。これらのベクトルを観察すると、その意味が完全であることがわかります。この潜在空間は入力データ分布のマッピングです。各寸法は車の特定の特性に対応します。潜在空間の 1 つの軸が車のサイズを表す場合、もう 1 つの軸は車の色を表します。

したがって、入力分布内でデータ ポイントを移動すると、潜在空間でも非常にスムーズな遷移が発生します。このようにして、入力データ分布に類似した新しいサンプルが生成されます。

<<:  アントチェーン、AI + ブロックチェーン技術でオリジナル作品を共同保護するデジタル著作権サービスプラットフォームの開設を発表

>>:  自動運転のフードデリバリーが利用可能に、Meituanがすぐにあらゆるものを配達

ブログ    

推薦する

過去 2 週間で AI の進路を変える可能性が最も高い 6 つのリリース!

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...

サービスロボットは驚異的なユニコーンを生み出すことができるか?

サービスロボットはニッチな領域を超えつつあるようだ。まず、2018年の世界ロボット産業の市場規模は2...

第3回世界情報会議は5月16日に開催されます。主な特徴は次の5つです。

北京、天津、河北の協調的発展を積極的に推進し、世界の知能分野における科学技術交流と協力を強化し、新興...

コードスイッチングに7億5000万ドル? Facebook TransCoder AI は 1 つで十分です。

コードの移行と言語の変換は困難で費用のかかる作業です。オーストラリア連邦銀行は、プラットフォームを ...

顔認識、マルチターゲット追跡…Suningのスマートストアのその他のブラックテクノロジーを公開!

[51CTO.comからのオリジナル記事] インターネット+の急速な発展に伴い、オフライン小売業界...

人工知能はテクノロジーとデータガバナンスの進化を推進する

2019年以降、アジア太平洋地域全体で政府主導のAIに関する取り組みが急増しています。これらの取り組...

テンセントの無人運転車が初登場!将来的には運転席がペンギンに置き換わる予定!プレート分析

人工知能と新技術の研究開発に関して、新たなブレークスルーがもう一つありました。 テンセントの無人運転...

負荷分散スケジューリングアルゴリズムを見てみましょう

[[122758]]ロード ホストは、スケジューリング メソッドまたはアルゴリズムと呼ばれる多くの負...

復旦大学のチームが中国の医療・健康パーソナルアシスタントをリリースし、47万件の高品質データセットをオープンソース化

遠隔医療の普及に伴い、便利で効率的な医療サポートを求める患者にとって、オンライン医療相談が第一の選択...

AIは採用に何をもたらすのでしょうか?

人工知能は、次のような採用活動に大きく貢献しています。 [[433895]] 1. 候補者の自動ソー...

2021年以降の人工知能について何かお考えはありますか?

中国科学技術協会、中国科学院、中国工程院、浙江省人民政府、杭州市人民政府、浙江省人工知能開発専門委員...

...

マスク氏は突然、xAI の「奇妙な」モデルを公開し、ユーモアのセンスを見せつけた。 ChatGPTのメジャーアップデートが事前にリークされる

11月3日、マスク氏は週末に突然エキサイティングなニュースをもたらしました。xAIの最初の製品が明日...

ファーウェイ、2025年のトップ10トレンドを発表:大企業の97%がAIを導入

世界の人口の58%が5Gネットワ​​ークにアクセスできるようになり、14%の家庭に「ロボット執事」が...

生死に関わる問題:病院のICU病棟で人工知能は何ができるのか?

病院の集中治療室 (ICU) では、重病の患者を一日中一連の機器に接続し、いつでもバイタルサインを監...