Google Brain の最新研究: AutoML メソッドが Dropout モードを自動的に学習

Google Brain の最新研究: AutoML メソッドが Dropout モードを自動的に学習

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ディープ ニューラル ネットワークでは、過剰適合の問題が発生することが多く、ドロップアウトや重み減衰などの正規化手法のサポートが必要になります。

最近の研究では、ドロップアウトによって「切り取られた」ニューロンの構造を利用すると、ランダムな置換よりも良い結果が得られることがわかっています。

問題は、実際のアプリケーションでは、さまざまな問題に対して構造的手法を使用すると、ドロップアウト モードの手動設計と調整が必要になり、一般化能力が不十分になることです。

では、CNN や Transformer などのディープニューラルネットワークの Dropout モードを自動的に学習する方法を設計することは可能でしょうか?

現在、Google の専門家である Quoc V. Le 氏のチームが、 AutoDropoutと呼ばれる方法を提案しています。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

関連論文がAAAI 2021に選出されました。

ドロップアウトパターンの設計プロセスの自動化

AutoDropoutの主な目的は、特定のシナリオの Dropout モードの設計を自動化することです。

研究者らは、構造化されたドロップアウトパターンのための新しい検索空間を設計しました。この検索空間には、多くの既存の Dropout モデルが含まれます。

この方法がどのように実装されるかを確認するために、CNN を例に挙げてみましょう。

CNN におけるドロップアウトパターン検索空間

CNN では、検索空間の基本パターンは連続した長方形です。長方形をタイル状に並べると、ドロップアウト パターンが生成されます。

長方形を定義するハイパーパラメータは高さと幅ですが、タイルを定義するハイパーパラメータはストライドと繰り返し回数です。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

長方形をタイリングすることに加えて、空間の中心の周りの回転と各空間次元に沿ったせん断という 2 つの幾何学的変換を検索空間に導入する必要があります。

研究者らはドロップアウト パターンを導き出した後、それをバッチ正規化層の出力に適用しました。研究者らの経験では、それをネットワークの他の場所に適用すると、検索プロセス中にトレーニングが不安定になることが多かったそうです。

CNN に残余接続がある場合、コントローラは残余ブランチにドロップアウト モードを適用するかどうかをさらに決定します。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

コントローラモデルと探索アルゴリズム

AutoDropout のコントローラーは強化学習によってトレーニングされます。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

コントローラーは実際にはトランスフォーマー ネットワークです。ネットワークは、ドロップアウト モードの構成を記述するトークンを生成します。

下の図に示すように、CNN の各レイヤーでは、ドロップアウト モードを作成するために 8 つのトークンが必要です。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

しかし、このような検索アルゴリズムのトレーニングには長い時間がかかる可能性があるため、研究者らは並列処理の面でも改良を加えました。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

Transformer のドロップアウト モード検索空間

このアプローチは Transformer にも適用されます。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

CNN との最大の違いは、検索空間内のドロップアウト パターンを、クエリ、キー、値、ソフトマックス、出力投影、残差など、Transformer レイヤーの複数のサブレイヤーに柔軟に適用できることです。

そのため、研究者は各サブレイヤーに独立したドロップアウト モードを適用しました。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

実験結果

AutoDropout の効果を検証するために、研究者は CNN モデルと Transformer モデルにそれぞれ AutoDropout を適用しました。

CNN の場合、主に教師あり画像分類タスクと半教師あり画像分類タスクで使用されます。

Transformer の場合、主な考慮事項は言語モデルと機械翻訳です。

最新の研究: Dropout モードを自動的に学習する AutoML メソッド"> 最新の研究: Dropout モードを自動的に学習する AutoML メソッド">

CIFAR-10 と ImageNet では、AutoDropout が SOTA モデルの結果を効果的に改善し、手動介入を必要とする DropBlock などの方法よりも優れていることがわかります。

Variational Dropout メソッドを使用してトレーニングされた Transformer-XL モデルと比較して、AutoDropout はより優れたパフォーマンスをもたらします。

最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

しかし、研究者らは、AutoDropout の欠点は検索コストが非常に高いことだとも述べています。

著者について

この記事には 2 人の著者がいます。

Hieu Pham 氏は、Google Brain とカーネギーメロン大学が共同で指導する博士課程の学生です。スタンフォード大学で学士号を取得しました。

[[374972]]最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

もう一人の著者はQuoc V. Leです。彼は、Google Brain の創設者の一人であり、Google の AutoML プロジェクトの立役者の一人である Andrew Ng の弟子です。

[[374973]]最新の研究: AutoML メソッドは Dropout モードを自動的に学習します">

ポータル

論文の宛先:
https://arxiv.org/abs/2101.01761

<<:  陸奇氏が楽観視するAI時代のGitHubがついに実現へ

>>:  フロントエンドでも機械学習を理解する必要がある

ブログ    
ブログ    
ブログ    

推薦する

2023年の生成AIの包括的なレビュー

2023年には、生成AIが開発者のアプリケーション構築支援において飛躍的な進歩を遂げ、大手ツールベン...

...

張北院士:人工知能の一般理論が形成されつつあり、AI革命の発展は止められない

7月6日に開催されたAscend人工知能産業サミットフォーラム2023において、中国科学院院士、清華...

...

髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

多くのディープラーニング手法は優れたマッティング結果を実現しますが、高解像度の画像を適切に処理するこ...

Githubの包括的なレビュー! 2021 年の最も素晴らしい AI 論文 38 件

[[443053]] 2021年は人工知能が飛躍的に進歩し続ける年です。最近、Github で誰かが...

NIOにおける時系列予測アルゴリズムの応用の検討

1. 事業背景1. NIOの紹介2014 年 11 月に設立された NIO は、ハイエンドのスマート...

AIがFX市場に、私たちが気づかないうちに革命を起こしている

外国為替市場または外国為替市場は世界最大の金融市場です。それは株式市場よりもさらに大きいです。さらに...

フラッシュは廃止されるが、5G時代の新技術は過去を思い出す暇を与えないだろう

Adobe が 2020 年 12 月 31 日をもって有名な Flash ソフトウェアのサポートを...

于聖奇:顔認識技術のリスクと法的規制

デジタル時代の到来により、顔認識技術の開発は大きく進歩しました。顔認識技術は普及し、多くの分野で広く...

英国、今年末までに無人運転車の公道走行を許可へ

4月29日、外国メディアの報道によると、英国運輸省は水曜日、自動車線維持システム(ALK)を搭載した...

10年後にあなたの生活を変える5つの新しいテクノロジー

脳制御のコンピューターからホログラフィック ビデオ ゲームまで、今後 10 年間であなたの生活を変え...

AIバブルが崩壊したら

今日の午後、友人とチャットをしていて、人工知能バブルの問題について話しました。この問題に関する私の意...

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。 The Vergeによると: ...

...