MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

MorphNetは、ニューラルネットワークをより高速、小型、効率的にするモデル最適化技術です。

特定のタスクを実行するためにニューラル ネットワークを調整したいですか?この問題は想像したほど単純ではありません。

ディープ ニューラル ネットワーク (DNN) は優れたブロックですが、その移動には計算リソースと時間の面で非常にコストがかかる可能性があります。

現在、Google AI は MorphNet をリリースしました。人気の画像分類ニューラル ネットワーク Inception V2 でテストしたところ、精度を犠牲にすることなく、ニューラル ネットワークが高速化および小型化され、計算電力の消費が削減されることが分かりました。

MorphNetとは

MorphNet は、既存のアーキテクチャを使用して特定のタスクを最適化するニューラル ネットワーク モデルの最適化 (改良) テクノロジです。

言い換えれば、これは転移学習の問題です。転移学習の難しさは、不変量を見つけることにあります。モデルは、以前にトレーニングされたタスクの目的と似ているものの、まったく同じではない多くのタスクを処理する必要があり、これによりモデルのパフォーマンスが大幅に低下したり、クラッシュしたりすることがあります。

MorphNet の成功は、同様の問題向けに構築されたニューラル ネットワークを入力として使用する限り、より小型で高速で、新しいタスクに適した新しいアーキテクチャを作成できるという点にあります。

MorphNet は、ループの収縮と拡張という 2 つの段階を通じてニューラル ネットワークを最適化します。

収縮期

縮小フェーズでは、MorphNet は非効率的なニューロンを識別し、スパース正則化を適用してそれらを削減します。

MorphNet は、ターゲット リソースを考慮しながらニューロンの損失を計算することに注意してください。そのため、トレーニング プロセス中に、オプティマイザーはリソースの損失を認識し、どのニューロンが効率的で、どのニューロンを削除できるかを認識できます。

わからない? MorphNet がニューラル ネットワークの計算コスト (FLOP、つまり 1 秒あたりの浮動小数点演算など) をどのように計算するかを確認するには、次の例をご覧ください。

2 つの入力 (Xn)、6 つの重み (a、b、…、f)、および 3 つの出力 (Yn、ニューロン) を持つ行列乗算として表されるニューラル ネットワーク層を考えます。つまり、このレイヤーを評価するには 6 回の乗算が必要になります。

MorphNet では、乗算回数を入力数と出力数の積として扱います。左側の例では、2 つの重みが 0 であっても、評価時にすべての乗算を実行する必要があります。しかし、中央の例では構造のスパース性を示しており、MorphNet は出力数が 2 であることを認識でき、このレイヤーの乗算回数は 6 から 4 に削減されます。この考え方に従って、MorphNet はネットワーク内の各ニューロンの増分コストを決定し、右側のようなより効率的なモデルを生成できます。

拡大フェーズ

拡張フェーズでは、MorphNet は幅乗数を使用してすべてのレイヤーのサイズを均一に拡張します。

たとえば、拡張が 50% の場合、非効率なレイヤーではニューロンが 100 から 10 に縮小し、その後 15 にのみ再度拡張されます。一方、重要なレイヤーではニューロンが 100 から 80 にのみ縮小し、再拡張後に 120 に達し、より多くの使い捨てリソースを取得する可能性があります。

つまり、MorphNet の最終的な効果は、ネットワークの非効率的な部分から効率的な部分にコンピューティング リソースを再割り当てすることです。

MorphNetはAIモデルを最適化します

効果はどうですか

Google AI チームは、MorphNet を使用して Inception V2 ネットワーク モデルをトレーニングしました。

写真はMorphNet論文より

ベースライン方式では、幅乗数を使用して各畳み込みの出力数を均一に減らすことで、精度と計算能力のバランスをとります (赤)。

MorphNet アプローチは計算電力消費を直接ターゲットにし、モデルを縮小するときにより優れたトレードオフ曲線 (青) を生成します。

同じ精度で、MorphNet メソッドは計算電力消費を 11% ~ 15% 削減します。

MorphNet は Inception V2 の最適化に優れており、他のネットワーク モデルにも役立ちます。

写真はMorphNet論文より

モデルのサイズ/FLOPS を圧縮することに成功しただけでなく、品質の低下もほとんどありません。予想どおり、Google が作成したものはすべて高品質であるに違いありません。

Google はすでにこの便利なものを使い始めています。 Google AIチームは、MorphNetがGoogleの複数の量産規模の画像処理モデルに適用されていると述べた。

ポータル

MorphNet はオープンソースになりました。

GitHub アドレス:

https://github.com/google-research/morph-net

論文の宛先:

出典: http://arxiv.org/pdf/1711.06798.pdf

<<:  知覚AIオペレーティングシステム

>>:  Yirendai - Yiren Hive Fintech AI 実践: Hive Robot

ブログ    

推薦する

セキュリティ業界における5G+AIの探究と実装

セキュリティ業界における5G+AIの活用により、高解像度ビデオはセキュリティ業界に重要な発展の機会を...

MITのロボットは、浸透する無線周波数を使って隠れた物体を感知する

[[391062]]海外メディアの報道によると、世界中の研究者がロボットが周囲の状況をよりよく認識...

JD.com JDataアルゴリズムコンテスト決勝戦が無事終了、優勝賞金30万人民元は「魯班第7号」に

6月6日、JDグループとインテルが共同主催し、単一アルゴリズム競技会の参加者数で世界記録を樹立したJ...

AIと機械学習を活用して、誰にでも何でも販売する

AI と IBM Watson の Personality Insights を使用して見込み客に確...

OpenAI CEOがGPT-5の開発中であることを明らかに

11月14日、海外メディアの報道によると、OpenAIはGPT-5の構築を開始した。同社のCEOサム...

2023年までにスマートホームとモノのインターネットは完全に相互運用可能になると予想されている。

「AI+IoT」技術の応用の実現により、消費者のスマートデバイスに対する需要が高まり、スマートスピ...

AWS が Amazon SageMaker の 9 つの新機能をリリース

12 月 9 日、Amazon Cloud Service (AWS) が開催する年次イベント AW...

Ray で効率的なディープラーニング データ パイプラインを作成する

ディープラーニング モデルのトレーニングに使用される GPU は強力ですが、高価です。 GPU を効...

クラウドサービスが舞台を整え、AIが役割を果たす、これはI/Oに劣らないGoogleテクノロジーカンファレンスです

Google をよく知っていると思っている人でも、Cloud Next カンファレンスについては聞い...

...

人工知能にはどのような専攻が含まれますか?どのような関連専攻を選択できますか?

[[400740]]人工知能専攻は、中国の大学の人材計画に基づいて設立された専攻であり、中国の人工...

AIが指紋を偽造できる場合、生体認証は依然として安全ですか?

[[256506]] 「人工知能技術は、大量の指紋データを『原材料』として利用し、その構造的特徴や...

携帯電話のネットワークアクセスに顔認識が必要ですか?顔認識は私たちの生活にどれくらい近いのでしょうか?

工業情報化部の規定によると、2019年12月1日より、通信事業者はすべてのチャネルで顔認識を実装し、...