この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「ディープ」はディープニューラルネットワーク(DNN)のキーワードです。しかし、ネットワークが深くなるほど、トレーニング中のバックプロパゲーション チェーンが長くなり、推論中の連続計算ステップが増え、レイテンシが高くなります。 深さが十分でない場合、ニューラル ネットワークのパフォーマンスが低下することがよくあります。 こうなると、次のような疑問が生じます。高性能な「非ディープ」ニューラル ネットワークを構築することは可能なのでしょうか? プリンストン大学とインテルの新しい論文は、それが実際に可能であることを証明しています。 彼らは、12 層ネットワークParNetのみを使用して、ImageNet で SOTA に近いパフォーマンスを達成しました。 ParNet は、ImageNet で 80% 以上の精度、CIFAR10 で 96% 以上の精度、CIFAR100 でトップ 1 の精度 81% を達成しています。また、MS-COCO で 48% の AP を達成しています。 ネットワークが非常に「浅い」場合、どのようにそれを実行するのでしょうか? 並列サブネットはパフォーマンスを向上しますParNet における重要な設計上の選択は、並列サブネットワークの使用です。レイヤーを順番に配置するのではなく、並列サブネットワークに配置します。 ParNet は、異なる解像度で機能を処理する並列サブ構造で構成されています。これらの並列サブ構造をストリームと呼びます。異なるストリームからの機能はネットワークの後の段階で融合され、これらの融合された機能は下流のタスクに使用されます。 ParNet では、著者は VGG スタイルのブロックを使用します。ただし、非ディープ ネットワークの場合、3×3 畳み込みの受容フィールドは比較的制限されます。 この問題に対処するために、著者らは Squeeze-and-Excitation 設計に基づいて Skip-Squeeze-Excitation (SSE) レイヤーを構築しました。 SSE モジュールを使用して変更された Rep-VGG は、Rep VGG-SSE と呼ばれます。 ImageNet などの大規模なデータセットの場合、非深層ネットワークでは非線形性が十分でない場合があり、その表現機能が制限される可能性があります。そのため、著者らはReLUをSiLU活性化関数に置き換えました。 同じサイズの RepVGG-SSE ブロックの入力と出力に加えて、ParNet にはダウンサンプリング ブロックと融合ブロックも含まれています。 モジュールは解像度を下げて幅を広げ、マルチスケール処理を可能にします。一方、融合ブロックは複数の解像度からの情報を組み合わせ、推論中のレイテンシを削減するのに役立ちます。 浅い深度で高いパフォーマンスを実現するために、著者らは幅、解像度、ストリーム数を増やすことで ParNet を拡張しました。 著者らは、ムーアの法則が減速するにつれてプロセッサ周波数の増加の余地が限られるため、並列コンピューティングはニューラルネットワークがより高速な推論を実現するのに役立つだろうと述べている。並列構造の非深層ネットワーク ParNet には、この点で利点があります。 実際のパフォーマンスはどうですか?ImageNet データセットでは、ParNet は Top-1 と Top-5 の両方で SOTA のパフォーマンスに近い値を示します。 MS-COCO タスクでは、ParNet は最小のレイテンシで最高のパフォーマンスを実現します。 しかし、層数が少ないにもかかわらずネットワーク幅が広くなるため、「非深層ネットワーク」の実際のパフォーマンスに疑問を抱く人もいます。実際、ParNetはより深いResNet50よりもパラメータが多く、あまり説得力がないようです。 しかし、著者は、「非ディープ」ネットワークは複数の GPU によるより高度な並列コンピューティングを活用できるとも述べています。 最後に、ParNet GitHub ページがセットアップされ、コードはまもなくオープンソース化される予定です。 |
<<: この履歴書は人気があります:14nmコーヒーを手で挽き、マイクロソフトで性感染症を広め、90%の企業が和解の手を差し伸べる
>>: メタバースと自動運転車のどちらが先に来るでしょうか?
国立防衛技術大学、クレムソン大学、Seebit Robotics の研究者らが協力し、深層強化学習を...
(レポート制作者/執筆者:国金証券、翟偉)レポートの概要産業チェーンと市場空間:中国の自動運転は現...
フロスト&サリバンによる最近の分析によると、スマートシティ技術への世界的な投資は2025年までに22...
[[436637]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
ディープラーニングディープフェイクの危険性: 2024 年には、特に仮想顧客サービス環境において、消...
概要: ディープラーニングは、想像もできない形で社会や個人の生活に大きな影響を与えます。今後数年間で...
自然言語処理は AI の最高峰であり、コーパス前処理は自然言語処理の基礎です。 [[336067]]...
著者: Xiao Yanghua、復旦大学コンピュータ科学技術学院准教授、博士課程指導教員、上海イン...
「無力で、自分のやりたいことができない」。これは、世界一の囲碁プレイヤーである柯潔氏が4月27日に...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[251349]]古代、神農は何百種類もの生薬を試飲しましたが、これは実際には薬を人工的に選別する...
現在、莫大な研究開発費と長い研究開発サイクルが、製薬会社の研究開発とイノベーションにおける「障害」に...
[[317667]]写真: 中空の玄関マットの上で動くレインボーダッシュこの記事はLeiphone...