1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最も軽量な YOLO アルゴリズムがリリースされました!

これは非常に小さなモデルで、現在最速の YOLO アルゴリズムとして知られています。サイズはわずか1.3 MBで、シングルコアの速度は 1 秒あたり 148 フレームであり、モバイル デバイスに簡単に展開できます。

[[341000]]

さらに、このYOLO-Fastest アルゴリズムは、すべてのプラットフォームのニーズを満たします。

PyTorch、Tensorflow、Keras、Caffe のいずれであっても、すべてのプラットフォームで普遍的であると言えます。

さらに、作者は超軽量YOLOの「拡大版」もリリースしました。これも3.5MBしか必要とせず、YOLOv3よりも優れたターゲット検出効果を実現できます。

では、このような軽量ネットワークの検出効果はどうでしょうか?

1.3MB 超軽量 YOLO

検出効果

下の写真は、速く走っている動物を示しています。ご覧のとおり、アルゴリズムはこの動物が鶏である確率が 95% であると予測しています。

動物実験だけでなく人間実験にも効果的です。

図からわかるように、正面の人物の予測確率は90% を超えています。横に近い顔でもシステムは正確に予測できますが、確率は 50% 近くと低くなります。

さらに、YOLOは歩行者や動物だけでなく、テーブルやボトルなどの対象物も検出できることがわかります。

もちろん、テーブルの上には他のボトルもありましたが、それらは検出されませんでした。

このような検出結果を達成するには、1.3MB の YOLO-Fastest モデルのみが必要です。3.0MB の MobileNet-YOLOv3 と比較すると、パラメータが 65% 少なく、速度が 45% 高速です。

ハードウェア要件がそれほど高くなく、精度がより重要な場合は、ここでの YOLO-Fastest-XL がより適しています。

YOLO-Fastest アルゴリズムのこの「大規模バージョン」は、3.5MB のアルゴリズム モデルであり、mAP ははるかに高く、68.8% に達します。

全体的に、YOLO-Fastest は、ある程度の精度 (約 5% mAP) を犠牲にして速度を大幅に向上させたターゲット検出モデルです。

最も強力なモバイル軽量ニューラルネットワークと組み合わせ

なぜこんなに小さいのかというと、このYOLO-Fastestが、モバイルデバイス上で最も強力な軽量ニューラルネットワークとして知られるEfficientNet-liteとペアになっているからです。

これは MobileNet よりも軽量なニューラル ネットワークですが、画像分類には優れたパフォーマンスを発揮します。

EfficientNet-liteアーキテクチャ

ただし、このような圧縮を行うと、ある程度の精度が犠牲になります。YOLOv3と比較すると、 YOLO-FastestモデルのmAPはわずか60.8%です

しかし、容量が限られているハードウェアの場合は、これで十分です。

では、ターゲット検出アルゴリズムで YOLO を選択する理由は何でしょうか?

YOLO: 高速オブジェクト検出

ターゲット検出アルゴリズム YOLO の核心は、モデルのサイズが小さく、計算速度が速いことにあります。

R-CNN シリーズのアルゴリズム (Fast R-CNN、Faster R-CNN など) と比較すると、YOLO の精度はそれほど良くありませんが、速度は非常に高速です。

検出速度は、前のフレーム(下図のカラフルな枠)の変化の頻度からわかります。

速度を追求する理由は、セキュリティや自動運転の分野ではターゲット検出が中核アルゴリズムであり、リアルタイム動作が求められるからです。

警備員が泥棒の存在を検知するのに数秒かかったり、自動運転車が検問所を感知するのに非常に時間がかかったりすると、結果は悲惨なものになる可能性があります。

[[341003]]

その後誕生した SSD アルゴリズムは、R-CNN アルゴリズムと YOLO アルゴリズムの妥協案のようなものです。しかし、ストレージ容量が限られている一部のハードウェアでは、YOLO のみが「ロード」されることになります。

YOLO-Fastest モデルはわずか 230 MFLOPS (1 秒あたり 230 万回の浮動小数点演算) ですが、計算能力が不十分なハードウェアでも小型マシンで実行できるようになります。

著者関連

興味深いことに、GitHub の dog-qiuqiu という作者は、以前に MobileNet 画像分類アルゴリズムに基づいて YOLOv3 (GitHub 1.1k スター) を作成しており、これもすべてのプラットフォームで使用できます。

それだけでなく、すべてのプラットフォームで汎用的なこの MobileNet-YOLOv3 は、サイズと精度の両方で MobileNet-SSD よりも優れています。

MobileNet-YOLOv3 は、サイズがわずか 8.0MB (SSD と比較して 15.1MB の削減) でありながら、mAP 73.26% (SSD と比較して 0.56% の増加) を達成しました。

ご興味がございましたら、以下のポータルをクリックして、このターゲット検出アルゴリズムをご覧ください。

ポータル

1.3MBの超軽量YOLO:
https://github.com/dog-qiuqiu/Yolo-Fastest

MobileNet-YOLO は SSD よりも優れたパフォーマンスを発揮します。
https://github.com/dog-qiuqiu/MobileNet-Yolo

<<:  滴滴出行副社長の葉潔平氏が辞任した。同氏は旅行大手のAI部門の責任者だった。

>>:  専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

手書きを模倣するAIが独自のフォントを作成

手書き模倣AIの研究背景諺にあるように、人の筆跡はその人の性格を表す。硬い印刷フォントと比較すると、...

自動駐車を徹底研究!業界標準の動向、評価指標、システム紹介まであらゆる角度から収集!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

GPT-4よりも優れた20億パラメータモデルは、ほぼ100%の精度で算術問題を解く

現在、大規模言語モデル (LLM) は、NLP の分野におけるさまざまな下流タスクの処理において優れ...

...

...

脳をシミュレートする NLP、クヌース賞受賞: 文解析のためのニューロン集団計算

[[402907]]先週、Google Research はディープラーニングにおける概念理解に関す...

Google の最も強力な NLP モデル BERT はなぜこれほどクールで強力なのでしょうか?テンセントのプログラマーが最初から教えてくれる

1. 背景検索シナリオでは、ユーザーの検索クエリと思い出された記事のタイトルとの関連性は、ユーザーの...

673本の論文を要約し、UIUCなどが20ヶ月で完成させた信頼性の高い機械学習レビューを発表

少し前、UIUC と南洋理工大学の 3 人の研究者が 20 か月かけて 673 本の論文を研究し、信...

自動運転のジレンマと選択

ここ数年、自動運転車に対する熱狂が高まっています。これは確かに合理的です。自動運転車は、燃費の向上、...

Nvidiaは写真編集ソフトウェアGANを

[[438694]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

「緊急天使」がロボットを救出するために前進し、事態を収拾した

科学技術の進歩と社会の発展に伴い、ロボット産業は繁栄の時代を迎えています。ロボット工学は、コンピュー...

上位985大学の「人工知能」関連学部・専攻一覧!ぜひ集めてみてください!

今最もホットな分野といえば、間違いなく「人工知能」でしょう。給与面でも人材ギャップの面でも、この分野...

マイクロサービスにおける電流制限ロジックとアルゴリズム

[[341117]]この記事はWeChatの公開アカウント「Invincible Coder」から転...

第4世代ロボットが発売。Lingdong TechnologyのAMR分野における粘り強さと革新

AGV と比較すると、V-AMR ロボットの利点は、特にビジネス プロセス、倉庫の変革、展開サイクル...

最高の AI スタートアップはどれですか? 6つの選択肢があなたに方向性を与える

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...