1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最も軽量な YOLO アルゴリズムがリリースされました!

これは非常に小さなモデルで、現在最速の YOLO アルゴリズムとして知られています。サイズはわずか1.3 MBで、シングルコアの速度は 1 秒あたり 148 フレームであり、モバイル デバイスに簡単に展開できます。

[[341000]]

さらに、このYOLO-Fastest アルゴリズムは、すべてのプラットフォームのニーズを満たします。

PyTorch、Tensorflow、Keras、Caffe のいずれであっても、すべてのプラットフォームで普遍的であると言えます。

さらに、作者は超軽量YOLOの「拡大版」もリリースしました。これも3.5MBしか必要とせず、YOLOv3よりも優れたターゲット検出効果を実現できます。

では、このような軽量ネットワークの検出効果はどうでしょうか?

1.3MB 超軽量 YOLO

検出効果

下の写真は、速く走っている動物を示しています。ご覧のとおり、アルゴリズムはこの動物が鶏である確率が 95% であると予測しています。

動物実験だけでなく人間実験にも効果的です。

図からわかるように、正面の人物の予測確率は90% を超えています。横に近い顔でもシステムは正確に予測できますが、確率は 50% 近くと低くなります。

さらに、YOLOは歩行者や動物だけでなく、テーブルやボトルなどの対象物も検出できることがわかります。

もちろん、テーブルの上には他のボトルもありましたが、それらは検出されませんでした。

このような検出結果を達成するには、1.3MB の YOLO-Fastest モデルのみが必要です。3.0MB の MobileNet-YOLOv3 と比較すると、パラメータが 65% 少なく、速度が 45% 高速です。

ハードウェア要件がそれほど高くなく、精度がより重要な場合は、ここでの YOLO-Fastest-XL がより適しています。

YOLO-Fastest アルゴリズムのこの「大規模バージョン」は、3.5MB のアルゴリズム モデルであり、mAP ははるかに高く、68.8% に達します。

全体的に、YOLO-Fastest は、ある程度の精度 (約 5% mAP) を犠牲にして速度を大幅に向上させたターゲット検出モデルです。

最も強力なモバイル軽量ニューラルネットワークと組み合わせ

なぜこんなに小さいのかというと、このYOLO-Fastestが、モバイルデバイス上で最も強力な軽量ニューラルネットワークとして知られるEfficientNet-liteとペアになっているからです。

これは MobileNet よりも軽量なニューラル ネットワークですが、画像分類には優れたパフォーマンスを発揮します。

EfficientNet-liteアーキテクチャ

ただし、このような圧縮を行うと、ある程度の精度が犠牲になります。YOLOv3と比較すると、 YOLO-FastestモデルのmAPはわずか60.8%です

しかし、容量が限られているハードウェアの場合は、これで十分です。

では、ターゲット検出アルゴリズムで YOLO を選択する理由は何でしょうか?

YOLO: 高速オブジェクト検出

ターゲット検出アルゴリズム YOLO の核心は、モデルのサイズが小さく、計算速度が速いことにあります。

R-CNN シリーズのアルゴリズム (Fast R-CNN、Faster R-CNN など) と比較すると、YOLO の精度はそれほど良くありませんが、速度は非常に高速です。

検出速度は、前のフレーム(下図のカラフルな枠)の変化の頻度からわかります。

速度を追求する理由は、セキュリティや自動運転の分野ではターゲット検出が中核アルゴリズムであり、リアルタイム動作が求められるからです。

警備員が泥棒の存在を検知するのに数秒かかったり、自動運転車が検問所を感知するのに非常に時間がかかったりすると、結果は悲惨なものになる可能性があります。

[[341003]]

その後誕生した SSD アルゴリズムは、R-CNN アルゴリズムと YOLO アルゴリズムの妥協案のようなものです。しかし、ストレージ容量が限られている一部のハードウェアでは、YOLO のみが「ロード」されることになります。

YOLO-Fastest モデルはわずか 230 MFLOPS (1 秒あたり 230 万回の浮動小数点演算) ですが、計算能力が不十分なハードウェアでも小型マシンで実行できるようになります。

著者関連

興味深いことに、GitHub の dog-qiuqiu という作者は、以前に MobileNet 画像分類アルゴリズムに基づいて YOLOv3 (GitHub 1.1k スター) を作成しており、これもすべてのプラットフォームで使用できます。

それだけでなく、すべてのプラットフォームで汎用的なこの MobileNet-YOLOv3 は、サイズと精度の両方で MobileNet-SSD よりも優れています。

MobileNet-YOLOv3 は、サイズがわずか 8.0MB (SSD と比較して 15.1MB の削減) でありながら、mAP 73.26% (SSD と比較して 0.56% の増加) を達成しました。

ご興味がございましたら、以下のポータルをクリックして、このターゲット検出アルゴリズムをご覧ください。

ポータル

1.3MBの超軽量YOLO:
https://github.com/dog-qiuqiu/Yolo-Fastest

MobileNet-YOLO は SSD よりも優れたパフォーマンスを発揮します。
https://github.com/dog-qiuqiu/MobileNet-Yolo

<<:  滴滴出行副社長の葉潔平氏が辞任した。同氏は旅行大手のAI部門の責任者だった。

>>:  専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

ブログ    
ブログ    
ブログ    

推薦する

ロボティック プロセス オートメーションの 10 大メリット

ロボティック プロセス オートメーション (RPA) ソリューションは、人間が日常的に実行する多くの...

機械学習は株式市場を正確に予測できるのでしょうか?

株式市場が始まって以来、人々はシステムを悪用し、市場に勝とうとしてきました。長年にわたり、人々は何千...

人工知能の「指紋採取」が検出困難な癌と闘う

検出が難しい膠芽腫などの癌の生存率は1桁ですが、早期治療には検出、治療、監視のための高度な技術が必要...

専門家の意見: AIアプリケーションでは、ビッグデータよりもワイドデータが価値がある

今日の急速に変化するデジタル世界では、データの使用は進化し続けており、企業は構造化データと非構造化デ...

人工知能の実例5つ

ここでは、AI が日常生活で非常に正確に使用されている 5 つのベスト例を紹介します。人工知能 (A...

ケーススタディ | 埋め込みに基づく特徴セキュアな計算

[[331789]]序文従来のデータの公開と共有の方法の多くは、生のデータをプレーンテキストで直接出...

騒動を巻き起こしたディープマインドの論文は万能ではない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

新しいディープラーニングモデルがエッジデバイスに画像セグメンテーションをもたらす方法

[51CTO.com クイック翻訳]画像セグメンテーションは、画像内のオブジェクトの境界と領域を決定...

...

NLP ビッグモデルを時系列に適用するにはどうすればよいでしょうか? 5つの方法をまとめました!

最近、カリフォルニア大学は時系列の大規模言語モデルに関する研究のレビューを発表しました。この記事では...

トランスフォーマーの簡易版がここにあります、ネットユーザー:今年の論文

Transformer アーキテクチャは、ディープラーニング分野における最近の多くの成功の原動力であ...

人工知能とクラウドコンピューティングはアプリケーションエコシステムの形成を加速させている

[[430244]]現在、人工知能は生産性の向上を可能にし、さまざまな産業のインテリジェント化と新旧...

...

ブースティングとバギング: 堅牢な機械学習アルゴリズムを開発する方法

導入機械学習とデータ サイエンスでは、単にデータを Python ライブラリに投入してその結果を活用...

CAIOは企業が緊急に必要とする人材になりつつある

数え切れないほど多くの企業が AI 技術の研究や導入に競い合う中、多くの企業が熟練した AI チーム...