1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

最も軽量な YOLO アルゴリズムがリリースされました!

これは非常に小さなモデルで、現在最速の YOLO アルゴリズムとして知られています。サイズはわずか1.3 MBで、シングルコアの速度は 1 秒あたり 148 フレームであり、モバイル デバイスに簡単に展開できます。

[[341000]]

さらに、このYOLO-Fastest アルゴリズムは、すべてのプラットフォームのニーズを満たします。

PyTorch、Tensorflow、Keras、Caffe のいずれであっても、すべてのプラットフォームで普遍的であると言えます。

さらに、作者は超軽量YOLOの「拡大版」もリリースしました。これも3.5MBしか必要とせず、YOLOv3よりも優れたターゲット検出効果を実現できます。

では、このような軽量ネットワークの検出効果はどうでしょうか?

1.3MB 超軽量 YOLO

検出効果

下の写真は、速く走っている動物を示しています。ご覧のとおり、アルゴリズムはこの動物が鶏である確率が 95% であると予測しています。

動物実験だけでなく人間実験にも効果的です。

図からわかるように、正面の人物の予測確率は90% を超えています。横に近い顔でもシステムは正確に予測できますが、確率は 50% 近くと低くなります。

さらに、YOLOは歩行者や動物だけでなく、テーブルやボトルなどの対象物も検出できることがわかります。

もちろん、テーブルの上には他のボトルもありましたが、それらは検出されませんでした。

このような検出結果を達成するには、1.3MB の YOLO-Fastest モデルのみが必要です。3.0MB の MobileNet-YOLOv3 と比較すると、パラメータが 65% 少なく、速度が 45% 高速です。

ハードウェア要件がそれほど高くなく、精度がより重要な場合は、ここでの YOLO-Fastest-XL がより適しています。

YOLO-Fastest アルゴリズムのこの「大規模バージョン」は、3.5MB のアルゴリズム モデルであり、mAP ははるかに高く、68.8% に達します。

全体的に、YOLO-Fastest は、ある程度の精度 (約 5% mAP) を犠牲にして速度を大幅に向上させたターゲット検出モデルです。

最も強力なモバイル軽量ニューラルネットワークと組み合わせ

なぜこんなに小さいのかというと、このYOLO-Fastestが、モバイルデバイス上で最も強力な軽量ニューラルネットワークとして知られるEfficientNet-liteとペアになっているからです。

これは MobileNet よりも軽量なニューラル ネットワークですが、画像分類には優れたパフォーマンスを発揮します。

EfficientNet-liteアーキテクチャ

ただし、このような圧縮を行うと、ある程度の精度が犠牲になります。YOLOv3と比較すると、 YOLO-FastestモデルのmAPはわずか60.8%です

しかし、容量が限られているハードウェアの場合は、これで十分です。

では、ターゲット検出アルゴリズムで YOLO を選択する理由は何でしょうか?

YOLO: 高速オブジェクト検出

ターゲット検出アルゴリズム YOLO の核心は、モデルのサイズが小さく、計算速度が速いことにあります。

R-CNN シリーズのアルゴリズム (Fast R-CNN、Faster R-CNN など) と比較すると、YOLO の精度はそれほど良くありませんが、速度は非常に高速です。

検出速度は、前のフレーム(下図のカラフルな枠)の変化の頻度からわかります。

速度を追求する理由は、セキュリティや自動運転の分野ではターゲット検出が中核アルゴリズムであり、リアルタイム動作が求められるからです。

警備員が泥棒の存在を検知するのに数秒かかったり、自動運転車が検問所を感知するのに非常に時間がかかったりすると、結果は悲惨なものになる可能性があります。

[[341003]]

その後誕生した SSD アルゴリズムは、R-CNN アルゴリズムと YOLO アルゴリズムの妥協案のようなものです。しかし、ストレージ容量が限られている一部のハードウェアでは、YOLO のみが「ロード」されることになります。

YOLO-Fastest モデルはわずか 230 MFLOPS (1 秒あたり 230 万回の浮動小数点演算) ですが、計算能力が不十分なハードウェアでも小型マシンで実行できるようになります。

著者関連

興味深いことに、GitHub の dog-qiuqiu という作者は、以前に MobileNet 画像分類アルゴリズムに基づいて YOLOv3 (GitHub 1.1k スター) を作成しており、これもすべてのプラットフォームで使用できます。

それだけでなく、すべてのプラットフォームで汎用的なこの MobileNet-YOLOv3 は、サイズと精度の両方で MobileNet-SSD よりも優れています。

MobileNet-YOLOv3 は、サイズがわずか 8.0MB (SSD と比較して 15.1MB の削減) でありながら、mAP 73.26% (SSD と比較して 0.56% の増加) を達成しました。

ご興味がございましたら、以下のポータルをクリックして、このターゲット検出アルゴリズムをご覧ください。

ポータル

1.3MBの超軽量YOLO:
https://github.com/dog-qiuqiu/Yolo-Fastest

MobileNet-YOLO は SSD よりも優れたパフォーマンスを発揮します。
https://github.com/dog-qiuqiu/MobileNet-Yolo

<<:  滴滴出行副社長の葉潔平氏が辞任した。同氏は旅行大手のAI部門の責任者だった。

>>:  専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

ブログ    
ブログ    

推薦する

...

大規模言語モデルを導入し、国内初のコンピューティングパワーエコシステムをサポートする新しいオープンソースRLフレームワークRLLTEが登場

近年、強化学習に対する研究熱は高まり続けており、インテリジェント製造、自動運転、大規模言語モデルなど...

GPT-5 プレビュー!アレン人工知能研究所がGPT-5の新機能を予測する最も強力なマルチモーダルモデルを発表

GPT-5 はいつ登場し、どのような機能を持つのでしょうか?アレンAI研究所の新しいモデルがその答え...

...

...

マイクロソフトは低コストのAIモデルを見つけるために多方面に賭けている

マイクロソフトはOpenAI LPの半分以下を所有していると言われているが、それでもパワーは劣るがよ...

...

5GとAI: 現在と未来の補完的なテクノロジー

テクノロジーの世界では、人工知能と 5G、そしてそれらがもたらす変革の可能性について大きな話題が飛び...

ファーウェイ、次世代スマート製品戦略と新+AIシリーズ製品を発表

[中国、上海、2019年9月18日] ファーウェイはHUAWEI CONNECT 2019で、Eng...

ワシントンポスト紙の李開復氏のコラム:お金を与えることでAI失業危機は解決するのか?シリコンバレーの大物は世間知らずすぎる

AI革命が到来し、それは最良の時代になるかもしれないし、最悪の時代になるかもしれない。それが良いこと...

人工知能技術の発展の概要

[[352219]]人工知能は、コンピュータサイエンス業界のトップテクノロジーの一つとして、1956...

再現可能なロボット合成のために化学者とロボットが理解できる汎用化学プログラミング言語

化学合成に関する文献の量は急速に増加していますが、新しいプロセスを研究室間で共有し評価するには長い時...

宇宙も「独学」です!このプロセスは機械学習アルゴリズムに似ており、物理法則を刷新するものである。

宇宙は自ら学ぶことができるのでしょうか?科学者たちは、自ら学ぶ能力を持つ宇宙、「自己学習宇宙」という...

これはオートエンコーダーとRNNの両方である。DeepMindの科学者は拡散モデルを8つの観点から分析する。

最も人気のある AI ペイント ツールの 1 つである Stable Diffusion を試したこ...