1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

最も軽量な YOLO アルゴリズムがリリースされました!

これは非常に小さなモデルで、現在最速の YOLO アルゴリズムとして知られています。サイズはわずか1.3 MBで、シングルコアの速度は 1 秒あたり 148 フレームであり、モバイルデバイスに簡単に展開できます。

さらに、このYOLO-Fastest アルゴリズムは、すべてのプラットフォームのニーズを満たします。

PyTorch、Tensorflow、Keras、Caffe のいずれであっても、すべてのプラットフォームで普遍的であると言えます。

さらに、作者は超軽量YOLOの「拡大版」もリリースしました。これも3.5MBしか必要とせず、YOLOv3よりも優れたターゲット検出効果を実現できます。

では、このような軽量ネットワークの検出効果はどうでしょうか?

1.3MB 超軽量 YOLO

検出効果

下の写真は、速く走っている動物を示しています。ご覧のとおり、アルゴリズムはこの動物が鶏である確率が 95% であると予測しています。

動物実験だけでなく人間実験にも効果的です。

図からわかるように、正面の人物の予測確率は90% を超えています。横に近い顔でもシステムは正確に予測できますが、確率は 50% 近くと低くなります。

さらに、YOLOは歩行者や動物だけでなく、テーブルやボトルなどの対象物も検出できることがわかります。

もちろん、テーブルの上には他のボトルもありましたが、それらは検出されませんでした。

このような検出結果を達成するには、1.3MB の YOLO-Fastest モデルのみが必要です。3.0MB の MobileNet-YOLOv3 と比較すると、パラメータが 65% 少なく、速度が 45% 高速です。

ハードウェア要件がそれほど高くなく、精度がより重要な場合は、ここでの YOLO-Fastest-XL がより適しています。

YOLO-Fastest アルゴリズムのこの「大規模バージョン」は、3.5MB のアルゴリズムモデルであり、mAP ははるかに高く、68.8% に達します。

全体的に、YOLO-Fastest は、ある程度の精度 (約 5% mAP) を犠牲にして、速度を大幅に向上させたターゲット検出モデルです。

最も強力なモバイル軽量ニューラルネットワークと組み合わせ

なぜこんなに小さいのかというと、このYOLO-Fastestが、モバイルデバイス上で最も強力な軽量ニューラルネットワークとして知られるEfficientNet-liteとペアになっているからです。

これは MobileNet よりも軽量なニューラルネットワークですが、画像分類には優れたパフォーマンスを発揮します。

EfficientNet-liteアーキテクチャ

ただし、このような圧縮を行うと、ある程度の精度が犠牲になります。YOLOv3と比較すると、 YOLO-FastestモデルのmAPはわずか60.8%です。

しかし、容量が限られているハードウェアの場合は、これで十分です。

では、ターゲット検出アルゴリズムで YOLO を選択する理由は何でしょうか?

YOLO: 高速オブジェクト検出

ターゲット検出アルゴリズム YOLO の核心は、モデルのサイズが小さく、計算速度が速いことにあります。

R-CNN シリーズのアルゴリズム (Fast R-CNN、Faster R-CNN など) と比較すると、YOLO の精度はそれほど良くありませんが、速度は非常に高速です。

検出速度は、前のフレーム（下図のカラフルな枠）の変化の頻度からわかります。

速度を追求する理由は、セキュリティや自動運転の分野ではターゲット検出が中核アルゴリズムであり、リアルタイム動作が求められるからです。

警備員が泥棒の存在を検知するのに数秒かかったり、自動運転車が検問所を感知するのに非常に時間がかかったりすると、結果は悲惨なものになる可能性があります。

その後誕生した SSD アルゴリズムは、R-CNN アルゴリズムと YOLO アルゴリズムの妥協案のようなものです。しかし、ストレージ容量が限られている一部のハードウェアでは、YOLO のみが「ロード」されることになります。

YOLO-Fastest モデルはわずか 230 MFLOPS (1 秒あたり 230 万回の浮動小数点演算) ですが、計算能力が不十分なハードウェアでも小型マシンで実行できるようになります。

著者関連

興味深いことに、GitHub の dog-qiuqiu という作者は、以前に MobileNet 画像分類アルゴリズムに基づいて YOLOv3 (GitHub 1.1k スター) を作成しており、これもすべてのプラットフォームで使用できます。

それだけでなく、すべてのプラットフォームで汎用的なこの MobileNet-YOLOv3 は、サイズと精度の両方で MobileNet-SSD よりも優れています。

MobileNet-YOLOv3 は、サイズがわずか 8.0MB (SSD と比較して 15.1MB の削減) でありながら、mAP 73.26% (SSD と比較して 0.56% の増加) を達成しました。

ご興味がございましたら、以下のポータルをクリックして、このターゲット検出アルゴリズムをご覧ください。

ポータル

1.3MBの超軽量YOLO:
https://github.com/dog-qiuqiu/Yolo-Fastest

MobileNet-YOLO は SSD よりも優れたパフォーマンスを発揮します。
https://github.com/dog-qiuqiu/MobileNet-Yolo

<<: 滴滴出行副社長の葉潔平氏が辞任した。同氏は旅行大手のAI部門の責任者だった。

>>: 専門家：TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

1.3MB の超軽量 YOLO アルゴリズム!すべてのプラットフォームで利用可能、45% 高速 | オープンソース

1.3MB 超軽量 YOLO

検出効果

最も強力なモバイル軽量ニューラルネットワークと組み合わせ

YOLO: 高速オブジェクト検出

著者関連

実験から実装まで: AI が金融サービスでその価値を証明している方法

データセンターにおけるAI技術の応用

ChatGPT がリリースされてから 1 年が経ちました。主要なオープンソースモデルはすべて追いついたのでしょうか?

Googleの研究は数学の問題をコードに変換することで、機械証明の精度を大幅に向上させた。

2021 年の人工知能データ収集および注釈業界の 4 つの主要トレンド予測

AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

大学における人工知能への熱意を「クール」に振り返る

アルパカ科全体よりも優れたMeta AIの新しい自己アライメント手法は、人間の注釈データをほとんど必要としません

「大学受験5年間・シミュレーション3年間」の大型模型版が登場！ 6141 の数学の問題、マルチモーダルの問題

推薦する

市場を席巻するアメリカの5大テクノロジー企業はAI時代にさらに勢力を拡大するのでしょうか？

クラウドコンピューティング機械学習プラットフォームの選び方

小さなターゲットを検出するためのディープラーニングの一般的な方法

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

ChatGPT vs AutoGPT: トップ言語モデルの比較

百度副社長の尹世明氏：人工知能のプライバシー問題は技術で解決できる

700 を超えるチームが登録し、「ICV アルゴリズム研究タスクの第 1 バッチ」の登録フェーズが成功裏に終了しました。

PythonでChatGPT APIを使用してリアルタイムデータを処理する方法

製造業者はデジタルツインをどのように活用して生産性を向上できるでしょうか?

AI倫理: CIOが問うべき5つの質問

AIツールはリモートワーク中のチームの生産性向上に役立ちます