この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 最も軽量な YOLO アルゴリズムがリリースされました! これは非常に小さなモデルで、現在最速の YOLO アルゴリズムとして知られています。サイズはわずか1.3 MBで、シングルコアの速度は 1 秒あたり 148 フレームであり、モバイル デバイスに簡単に展開できます。 さらに、このYOLO-Fastest アルゴリズムは、すべてのプラットフォームのニーズを満たします。 PyTorch、Tensorflow、Keras、Caffe のいずれであっても、すべてのプラットフォームで普遍的であると言えます。 さらに、作者は超軽量YOLOの「拡大版」もリリースしました。これも3.5MBしか必要とせず、YOLOv3よりも優れたターゲット検出効果を実現できます。 では、このような軽量ネットワークの検出効果はどうでしょうか? 1.3MB 超軽量 YOLO検出効果下の写真は、速く走っている動物を示しています。ご覧のとおり、アルゴリズムはこの動物が鶏である確率が 95% であると予測しています。 動物実験だけでなく人間実験にも効果的です。 図からわかるように、正面の人物の予測確率は90% を超えています。横に近い顔でもシステムは正確に予測できますが、確率は 50% 近くと低くなります。 さらに、YOLOは歩行者や動物だけでなく、テーブルやボトルなどの対象物も検出できることがわかります。 もちろん、テーブルの上には他のボトルもありましたが、それらは検出されませんでした。 このような検出結果を達成するには、1.3MB の YOLO-Fastest モデルのみが必要です。3.0MB の MobileNet-YOLOv3 と比較すると、パラメータが 65% 少なく、速度が 45% 高速です。 ハードウェア要件がそれほど高くなく、精度がより重要な場合は、ここでの YOLO-Fastest-XL がより適しています。 YOLO-Fastest アルゴリズムのこの「大規模バージョン」は、3.5MB のアルゴリズム モデルであり、mAP ははるかに高く、68.8% に達します。 全体的に、YOLO-Fastest は、ある程度の精度 (約 5% mAP) を犠牲にして、速度を大幅に向上させたターゲット検出モデルです。 最も強力なモバイル軽量ニューラルネットワークと組み合わせなぜこんなに小さいのかというと、このYOLO-Fastestが、モバイルデバイス上で最も強力な軽量ニューラルネットワークとして知られるEfficientNet-liteとペアになっているからです。 これは MobileNet よりも軽量なニューラル ネットワークですが、画像分類には優れたパフォーマンスを発揮します。 EfficientNet-liteアーキテクチャ ただし、このような圧縮を行うと、ある程度の精度が犠牲になります。YOLOv3と比較すると、 YOLO-FastestモデルのmAPはわずか60.8%です。 しかし、容量が限られているハードウェアの場合は、これで十分です。 では、ターゲット検出アルゴリズムで YOLO を選択する理由は何でしょうか? YOLO: 高速オブジェクト検出ターゲット検出アルゴリズム YOLO の核心は、モデルのサイズが小さく、計算速度が速いことにあります。 R-CNN シリーズのアルゴリズム (Fast R-CNN、Faster R-CNN など) と比較すると、YOLO の精度はそれほど良くありませんが、速度は非常に高速です。 検出速度は、前のフレーム(下図のカラフルな枠)の変化の頻度からわかります。 速度を追求する理由は、セキュリティや自動運転の分野ではターゲット検出が中核アルゴリズムであり、リアルタイム動作が求められるからです。 警備員が泥棒の存在を検知するのに数秒かかったり、自動運転車が検問所を感知するのに非常に時間がかかったりすると、結果は悲惨なものになる可能性があります。 その後誕生した SSD アルゴリズムは、R-CNN アルゴリズムと YOLO アルゴリズムの妥協案のようなものです。しかし、ストレージ容量が限られている一部のハードウェアでは、YOLO のみが「ロード」されることになります。 YOLO-Fastest モデルはわずか 230 MFLOPS (1 秒あたり 230 万回の浮動小数点演算) ですが、計算能力が不十分なハードウェアでも小型マシンで実行できるようになります。 著者関連興味深いことに、GitHub の dog-qiuqiu という作者は、以前に MobileNet 画像分類アルゴリズムに基づいて YOLOv3 (GitHub 1.1k スター) を作成しており、これもすべてのプラットフォームで使用できます。 それだけでなく、すべてのプラットフォームで汎用的なこの MobileNet-YOLOv3 は、サイズと精度の両方で MobileNet-SSD よりも優れています。 MobileNet-YOLOv3 は、サイズがわずか 8.0MB (SSD と比較して 15.1MB の削減) でありながら、mAP 73.26% (SSD と比較して 0.56% の増加) を達成しました。 ご興味がございましたら、以下のポータルをクリックして、このターゲット検出アルゴリズムをご覧ください。 ポータル 1.3MBの超軽量YOLO: MobileNet-YOLO は SSD よりも優れたパフォーマンスを発揮します。 |
<<: 滴滴出行副社長の葉潔平氏が辞任した。同氏は旅行大手のAI部門の責任者だった。
>>: 専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない
近年、強化学習に対する研究熱は高まり続けており、インテリジェント製造、自動運転、大規模言語モデルなど...
GPT-5 はいつ登場し、どのような機能を持つのでしょうか?アレンAI研究所の新しいモデルがその答え...
マイクロソフトはOpenAI LPの半分以下を所有していると言われているが、それでもパワーは劣るがよ...
テクノロジーの世界では、人工知能と 5G、そしてそれらがもたらす変革の可能性について大きな話題が飛び...
[中国、上海、2019年9月18日] ファーウェイはHUAWEI CONNECT 2019で、Eng...
[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミット...
AI革命が到来し、それは最良の時代になるかもしれないし、最悪の時代になるかもしれない。それが良いこと...
[[352219]]人工知能は、コンピュータサイエンス業界のトップテクノロジーの一つとして、1956...
化学合成に関する文献の量は急速に増加していますが、新しいプロセスを研究室間で共有し評価するには長い時...
宇宙は自ら学ぶことができるのでしょうか?科学者たちは、自ら学ぶ能力を持つ宇宙、「自己学習宇宙」という...
最も人気のある AI ペイント ツールの 1 つである Stable Diffusion を試したこ...