サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

最近、ユーザー Linzaer が、エッジ コンピューティング デバイス、モバイル デバイス、PC に適した超軽量のユニバーサル顔検出モデルを Github でオープンソース化しました。このモデル ファイルのサイズはわずか 1 MB で、オープンソース化されるとすぐに Github のトレンド リストのトップに躍り出ました。

わずか数日で、Github で 2.1K のスターと 398 のフォークを獲得しました (Github アドレス: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)

Linzaer氏によると、このモデルはエッジコンピューティングデバイスや低コンピューティングデバイス(ARM推論を使用するなど)向けに設計されており、ARMなどの低コンピューティングデバイスでの一般的なシナリオでリアルタイムの顔検出推論を実行できるほか、モバイル端末やPCにも適用できるという。

主な機能は次のとおりです。

  • モデルサイズに関しては、デフォルトの FP32 精度 (.pth) ファイルサイズは 1.04 ~ 1.1 MB で、int8 量子化後の推論フレームワークのサイズは約 300 KB です。
  • モデル計算に関しては、入力解像度は 320x240、スループットは約 90~109 MFlops です。
  • このモデルには、バージョン スリム (合理化されたバックボーンによりわずかに高速化) とバージョン RFB (より高い精度のために修正された RFB モジュールが追加された) の 2 つのバージョンがあります。
  • さまざまなアプリケーション シナリオでより適切に動作するように、320 x 240 と 640 x 480 の異なる入力解像度でワイドフェイスを使用してトレーニングされた事前トレーニング済みモデルが提供されます。
  • 移植と推論を容易にするために onnx エクスポートをサポートします。

これまでテストされた通常の動作環境は次のとおりです。

  • Ubuntu 16.04、Ubuntu 18.04、Windows 10 (推論)
  • Python 3.6
  • パイトーチ 1.2
  • CUDA10.0 + CUDNN7.6

精度、速度、モデルサイズの比較

トレーニング セットは、Retinaface によって提供されるクリーンな wideface ラベルと wideface データセットを使用して生成され、VOC トレーニング セットが生成されます。

ワイドフェイステスト

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: 320*240 または最大辺長 320 に比例してスケーリング)

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: VGA 640*480 または最大辺長 640 に比例してスケーリング)

端末機器推論速度

Raspberry Pi 4B MNN推論テスト時間(単位:ms)(ARM/A72x4/1.5GHz/入力解像度:320x240/int8量子化)

モデルサイズの比較

画像効果は以下のとおりです。

<<:  AI は鉱業をどのように改善できるのでしょうか?

>>:  産業用ロボットを選択するための 9 つの主要なパラメータをご存知ですか?

ブログ    
ブログ    

推薦する

K近傍教師あり学習マシンアルゴリズムの詳細な分析

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟K 近傍法 (KNN) は、機械学習アルゴリズムにおける回...

Apple、Googleなど大企業のAI面接の質問を入手しました。あなたは挑戦してみますか?

何?大手テクノロジー企業の面接の質問が漏洩した?そんなわけないですよね~。海外の有名なブログプラット...

人工知能教育とは何ですか?将来の教育の顕著な特徴は何でしょうか?

グローバル情報化教育の時代において、教育モデル、教育内容、学習方法は大きな変化を遂げており、人工知能...

ピュー研究所の報告:2025年までにAIのせいで7500万人が解雇される

[[253650]]テクノロジー専門家の約 37% は、人工知能 (AI) と関連技術の進歩により、...

ビジネス上の問題を機械学習の問題に変換するにはどうすればよいでしょうか?

[[197632]]機械学習が価値を変革するための最も重要なステップは何ですか?ビジネス上の問題に...

...

...

...

AIダイナミックセキュリティガードデータセンター

最近の世界的な調査によると、企業の事業がハッキングされると莫大な損失が発生し、サイバー攻撃1回あたり...

AI の将来とそれがビジネスに与える意味は何でしょうか?

10 年以内に、人々は複雑なデジタル環境において人工知能 (AI) にますます依存するようになるで...

教師なし機械学習の基本ガイド

[51CTO.com クイック翻訳] 教師なし機械学習と人工知能は、組織のビジネス成長に役立つことは...

生成型 AI がソフトウェア開発を変える 10 の方法

翻訳者 |陳俊レビュー | Chonglou 1990 年代にソフトウェア プログラミングについて話...

建築設計におけるスマートビルディングと IoT の統合

技術が急速に進歩する時代において、私たちと建築との関係は大きな変化を遂げています。もはやレンガやモル...

教育割引 Github AI インテリジェントコーディングアシスタント Copilot は、コードに不慣れな場合の悩みを解決します

教育機関向けオファー Github AI スマートコーディングアシスタント コパイロットAIプログラ...

教育用人工知能における倫理的リスクを排除する方法

人工知能は国際競争の新たな焦点となりつつあり、同時に人類社会に新たな発展の機会をもたらしています。機...