最近、ユーザー Linzaer が、エッジ コンピューティング デバイス、モバイル デバイス、PC に適した超軽量のユニバーサル顔検出モデルを Github でオープンソース化しました。このモデル ファイルのサイズはわずか 1 MB で、オープンソース化されるとすぐに Github のトレンド リストのトップに躍り出ました。 わずか数日で、Github で 2.1K のスターと 398 のフォークを獲得しました (Github アドレス: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB) Linzaer氏によると、このモデルはエッジコンピューティングデバイスや低コンピューティングデバイス(ARM推論を使用するなど)向けに設計されており、ARMなどの低コンピューティングデバイスでの一般的なシナリオでリアルタイムの顔検出推論を実行できるほか、モバイル端末やPCにも適用できるという。 主な機能は次のとおりです。
これまでテストされた通常の動作環境は次のとおりです。
精度、速度、モデルサイズの比較トレーニング セットは、Retinaface によって提供されるクリーンな wideface ラベルと wideface データセットを使用して生成され、VOC トレーニング セットが生成されます。 ワイドフェイステスト WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: 320*240 または最大辺長 320 に比例してスケーリング) WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: VGA 640*480 または最大辺長 640 に比例してスケーリング) 端末機器推論速度Raspberry Pi 4B MNN推論テスト時間(単位:ms)(ARM/A72x4/1.5GHz/入力解像度:320x240/int8量子化) モデルサイズの比較画像効果は以下のとおりです。 |
>>: 産業用ロボットを選択するための 9 つの主要なパラメータをご存知ですか?
生成 AI は、ほぼすべての業界で急速に導入され、ビジネス界の状況を急速に変えつつあります。企業は、...
データ分析と人工知能は現在、世界のどの地域でも最も話題になっている技術です。特に昨年のジェネレーティ...
[原文は51CTO.comより] Cloboticsはこのほど、風力タービンブレードの全自動検査の新...
Meta は無料の商用バージョンである Llama 2 をリリースし、ネットワーク全体を席巻しました...
CRF は、品詞タグ付け、単語分割、固有表現認識などのタスクに使用できる、一般的に使用されるシーケン...
2021年に入ってから、自動運転分野の開発は着実に進展しており、4月には自動運転関連のさまざまな動き...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
「市の東にある家で爆弾が爆発しようとしています!」 「爆弾はネズミ捕り、ACデルコ社の単三電池、亜鉛...
人工知能(AI)はAIと略されます。これは、人間の知能をシミュレート、拡張、拡大するための理論、方法...
大規模なネットワーク サービス (コンテンツ ホスティングなど) を実行するには、各サーバーが過負荷...
機械翻訳技術は 80 年以上にわたって開発されてきました。バベルの塔の伝説は過去のものとなりました。...
1. プロジェクトの背景と動機今年初め、OPEN AI の GPT-4 は前例のないマルチモーダル機...
[[206942]]国内外の権威ある20の機関のEconomic Information Daily...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...