テクノロジー|軽量顔検出アルゴリズムの徹底レビュー

テクノロジー|軽量顔検出アルゴリズムの徹底レビュー

顔検出は、幅広いアプリケーションと多くの研究者を抱えるコンピューター ビジョンの古くからのトピックです。業界はより正確な検出アルゴリズムに向かっているだけでなく、軽量の顔検出アルゴリズムもアプリケーションの寵児になりつつあります。この記事では、近年の軽量顔検出アルゴリズムのオープンソース実装についてまとめています。その多くはオープンソース コミュニティのスター プロジェクトとなっています。

01超軽量高速汎用顔検出器 1MB

Github スター: 4.8k

パラメータサイズ: 1.04~1.1MB、int8量子化後約300KB

Github: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB

画像効果を検出します(入力解像度:640x480):


02 LFFD:エッジデバイス向けの軽量・高速な顔検出システム

Github スター: 919

パラメータボリューム: 6.1 M

あらゆるサイズとデバイスに対応する顔検出器のバスケット

論文: https://arxiv.org/abs/1904.10633

Github: https://github.com/YonghaoHe/A-Light-and-Fast-Face-Detector-for-Edge-Devices

03. libface検出

Github スター: 9.3k

パラメータボリューム: 3.34M

画像内の顔検出のためのオープンソース ライブラリ。顔検出速度は1000FPSに達します。

Github: https://github.com/ShiqiYu/libfacedetection

04ジクシーエヌ

国内開発者ZuoQingのオープンソースディープラーニング推論ライブラリであり、顔検出はMTCNNアルゴリズムを使用して実装されています。

Github スター: 1.8k

GitHub: https://github.com/zuoqing1988/ZQCNN

画像効果を検出:

05センターフェイス

Github スター: 9.3k

パラメータサイズ: 7.3MB、改良版はわずか2.3MB

CenterFace は、エッジ デバイス向けの実用的なアンカーフリーの顔検出および位置合わせアルゴリズムです。

Github: https://github.com/Star-Clouds/CenterFace

06 DBフェイス

Github スター: 650

パラメータサイズ: 7.03MB

DBFace はアンカーフリーのネットワーク構造です。

GitHub: https://github.com/dlunion/DBFace

画像効果を検出:

DBFace の結果 (しきい値 = 0.2)

DBFace Small-H の結果 (しきい値 = 0.3)

RetinaFace-MobileNetV2 の結果 (しきい値 = 0.2)

CenterFace-MobileNetV2 の結果 (しきい値 = ?)

07ブレイズフェイス

モバイル GPU 推論向けにカスタマイズされた軽量で高性能な顔検出器。

Github スター: 6.4k

論文: https://arxiv.org/pdf/1907.05047v1.pdf

GitHub: https://github.com/google/mediapipe

08オープンヴィーノ

このライブラリは、Intel のオープンソースのディープラーニング推論ライブラリです。顔検出は SSD アルゴリズムに基づいており、非常に高速です。

Github スター: 1.1k

Github: https://github.com/openvinotoolkit/openvino

09レチナフェイスモバイルネット0.25

Github スター: 6.5k

パラメータボリューム: 1.68M

GitHub: https://github.com/deepinsight/insightface/

10 MTCN

Github スター: 2.4k

論文: https://arxiv.org/abs/1604.02878

Github: https://github.com/kpzhang93/MTCNN_face_detection_alignment

画像効果を検出:

<<:  フォレスターの予測: 2021年に人工知能が輝く

>>:  機械学習における欠損値に対処する9つの方法

ブログ    
ブログ    
ブログ    

推薦する

...

EasyDLが新しくアップグレードされ、ERNIEの3つの機能によりエンタープライズレベルのNLPモデルを迅速にカスタマイズできるようになりました。

最近、百度文心は3つの主要機能をリリースし、カスタマイズされたマルチラベルテキスト分類、感情傾向分析...

衣服にNFCを追加: 袖をかざすだけで安全に支払い

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google AI チームが新しい「流体アノテーション」を発表: 画像アノテーションの速度が 3 倍に向上

(原題: Google が新しいソリューションを発表、画像注釈の速度が 3 倍に向上) [[2505...

人工知能技術は成熟しており、AI音声業界は幅広い発展の見通しを迎えている

新しいインフラの波の下で、業界のデジタル変革は本格化しています。この過程で、AI音声は近年最も成熟し...

人工知能は標的の照準を加速し、人間と機械の統合を支援して即時攻撃を可能にします。

米国の国防月報ウェブサイトは2020年9月23日、米陸軍当局者が、8月11日から9月23日まで行われ...

ハッカーたちは猫娘を作成する代わりに、一流の原子力研究所から何十万ものデータを盗んだ...

米国にある世界トップクラスの原子力研究所の一つが最近、大きな問題に直面している。データベースがハッキ...

企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半...

GPT-4はあなたよりも質問をするのが得意です。大きなモデルを繰り返し使用して、人間との対話の障壁を打ち破りましょう。

人工知能の分野における最新の開発では、人工的に生成されたプロンプトの品質が、大規模言語モデル (LL...

AIの技術的負債の解消は急務

この流行は世界市場に衝撃をもたらしたが、人工知能(AI)企業への資本投資は増加し続けている。 CB ...

...

...

...

フェイフェイ・リーのチームの新しい研究:脳制御ロボットが家事を行い、脳コンピューターインターフェースに少ないサンプルで学習する能力を与える

将来的には、考えただけでロボットに家事を任せることができるようになるかもしれません。スタンフォード大...