深セン大学教授が顔検出ライブラリをオープンソース化、顔検出速度は最大1500FPS以上

深セン大学教授が顔検出ライブラリをオープンソース化、顔検出速度は最大1500FPS以上

先週、深セン大学コンピュータサイエンスおよびソフトウェア工学部の Yu Shiqi 教授が、最大 1500 FPS 以上の顔検出速度を誇る顔検出ライブラリを GitHub でオープンソース化しました。

[[260654]]

これは、画像内の CNN ベースの顔検出用のオープンソース ライブラリです。 CNN モデルは C ソース ファイル内の静的変数に変換されました。ソースコードは他のライブラリに依存しません。必要なのは C++ コンパイラだけです。 C++ コンパイラを使用して、Windows、Linux、ARM、および任意のプラットフォームでソース コードをコンパイルできます。

検出を高速化するために SIMD 命令が使用されます。 Intel CPU または NEON for ARM を使用する場合は、Advanced Vector Extensions 命令セットを有効にすることができます。モデル ファイルも ./models/ ディレクトリに提供されています。 examples/libfacedetectcnn-example.cpp はライブラリの使用方法を示しています。

コンパイル方法:

  • g++ でソース コードをコンパイルする場合は、最適化を有効にするために -O3 を追加します。
  • Microsoft Visual Studio でソース コードをコンパイルする場合は、「-O2」を選択します。

Windows 上の CNN に基づく顔検出

ARM Linux (Raspberry Pi 3 B+) での顔検出実験の結果

以前は、このプロジェクトはオープンソースではなく、ダイナミック リンク ライブラリ (include+lib) のみを提供していました。ユーザーは API を呼び出すことしかできませんでした。先週になってようやくオープンソース化されました。

<<:  AI+クラウドランディングBeifei Technology、Amazon Pollyの助けを借りて教育モードの変化を促進

>>:  将来人工知能に置き換えられる可能性が最も低い10の仕事

ブログ    
ブログ    
ブログ    

推薦する

人工知能がサイバーセキュリティを変える5つの方法

人工知能は、ネットワーク セキュリティの攻撃側と防御側の両方で重要な役割を果たす中立的なテクノロジで...

スマート製品はどこにでもあります。人工知能と通常の知能の違いは何でしょうか?

多くの一般消費者にとって、どれが本物の人工知能でどれが単なる普通の知能なのかを区別することは不可能で...

DeepMindの「フィッシングエンフォースメント」:AIに間違った発言をさせ、数万件の危険な発言を発見させる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

負けても落ち込まないで! Google、ロボット工学プロジェクトを再開

[[260578]]海外メディアの報道によると、グーグルは以前の取り組みが失敗した後、ロボット工学プ...

4つの主要な機械学習プログラミング言語の比較: R、Python、MATLAB、Octave

この記事の著者は、R、Python、MATLAB、OCTAVE の 4 つの機械学習プログラミング言...

OpenAIがChatGPTの「カスタム指示」機能を全ユーザーに公開

米国現地時間8月11日木曜日、人工知能研究企業OpenAIは、ChatGPTの「カスタム指示」機能を...

CV の世界における 3D ビジョンの究極の実現: コンピューターがこの 3 次元の世界を「見る」方法

携帯電話を開くと顔がロック解除されます。VR と AR 技術は、このような仮想でありながら現実のシー...

DDLは第一の生産力です。科学的な説明があります。ネットユーザー:ビッグモデルで試してみましょう

年末です。大学生は期末試験の週で、労働者は KPI の達成に急いでいます。期限のない年末(DDL)は...

Python アルゴリズムの時間計算量

アルゴリズムを実装する場合、アルゴリズムの複雑さは通常、時間の複雑さと空間の複雑さという 2 つの側...

AI はモノのインターネットをどのように改善するのでしょうか?

スマートテレビやスマート冷蔵庫からスマートフォンやスマート音声デバイスまで、モノのインターネット (...

声を上げてください! MakeItTalkの魔法でモナリザと会話できる

最近、マサチューセッツ大学アマースト校のヤン・チョウ博士とそのチームは、「MakeItTalk」と呼...

ビジネスでAIと自動化を活用する方法

業界の専門家が AI と自動化のベストプラクティスについて議論し、企業がこれらの重要な新興テクノロジ...

TensorFlow とオートエンコーダー モデルを使用して手書き数字を生成する方法

[[209419]]オートエンコーダーは、入力データを効率的にエンコードする方法を学習するために使用...

ビッグニュース!アリママが自社開発のCTR推定コアアルゴリズムMLRを初公開

1. 技術的背景CTR(Click-Through-Rate)とは、クリック率のことで、インターネッ...

ディープラーニング プラットフォームとして、TPU、GPU、CPU のどれが優れているでしょうか?誰かがベンチマーク調査を行った

GPU、TPU、CPU はすべてディープラーニング モデルのトレーニングに使用できますが、これらの各...