この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 AI モデルはますます小さくなり、必要な計算能力もますます弱くなってきていますが、精度は依然として保証されています。 最新の代表例は、GitHub でオープンソース化されたばかりの中国のプロジェクト、超軽量の汎用顔検出モデルです。 プロジェクトの貢献者によると、モデル ファイルのサイズはわずか 1 MB で、計算の複雑さは 320x240 入力に対してわずか 90MFlops です。 もちろん、その効果は業界で現在主流のオープンソース顔検出アルゴリズムに劣るものではなく、むしろそれを上回っています。 超軽量で多用途 このモデルの貢献者はlinzaiで、これはエッジ コンピューティング デバイスまたは低コンピューティング デバイス (ARM 推論など) 向けに設計された、リアルタイムの超軽量ユニバーサル顔検出モデルであると紹介しました。
目標は、ARM を使用して、低コンピューティング デバイスの一般的なシナリオでリアルタイムの顔検出推論を実行することです。同時に、これはモバイル環境 (Android および IOS)、PC 環境 (CPU および GPU) などにも当てはまります。 GitHubプロジェクトページによると、このモデルはUbuntu16.04、Ubuntu18.04、Windows 10、Python3.6、Pytorch1.2、CUDA10.0 + CUDNN7.6などの環境でテストされており、正常な動作を保証できるとのこと。 モデル設計には 2 つのバージョンがあります。1) 合理化されたバックボーンを持ち、わずかに高速なバージョン スリム、2) より高い精度のために修正された RFB モジュールを追加したバージョン RFB です。 また、320x240 と 640x480 の異なる入力解像度で wideface を使用してトレーニングされた事前トレーニング済みモデルも提供されており、さまざまなシナリオでより適切に機能します。 Linzai 氏は、プロジェクト全体に特別な演算子はなく、onnx エクスポートをサポートしているため、移植が容易になると紹介しました。 その効果は、現在主流のオープンソースアルゴリズムに劣らない このようなモデルの効果/精度は何ですか? Linzai 氏は、モデルの精度、速度、シナリオテスト、サイズテストも GitHub プロジェクト ページで公開しました。 出場者は 2 人います。1 つは、OpenCV の中国ウェブサイトのウェブマスターである Yu Shiqi 氏が開発したオープンソースの顔検出アルゴリズムである Libfacedetection です。 もう 1 つは、業界で最も先進的なオープン ソースの顔検出アルゴリズムの 1 つである Retinaface-Mobilenet-0.25 (Mxnet) です。 Widerface データセットのテスト結果は次のとおりです。 基本的に version-slim/version-RFB で最良の結果が得られます。 Raspberry Pi 4B MNN推論テスト時間のテスト結果は次のとおりです。 対照的に、スリム版の速度は劣っていません。 地下鉄の駅、万達広場、オフィスなどのシナリオでテストが実施され、結果からRFBバージョンにも利点があることが示されました。 さらに重要なのは、新しいオープンソース モデルが軽量であることです。 ポータル このプロジェクトの GitHub ページで、linzai は VOC 形式のトレーニング データセットとトレーニング プロセスを生成する方法、およびこのモデルをより有効に使用する方法についても共有しました。 興味があれば見てみてください〜 |
<<: 世界トップ10のAIトレーニングチップの包括的なレビュー
[[348375]]この記事はWeChatの公開アカウント「Java Chinese Commun...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[241150]]画像出典: Visual China今年のコナン映画は中国でも公開されるそうです...
今日、ビジネスに役立つ新たなテクノロジートレンドが数多く存在します。ビジネスマンとして、新しいトレン...
アメリカ心理学会は6月14日、「AIと頻繁に接触する従業員は孤独になりやすく、病気のリスクも高まる」...
最近、IBMは人工知能、スマートセンサー、スマート望遠鏡、検出器、医療機器の開発という5つの側面から...
こんにちは、みんな。今日は、GPT-4 コード インタープリターがデータ分析、科学研究の描画、機械学...
[[384610]] 「脳の学習メカニズムや学習方法の一部を解明できれば、人工知能はさらに進歩できる...
記事ソース| https://dzone.com/articles/the-power-of-ai-...
米国のメリーランド大学の研究者4人が、GoogleのキャプチャシステムReCaptchaを解読できる...