近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実際の導入と徹底的な研究には、それに応じた公的支援が必要です。たとえば、実稼働レベルの顔表現ネットワークでは、さまざまな SOTA バックボーン ネットワーク、トレーニング監督トピック、および現実世界の顔認識のニーズに対応するためのモジュール式のトレーニング メカニズムが必要です。パフォーマンス分析と比較に関しては、複数のベンチマークに基づく多数のモデルには、標準的で自動化された評価ツールも必要です。さらに、全体的なパイプラインの形で展開できる顔認識の共通基盤が出現することが期待されています。 最近では、感染症流行中にマスクを着用しながらの顔認識の必要性など、一連の新たな課題も浮上しており、実用化に向けて人々の注目を集めている。実行可能な解決策は、これらの問題を解決するための使いやすい統一されたフレームワークを確立することです。 今年 1 月、JD.com の研究者は、顔認識技術開発コミュニティ向けに新しいオープン ソース フレームワーク FaceX-Zoo を提案しました。 FaceX-Zoo は、高度にモジュール化されスケーラブルな設計を採用しており、最適な顔認識を実現するために、さまざまな監視ヘッドとバックボーン ネットワークを備えたトレーニング モジュールを提供します。さらに、ほとんどの場合にモデルのパフォーマンスをテストするための標準化された評価モジュールも備えています。 このツールでは、単純な構成を変更するだけで、最も人気のあるベンチマークでモデルをテストできます。さらに、トレーニング済みモデルを検証し、予備的なアプリケーションを実行するための、シンプルでありながら完全に機能する顔 SDK も備えています。このツールには既存のテクノロジーがあまり含まれていませんが、これにより拡張やアップグレードも容易になります。 最近、このツールはオープンソース化されました。 GitHub リンク: https://github.com/JDAI-CV/FaceX-Zoo ツールの環境要件は次のとおりです。
FaceX-Zoo は、顔の特徴の抽出を容易にするために、MobileFaceNet、ResNet、SE-ResNet、HRNet、EfficientNet などの一般的なバックボーン ネットワークを提供します。これがニーズを満たさない場合は、構成ファイルを変更し、アーキテクチャ定義ファイルを追加するだけで、PyTorch のサポートを利用して他の選択肢を簡単にカスタマイズできます。 FaceX-Zoo の FMA-3D ツールを使用して、写真に写っている人物にマスクを付け、マスクされた顔データセットを入力します。 さまざまなバックボーン ネットワークのパフォーマンス評価。 さまざまな監督責任者のパフォーマンス評価。 JDの開発者らは、今後、研究者らは顔分析や顔照明などのFaceX-Zooモジュールの数をさらに増やし、バックボーンネットワークアーキテクチャと監視ヘッドの数を補充し、分散データ並列技術と混合精度トレーニングを通じてモデルトレーニングの効率を向上させる計画もあると述べた。 関連論文: https://arxiv.org/abs/2101.04407 |
<<: 人類の生存に関わる問題ですか? AI システムの説明可能性を調査する理由は何ですか?
>>: 準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ
電子コンピュータは 1940 年代に発明され、登場から 10 年以内に人類史上初の AI アプリケー...
ディープラーニング技術を用いた自然言語の深い理解は、常に注目されてきました。自分で音楽を調べる必要が...
会談は決裂した。アルトマン氏はOpenAIを完全に離れることになる。反転しつつあるこの宮廷ドラマに関...
GPT モデルが無敵の戦艦だとすると、minGPT はおそらく風や波に乗れる小型ヨットでしょう。最近...
農業は国民の衣食住の問題を解決する鍵であり、国民経済の発展を促進する重要な基盤でもあります。我が国は...
今日、言語を超えた効果的なコミュニケーションはこれまで以上に重要になっています。企業が新しい市場に進...
ラスベガスで開催される2024年コンシューマー・エレクトロニクス・ショーが終わりに近づく中、LGやサ...
8月14日、人工知能(AI)の発展は教育に新たな課題をもたらしました。フォーチュン誌の最近の報道に...
AI コンテンツ分析は、ビデオで取り上げられているトピックや、ビデオ内の登場人物が表現した感情を識別...
国際・国内電話サービス、インターネット事業、通信ネットワーク資源・設備サービスなどを主力事業とする米...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
自己教師あり表現学習は、過去 2 年間で非常に人気が高まっています。機械学習分野のリーダーであるジェ...
[[355638]]プログラマーとして、Google や Stackoverflow 向けにプログラ...
企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...