JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実際の導入と徹底的な研究には、それに応じた公的支援が必要です。たとえば、実稼働レベルの顔表現ネットワークでは、さまざまな SOTA バックボーン ネットワーク、トレーニング監督トピック、および現実世界の顔認識のニーズに対応するためのモジュール式のトレーニング メカニズムが必要です。パフォーマンス分析と比較に関しては、複数のベンチマークに基づく多数のモデルには、標準的で自動化された評価ツールも必要です。さらに、全体的なパイプラインの形で展開できる顔認識の共通基盤が出現することが期待されています。

最近では、感染症流行中にマスクを着用しながらの顔認識の必要性など、一連の新たな課題も浮上しており、実用化に向けて人々の注目を集めている。実行可能な解決策は、これらの問題を解決するための使いやすい統一されたフレームワークを確立することです。

今年 1 月、JD.com の研究者は、顔認識技術開発コミュニティ向けに新しいオープン ソース フレームワーク FaceX-Zoo を提案しました。 FaceX-Zoo は、高度にモジュール化されスケーラブルな設計を採用しており、最適な顔認識を実現するために、さまざまな監視ヘッドとバックボーン ネットワークを備えたトレーニング モジュールを提供します。さらに、ほとんどの場合にモデルのパフォーマンスをテストするための標準化された評価モジュールも備えています。

このツールでは、単純な構成を変更するだけで、最も人気のあるベンチマークでモデルをテストできます。さらに、トレーニング済みモデルを検証し、予備的なアプリケーションを実行するための、シンプルでありながら完全に機能する顔 SDK も備えています。このツールには既存のテクノロジーがあまり含まれていませんが、これにより拡張やアップグレードも容易になります。

最近、このツールはオープンソース化されました。

GitHub リンク: https://github.com/JDAI-CV/FaceX-Zoo

ツールの環境要件は次のとおりです。

  • Python >= 3.7.1
  • Python 3.0 以降
  • トーチビジョン >= 0.3.0

FaceX-Zoo は、顔の特徴の抽出を容易にするために、MobileFaceNet、ResNet、SE-ResNet、HRNet、EfficientNet などの一般的なバックボーン ネットワークを提供します。これがニーズを満たさない場合は、構成ファイルを変更し、アーキテクチャ定義ファイルを追加するだけで、PyTorch のサポートを利用して他の選択肢を簡単にカスタマイズできます。

FaceX-Zoo の FMA-3D ツールを使用して、写真に写っている人物にマスクを付け、マスクされた顔データセットを入力します。

さまざまなバックボーン ネットワークのパフォーマンス評価。

さまざまな監督責任者のパフォーマンス評価。

JDの開発者らは、今後、研究者らは顔分析や顔照明などのFaceX-Zooモジュールの数をさらに増やし、バックボーンネットワークアーキテクチャと監視ヘッドの数を補充し、分散データ並列技術と混合精度トレーニングを通じてモデルトレーニングの効率を向上させる計画もあると述べた。

関連論文: https://arxiv.org/abs/2101.04407

<<:  人類の生存に関わる問題ですか? AI システムの説明可能性を調査する理由は何ですか?

>>:  準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ

ブログ    
ブログ    
ブログ    

推薦する

人工知能はユーザーのメッセージング体験を変える

Emogi は、チャット アプリでテキストを送信したり、投稿にコメントしたり、友人にビデオを送信した...

知能ロボットの主要技術:製造分野の知能化を推進

国家発展改革委員会から最近明らかになったところによると、インターネット、ビッグデータ、人工知能と実体...

超強力なPytorchオペレーション! ! !

こんにちは、Xiaozhuangです!ここ数日、ディープラーニングに関するコンテンツをいくつか共有し...

テキストアドベンチャーゲームは人工知能の助けを借りて新たな命を吹き込まれる

こんなゲームがあります:あなたの名前はシャオミン、ラリオンの高貴な領主であり、あなたの指揮下に多数の...

...

データサイエンティストが最もよく使用するデータマイニングアルゴリズム10選

[[192829]]図1: データサイエンティストが最もよく使用するアルゴリズムトップ10すべてのア...

...

復旦大学の論文は、3体のSFシーンを実現:体にディスプレイ画面を装着し、ナビゲートやチャットも可能

誰もが歩くディスプレイ画面であり、これは単なる SF のワンシーンではありません。羅吉が最も感動した...

...

...

人工知能システムが薬剤耐性菌を殺す新しい抗生物質を発見

海外メディアの報道によると、人工知能技術を利用した新薬の発見は成果を上げているようだ。マサチューセッ...

JS を使用して複数の画像類似性アルゴリズムを実装する

検索分野では、Google画像検索、Baidu画像検索、Taobaoの商品写真検索など、「類似画像・...

知っておくべきビッグデータ用語 75 選

パート1(25用語)ビッグデータに不慣れな場合、この分野を理解したり、どこから始めればよいのかわから...

2021年最新Contrastive Learning(対照学習)主要会議での必読古典論文解釈

みなさんこんにちは。私はDiaobaiです。最近、対照学習が流行っているので、ICLR2020では、...

人工知能に関する世界インターネット会議の8つの視点のレビュー

[[416318]]最近、世界インターネット会議およびインターネット開発フォーラム「人工知能:新たな...