JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実際の導入と徹底的な研究には、それに応じた公的支援が必要です。たとえば、実稼働レベルの顔表現ネットワークでは、さまざまな SOTA バックボーン ネットワーク、トレーニング監督トピック、および現実世界の顔認識のニーズに対応するためのモジュール式のトレーニング メカニズムが必要です。パフォーマンス分析と比較に関しては、複数のベンチマークに基づく多数のモデルには、標準的で自動化された評価ツールも必要です。さらに、全体的なパイプラインの形で展開できる顔認識の共通基盤が出現することが期待されています。

最近では、感染症流行中にマスクを着用しながらの顔認識の必要性など、一連の新たな課題も浮上しており、実用化に向けて人々の注目を集めている。実行可能な解決策は、これらの問題を解決するための使いやすい統一されたフレームワークを確立することです。

今年 1 月、JD.com の研究者は、顔認識技術開発コミュニティ向けに新しいオープン ソース フレームワーク FaceX-Zoo を提案しました。 FaceX-Zoo は、高度にモジュール化されスケーラブルな設計を採用しており、最適な顔認識を実現するために、さまざまな監視ヘッドとバックボーン ネットワークを備えたトレーニング モジュールを提供します。さらに、ほとんどの場合にモデルのパフォーマンスをテストするための標準化された評価モジュールも備えています。

このツールでは、単純な構成を変更するだけで、最も人気のあるベンチマークでモデルをテストできます。さらに、トレーニング済みモデルを検証し、予備的なアプリケーションを実行するための、シンプルでありながら完全に機能する顔 SDK も備えています。このツールには既存のテクノロジーがあまり含まれていませんが、これにより拡張やアップグレードも容易になります。

最近、このツールはオープンソース化されました。

GitHub リンク: https://github.com/JDAI-CV/FaceX-Zoo

ツールの環境要件は次のとおりです。

  • Python >= 3.7.1
  • Python 3.0 以降
  • トーチビジョン >= 0.3.0

FaceX-Zoo は、顔の特徴の抽出を容易にするために、MobileFaceNet、ResNet、SE-ResNet、HRNet、EfficientNet などの一般的なバックボーン ネットワークを提供します。これがニーズを満たさない場合は、構成ファイルを変更し、アーキテクチャ定義ファイルを追加するだけで、PyTorch のサポートを利用して他の選択肢を簡単にカスタマイズできます。

FaceX-Zoo の FMA-3D ツールを使用して、写真に写っている人物にマスクを付け、マスクされた顔データセットを入力します。

さまざまなバックボーン ネットワークのパフォーマンス評価。

さまざまな監督責任者のパフォーマンス評価。

JDの開発者らは、今後、研究者らは顔分析や顔照明などのFaceX-Zooモジュールの数をさらに増やし、バックボーンネットワークアーキテクチャと監視ヘッドの数を補充し、分散データ並列技術と混合精度トレーニングを通じてモデルトレーニングの効率を向上させる計画もあると述べた。

関連論文: https://arxiv.org/abs/2101.04407

<<:  人類の生存に関わる問題ですか? AI システムの説明可能性を調査する理由は何ですか?

>>:  準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ

ブログ    
ブログ    

推薦する

人工知能「トレーナー」がAIをより賢くする

「人工知能は子供のようなものです。継続的なトレーニング、調整、育成を通じて、その「IQ」はますます高...

マスク氏が示唆:脳の寄生虫が人間を超人的なAIを作らせる

マスク氏はツイッターで奇妙な見解を表明した。人類が超人的な人工知能を創り出した理由は、ある種の「脳寄...

Nvidia が企業秘密を盗んだと非難される!ビデオ会議で証拠が明らかになり、関与した従業員は有罪を認めた

Nvidia はビデオ会議を開催しただけで訴えられたのですか? ? ?はい、きっかけはほんの数枚のコ...

モノのインターネットの可能性を最大限に引き出す方法

モノのインターネットは大量のセンサーデータを生成すると予測されており、それが人工知能と組み合わさるこ...

東大大学の中国人博士が「心の理論」を使ってテキサスホールデムをプレイすることを GPT-4 に教えました。従来のアルゴリズムを上回り、人間の初心者を圧倒する

完全情報ゲームでは、すべてのプレイヤーがすべての情報要素を知っています。しかし、不完全情報ゲームは異...

...

業界丨2020年のインテリジェントウェーブを理解するには、BaiduとGoogleのAIの足跡から始める

2020年が過ぎました。順調で平和な生活を送ったか、非常に困難な生活を送ったかにかかわらず、私たちは...

...

2021 年の機械学習の 6 つのトレンド

機械学習は今日ではよく知られた革新的な技術となっています。ある調査によると、現在人々が使用しているデ...

...

...

人工知能を搭載したロボットは私たちの生活からどれくらい離れているのでしょうか?

産業用ロボットは幅広い用途でますます利用されるようになっているわが国は世界最大かつ最も活発な産業用ロ...

...

マイクロソフトがAIインフラサービスコード名「Singularity」を発表

Microsoft Azure と研究チームは協力して、コードネーム「Singularity」という...