JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実際の導入と徹底的な研究には、それに応じた公的支援が必要です。たとえば、実稼働レベルの顔表現ネットワークでは、さまざまな SOTA バックボーン ネットワーク、トレーニング監督トピック、および現実世界の顔認識のニーズに対応するためのモジュール式のトレーニング メカニズムが必要です。パフォーマンス分析と比較に関しては、複数のベンチマークに基づく多数のモデルには、標準的で自動化された評価ツールも必要です。さらに、全体的なパイプラインの形で展開できる顔認識の共通基盤が出現することが期待されています。

最近では、感染症流行中にマスクを着用しながらの顔認識の必要性など、一連の新たな課題も浮上しており、実用化に向けて人々の注目を集めている。実行可能な解決策は、これらの問題を解決するための使いやすい統一されたフレームワークを確立することです。

今年 1 月、JD.com の研究者は、顔認識技術開発コミュニティ向けに新しいオープン ソース フレームワーク FaceX-Zoo を提案しました。 FaceX-Zoo は、高度にモジュール化されスケーラブルな設計を採用しており、最適な顔認識を実現するために、さまざまな監視ヘッドとバックボーン ネットワークを備えたトレーニング モジュールを提供します。さらに、ほとんどの場合にモデルのパフォーマンスをテストするための標準化された評価モジュールも備えています。

このツールでは、単純な構成を変更するだけで、最も人気のあるベンチマークでモデルをテストできます。さらに、トレーニング済みモデルを検証し、予備的なアプリケーションを実行するための、シンプルでありながら完全に機能する顔 SDK も備えています。このツールには既存のテクノロジーがあまり含まれていませんが、これにより拡張やアップグレードも容易になります。

最近、このツールはオープンソース化されました。

GitHub リンク: https://github.com/JDAI-CV/FaceX-Zoo

ツールの環境要件は次のとおりです。

  • Python >= 3.7.1
  • Python 3.0 以降
  • トーチビジョン >= 0.3.0

FaceX-Zoo は、顔の特徴の抽出を容易にするために、MobileFaceNet、ResNet、SE-ResNet、HRNet、EfficientNet などの一般的なバックボーン ネットワークを提供します。これがニーズを満たさない場合は、構成ファイルを変更し、アーキテクチャ定義ファイルを追加するだけで、PyTorch のサポートを利用して他の選択肢を簡単にカスタマイズできます。

FaceX-Zoo の FMA-3D ツールを使用して、写真に写っている人物にマスクを付け、マスクされた顔データセットを入力します。

さまざまなバックボーン ネットワークのパフォーマンス評価。

さまざまな監督責任者のパフォーマンス評価。

JDの開発者らは、今後、研究者らは顔分析や顔照明などのFaceX-Zooモジュールの数をさらに増やし、バックボーンネットワークアーキテクチャと監視ヘッドの数を補充し、分散データ並列技術と混合精度トレーニングを通じてモデルトレーニングの効率を向上させる計画もあると述べた。

関連論文: https://arxiv.org/abs/2101.04407

<<:  人類の生存に関わる問題ですか? AI システムの説明可能性を調査する理由は何ですか?

>>:  準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ

ブログ    

推薦する

AIの計算能力は70年間で6億8000万倍に増加し、3つの歴史的段階でAI技術の指数関数的爆発が目撃されました。

電子コンピュータは 1940 年代に発明され、登場から 10 年以内に人類史上初の AI アプリケー...

音声認識を開発する方法

ディープラーニング技術を用いた自然言語の深い理解は、常に注目されてきました。自分で音楽を調べる必要が...

交渉は失敗しました!ウルトラマンはOpenAIへの復帰に失敗し、Twitchの創設者が新CEOに就任

会談は決裂した。アルトマン氏はOpenAIを完全に離れることになる。反転しつつあるこの宮廷ドラマに関...

...

1日1,000個以上の星を生成したテスラのAIディレクターがGPT Pytorchトレーニングライブラリを作成した

GPT モデルが無敵の戦艦だとすると、minGPT はおそらく風や波に乗れる小型ヨットでしょう。最近...

農業用ドローンは熱を帯び続け、今後の開発に向けた3つの大きなトレンドが浮上

農業は国民の衣食住の問題を解決する鍵であり、国民経済の発展を促進する重要な基盤でもあります。我が国は...

文書翻訳における人工知能: 効率化の新時代

今日、言語を超えた効果的なコミュニケーションはこれまで以上に重要になっています。企業が新しい市場に進...

生成AIはスマートホームの触媒となる

ラスベガスで開催される2024年コンシューマー・エレクトロニクス・ショーが終わりに近づく中、LGやサ...

ChatGPTを使った学生の不正行為を防ぐため、一部の大学教授は紙ベースの試験と手書きのエッセイへの復帰を検討している。

8月14日、人工知能(AI)の発展は教育に新たな課題をもたらしました。フォーチュン誌の最近の報道に...

AIがビデオ業界の変革を推進する方法

AI コンテンツ分析は、ビデオで取り上げられているトピックや、ビデオ内の登場人物が表現した感情を識別...

通信事業者のRPAロボット活用事例紹介

国際・国内電話サービス、インターネット事業、通信ネットワーク資源・設備サービスなどを主力事業とする米...

デジタルマーケティング: AI はどのようにして人間の行動パターンを「見抜く」のでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

TransformerがCNNバックボーンネットワークを活性化、HKUとTencentの視覚的自己教師あり表現学習CARE

自己教師あり表現学習は、過去 2 年間で非常に人気が高まっています。機械学習分野のリーダーであるジェ...

企業がAI対応データベースを使用してAI導入を加速する方法

企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...