小売業と教育における感情認識に焦点を当てていますが、Mizao.com はどのように違うのでしょうか?

[51CTO.com からのオリジナル記事] 喜び、悲しみ、恐怖、平静、怒り、驚き、軽蔑、嫌悪など、さまざまな表情が私たちの顔に毎日現れます。これらの表情は私たちの日常生活に存在しています。これらの表情が感情認識技術によって抽出され、日常生活に応用されて私たちの生活に役立つと考えたことはありますか。例えば、ショッピングモールでさまざまな店に出入りするとき、満足のいく商品を見ると嬉しくなり、態度の悪い店員に出会うと嫌悪感を覚えます。あるいは、子供が幼稚園にいるとき、好きな先生に会って嬉しくなり、新しいものに出会うと驚きます。これらの表情はカメラで記録され、感情認識によって記録され、ショッピングモールや教育管理に応用されます。

感情認識技術シナリオに基づくアプリケーションフレームワークの構築

MiZao.com は、Microsoft Research Asia と提携して、感情認識を前述のショッピングモールや教育指導のシナリオに適用しています。MiZao.com 自体は、応用研究、つまり基礎研究を実際のアプリケーションに応用して実際の問題を解決することに重点を置いています。 Mizao.com はビデオデータ処理、シーン分析アルゴリズム、詳細な業界アプリケーションに重点を置いており、関連する研究開発特許も取得しています。一方、感情知能は Microsoft Research Asia によって技術的にサポートされています。

感情認識の理論的アルゴリズム分析

感情認識技術には、顔検出、顔の表情の特徴抽出、顔の表情の感情分類という 3 つの中核リンクがあります。その中で最も重要なのは、顔の表情の特徴抽出です。

表情特徴抽出アルゴリズムは、表情の状態と処理対象に応じて、静的画像ベースの特徴抽出方法と動的画像ベースの特徴抽出方法に大別できます。その中で、静止画像に基づく特徴抽出アルゴリズムは、グローバル方式とローカル方式に分けられ、動画像に基づく特徴抽出アルゴリズムは、オプティカルフロー方式、モデル方式、幾何学的方式に分けられます。照明、年齢、画像解像度などの要因が表情認識のパフォーマンスに影響し、効果的な特徴抽出が中心的な問題となります。

静止画像に基づく特徴抽出法

1. 全体的アプローチ

全体的に、顔の筋肉の変化は顔の器官の明らかな変形を引き起こすため、全体的な観点から表情の特徴を考慮した表情認識アルゴリズムが登場しました。主に使用されるアルゴリズムには、主成分分析 (PCA)、独立成分分析 (ICA)、線形判別分析 (LDA) などがあります。

主成分分析は教師なし手法であり、処理するサンプルのカテゴリ情報を必要とせず、高次元データを効率的に処理できるという利点があります。欠点は、データ処理時にこの方法で生成される共分散行列の次元が高すぎるため、アルゴリズムの動作に影響が出ることです。

独立成分分析は、ピクセル間の隠れた情報を抽出できる教師なし手法であり、非ガウス分布のデータの処理に適しています。ただし、アルゴリズムのリアルタイム性能を向上させる必要があります。

線形判別分析は、サンプルのカテゴリ構造を完全に保持することを特徴とした教師あり分析法です。

2. ローカルメソッド

顔の筋肉の質感やしわなどの局所的な変形に含まれる情報は、顔の表情の属性を正確に判断するのに役立ちます。古典的なローカル手法としては、ガボールウェーブレット法とローカルバイナリパターン (LBP) があります。

ガボールウェーブレット法は、特徴抽出において優れた視覚特性と生物学的背景を備えています。しかし、このアルゴリズムでは、さまざまなスケールと方向のウェーブレットカーネル関数を計算する必要があり、結果として得られる高次元の特徴ベクトルは、アルゴリズムのリアルタイム処理に適さず、ある程度の情報の冗長性も生じます。

ローカルバイナリパターンは、顔の表情の特徴をより効果的に抽出でき、回転不変性とグレースケール不変性の利点がありますが、高次元ヒストグラムはアルゴリズムのリアルタイムパフォーマンスに影響を与え、アルゴリズムによって生成されたバイナリデータはノイズによって乱されやすくなります。

動画像に基づく特徴抽出法

動画像の表現特性は、主に顔の連続的な変形と顔のさまざまな領域の筋肉の動きに現れます。現在、動画像に基づく特徴抽出法は、主にオプティカルフロー法、モデル法、幾何学法に分けられます。

1. オプティカルフロー法

初期の表情認識アルゴリズムでは、主にオプティカルフロー法を使用して、動画像から表情の特徴を抽出していました。これは主に、オプティカルフロー法には顔の変形を強調し、顔の動きの傾向を反映するという利点があるためです。連続するフレーム間のオプティカルフローフィールドと勾配フィールドはそれぞれ画像の時間的変化と空間的変化を表し、顔画像の各フレームの表情領域の追跡を実現します。次に、特徴領域の移動方向の変化は顔の筋肉の動きを表し、異なる表情に対応します。

2. モデル法

表情認識におけるモデル法とは、動画像の表情情報をパラメータ化する統計的手法を指します。一般的に使用されるアルゴリズムには、主にアクティブシェイプモデルメソッド (ASM) とアクティブアピアランスモデルメソッド (AAM) があります。ASM は画像のローカルテクスチャ情報を反映し、AAM は画像のグローバルテクスチャ情報を反映します。

3. 幾何学的方法

幾何学的手法は、動画像の特徴抽出において最も広く使用されている手法です。動画像は、各フレームの顔の特徴点の変化を通じて表情の完全なプロセスを反映し、幾何学的計算に豊富な情報を提供します。また、動画像から抽出された幾何学的特徴は顔のさまざまな表情領域に対応しており、これらの特徴は動作単位の認識に適しています。

感情認識の実用化シナリオ

小売業における感情認識

Mizao.comの感情認識システムは、ショッピングモールの出入り口や顧客動線のホットスポットなどにカメラを設置し、顔認識技術を使って顧客動線の重複を排除し、実際の顧客動線を取得することで、男女比や年齢比を分析し、ホットエリアとコールドエリア、顧客動線を捉えます。感情認識技術を使用して、消費者の満足度、興味の好み、経験の変化などのパーソナライズされたデータを取得し、消費者の層別管理と精密マーケティングを実施します。

幼児教育における感情認識

Mizao.com が開発した Ruizhiyan 幼児期安全成長インテリジェント分析システムは、幼児教育における教育効果評価と幼児期の成長および安全分析の解決に重点を置いています。子どもたちの感情的なフィードバックを分析することで、教育効果の包括的かつ長期的な分析が行われ、カリキュラムと教師の評価のための客観的な指標が提供され、幼稚園の管理者が幼稚園の状況をよりよく理解し、より効果的な管理を行うのに役立ちます。同時に、子どもたちが安全かつ健やかに成長できるよう、子ども一人ひとりに合わせた個別のファイルも記録します。

Mizao.comの技術チーム責任者である田初傑氏はインタビューで、第11回北京マイクロソフトアクセラレーターは、Mizao.comに技術サポートを提供しただけでなく、チャネルの拡大にも役立ったと述べました。また、Microsoft Acceleratorを通じて、イノベーションに取り組む多くの卒業生企業と知り合うことができました。ブランドの宣伝とマーケティング促進の面では、Microsoft Accelerator Beijing 11 は Mizao.com の総合的な展示ブースを提供し、資金調達チャネルとの連携や優良顧客の推薦などのサポートも提供し、Mizao.com が自らを磨く貴重な機会を得ることができました。

<<: AIと大量動画が出会うと、IBMは20秒で新時代への扉を開く

>>: 百度のDuerOS会話型AIオペレーティングシステムと複数のスマート製品が上海のCESアジアで発表されました