もう感情を隠せない?歩く姿勢からAIがわかる!

もう感情を隠せない?歩く姿勢からAIがわかる!

歩き方は人それぞれ違います。歩き方は、その時々の気分など、あなたに関する秘密を明らかにします。たとえば、ストレスを感じたり落ち込んだりしているときは、頭を高く上げて歩くよりも、肩を落としてしまう可能性が高くなります。

チャペルヒル大学とメリーランド大学の研究者らは最近、このボディランゲージを利用して、人の歩き方から感情向性(ネガティブかポジティブか)や覚醒レベル(落ち着いているか元気か)など、その人の現在の感情を識別できる機械学習アプローチを開発した。研究者らは、この方法は予備実験で80.07%の精度を示したと述べた。

「感情は私たちの生活において重要な役割を果たし、私たちの経験を定義し、世界を見る方法や他人と交流する方法を形作っています」と研究者らは書いている。「日常生活で感情を感知することは重要であるため、ゲームやエンターテイメント、セキュリティや法執行、ショッピング、人間とコンピューターの交流など、多くの分野で自動感情認識が重要な問題となっています。」

研究者たちは、歩行分析アルゴリズムをテストするための例として、幸せ、悲しみ、怒り、中立の 4 つの感情を選択しました。次に、複数の歩行ビデオコーパスから歩き方を抽出して感情的な特徴を識別し、3Dポーズ推定技術を使用してポーズを抽出しました。

最後に、研究者らは、長期依存性を学習できる長短期記憶 (LSTM) モデルを使用して姿勢シーケンスから特徴を取得し、それをランダムフォレスト分類器 (複数の独立した決定木の平均予測を出力) と組み合わせて、分析した歩行を上記の 4 つの感情カテゴリに分類しました。

これらの特徴には、肩の姿勢、連続した歩幅、手と首の間の震えの頻度などが含まれます。頭の傾きの角度は、幸せな感情と悲しい感情を区別するために使用され、よりコンパクトな姿勢と「体の拡大」は、それぞれ否定的な感情と肯定的な感情を表しました。

覚醒レベルに関しては、科学者たちはそれが動きの増加と一致する傾向があることに気づき、モデルは速度、加速の大きさ、手、足、頭の関節の「動きの震え」を考慮に入れた。

AI システムは、Emotion Walk (EWalk) からのサンプルを処理しました。 EWalk は、大学のキャンパス内 (屋内と屋外) を歩く 24 人の被験者のビデオから抽出された 1,384 の歩行の新しいデータセットです。 Amazon Mechanical Turk の約 700 人の参加者が感情にラベルを付け、研究者はそれを使用して感情の向性と覚醒レベルを判定しました。

テストでは、チームの報告によると、感情検出に対するアプローチは最先端のアルゴリズムよりも 13.85 パーセント正確で、感情を考慮しない「バニラ」LSTM よりも 24.60 パーセント正確でした。これは完璧であると言っているわけではありません。結局のところ、その精度は 3D 人間の姿勢推定と歩行抽出の精度に大きく依存します。しかし、こうした制限にもかかわらず、研究チームは、自分たちのアプローチが、さらなる活動や他の感情認識アルゴリズムを含む研究のための強固な基盤を提供すると確信している。

「私たちの方法は、最先端の3D人間姿勢推定技術を活用して、歩行ビデオの感情認識のためのリアルタイムパイプラインを提供する初めての方法でもあります」と研究者らは述べた。「今後の研究の一環として、より多くのデータセットを収集し、現在のシステムの限界を改善したいと考えています。」

<<:  レゴブロックを積み上げるように: ニューラルネットワークの数学をゼロから説明する

>>:  AIチップ市場に必要なのは火か氷か?

推薦する

人工知能に関する学習体験のまとめ

序文今は知識が急速に反復される時代です。この時代では、次のように感じるかもしれません。「最初から最後...

今後 10 年間で最も「収益性の高い」 5 つの業界。誰がやっても儲かるでしょう。

VRバーチャルリアリティは未来のトレンドであり、大きな発展の見込みがあります。現在、大手企業がこの...

...

...

人工知能ニューラルネットワークとは何ですか?なぜ人間の推論を実現したり、意識を生成したりできないのでしょうか?

少し前にウォールストリートジャーナルは、Uberが無人車両のテスト中に歩行者1名が死亡する重大な交通...

新しいディープラーニング プログラムは、ロボット工学の課題をどのように克服できるのでしょうか?

データ サイエンティストがディープラーニングについて話すとき、通常は画像の生成、検出、分類、回帰タス...

パラメータ数はわずか1/700で、性能はGPT-3.5を超えます! CMU+Tsinghua オープンソース Prompt2Model フレームワーク

大規模言語モデル (LLM) に基づいて、開発者やユーザーは、タスクを記述し、いくつかの例を示して自...

...

...

AIと行動科学がワクチン接種への躊躇にどう対処できるか

Fractal Analytics の共同創設者 Ram Prasad 氏は、AI が問題領域の特定...

ChatGPTはユーザーがペイウォールを回避できないようにBing検索へのアクセスを停止

7月5日のニュース、6月28日、OpenAIのチャットボットChatGPTは、MicrosoftのB...

人工知能の商業化における問題点をどう解決するか?

「2018年中国人工知能商業上陸研究報告」によると、過去1年間、業界は人工知能に大きな期待を寄せ、...

自然言語処理の商業的価値を示す5つの成功事例

これら 5 つの組織は、自然言語処理 (NLP) を使用して、顧客へのサービスの向上、反復的なタスク...

今後 20 年以内に、完全自動運転のコネクテッドカーが登場するでしょうか?

20 年後の旅行と交通の未来はどうなるでしょうか? おそらく、この質問への答えははるかに複雑です。...

中国科学院のチームは、最初のLLMモデル圧縮レビューを発表しました。剪定、知識蒸留、量子化技術の詳細な議論です。

最近、大規模言語モデル (LLM) はさまざまなタスクで優れたパフォーマンスを示しています。しかし、...