AIは人間の感情を理解できるのか?

AIは人間の感情を理解できるのか?

温かく思いやりのある、一緒にいてくれる「ダバイ」が欲しいと願う人は多いだろうが、ダバイのように人間の感情を理解できるロボットは本当に存在するのだろうか?

最近、アマゾンは、音声アシスタントのAlexaが、ユーザーのコマンドのピッチと音量を分析することで「幸福、喜び、怒り、悲しみ、いらだち、恐怖、嫌悪、退屈、ストレス」などの感情を認識し、対応するコマンドに応答できると発表した。

実際のところ、これは人間の感情を探求する唯一のプロジェクトではありません。

[[246855]]

例えば、前述のAmazonは1年前に、音に含まれる感情状態を分析する研究を行うと発表しました。

Google などの企業はこの分野での追求を止めていません。 Google は否定的な感情を検出するデバイスを開発しており、IBM は顔認識カメラとユーザーの心拍数や脳波のスキャンを使用して検索エンジンの結果を組み合わせており、Realeyes はウェブカメラやスマートフォンを通じて顔の感情を認識しています。

感情を読み取ることは、プライバシーの泥棒なのか、それとも個人的な管理者なのか?

現在、多くのテクノロジー企業が感情を認識する人工知能に多大な努力を注いでいます。たとえば、Amazon は現段階ですでに Alexa 音声アシスタントでその答えを出しています。

感情をより正確に認識できる製品がすぐに登場してくると思います。感情人工知能と感情認識技術は成熟し、徐々にさまざまな分野に応用されるでしょう。これは、感情を監視、評価、記録する時代に入っていることを意味します。それで、これは私たちの生活にとって良いことでしょうか、それとも悪いことでしょうか?

ビッグデータの時代は、個人のプライバシーが簡単に盗まれる時代でもあります。ある専門家はかつてこう言いました。「今日のインターネットユーザーは、ハッキングされた人と、ハッキングされたことに気づいていない人の2種類に大別できます。」

「プライベートカスタマイズ」や「パーソナライズサービス」という看板の下、実際にはユーザーのプライバシー情報が悪用され、その価値が過度に搾取されています。サービスプロバイダーによって収集された個人のプライバシーがハッカーの攻撃を受けると、漏洩したり悪用されたりする恥ずかしい状況に直面することになります。

クラウドペットの製造元であるスパイラル・トイズのインターネット接続型ぬいぐるみに対するハッカー攻撃により、パスワード、電子メールアドレス、親と子の間でオンラインで交わされた220万件のプライベート音声メッセージが流出した。

このような例は珍しくありません。個人情報の漏洩に対する国民の懸念が薄れたからといって、プライバシーがよりよく保護されるわけではありません。むしろ、窃盗や漏洩の手段がより巧妙になっただけです。

多くの人は、個人的な感情は心の中の考えと同じで、盗むことはできないと考えています。しかし、実際にはアイデアを盗むことは不可能ではありません。脳コンピューターインターフェース技術(BCI)を通じてそれが可能になります。たとえば、CBDの通りにはVR体験店がたくさんあり、人々はそれがとても斬新だと思って体験しに行くことがよくあります。

VR ヘッドセットのメーカーにとって、ヘッドセット デバイスを使用してユーザーの生理学的反応データを密かに収集し、最もプライベートな思考を盗むことは、それほど労力を要しません。同様に、感情認識人工知能の発展は「感情ハッカー」や「プライバシー泥棒」のようなもので、感情を含む人間のプライバシーは最も全面的で深刻な盗難リスクに直面することになる。

しかし、すべての物事には二面性があることは否定できません。見出しが個人のプライバシー情報を盗むことに不満を抱いている一方で、パーソナライズされたプッシュ通知は楽しんでいます。所有者の感情を理解し、それに応答することができるこのインテリジェントロボットは、思いやりのある専属執事のようなものです。

飼い主が帰宅し、30分以内にお風呂に入るためにバスルームに行く準備をするように指示すると、この専属執事は飼い主が疲れているか幸せかを分析し、それに応じてバスルームの水温、音楽、さらには照明を調整します。夜に悪夢を見たとき、夢の内容から感情の変化を察知し、適切なタイミングでお香を噴射して落ち着かせてくれます。

しかし、これは解決するのが難しい問題です。

スマート相対理論では、感情を識別して分析する方法が 3 つあるとされています。

  • 1 つは Amazon のようなタイプで、サウンド分析から始まります (ここでは音声スクールと呼びます)。
  • 1 つのカテゴリは、ユーザーの検索結果とダウンロードされたコンテンツ (コンテンツ派閥) を分析する IBM と Spotify によって代表されます。
  • もう一つのカテゴリーは、データベースの構築と撮影技術(撮影学校)を利用して顔の表情を認識するロンドンに拠点を置くRealeyes社が代表的だ。

人の感情は、表情、声のトーン、動きなどの行動を通じて最も直接的に表現されます。コンテンツ派の分析が間接的すぎて信憑性に欠けるのは言うまでもなく、音声や表情を直接分析する音声派や写真派ですら、スマート相対理論からは偏りすぎているとみなされている。

人間の感情が理解しにくいのは、その表現が選択的だからである。行動科学では、微表情からある程度まで人の本当の心情を読み取ることができるが、人が礼儀作法や特別なニーズなどにより意図的に感情を隠している場合、音声や表情を分析するだけの人工知能は、人間の複雑な心理活動を正確に識別できるだろうか。さらに、人間の感情は静的なものではない。「女心は紆余曲折に満ちている」と言われ、人の内面活動は急速に変化する可能性があり、これもまた、人工知能が人間の感情を正しく識別することの難しさを高めている。

アマゾンのプラサド氏は記者会見で「(この技術は)まだ研究の初期段階です。遠距離の音声でイライラや感情を検知するのは難しいです。さらに、AIは人間がイライラしているかどうかの基本的な基準を明確にする必要があります」と述べた。顔の分析の原理はまだ弱く、音声の分析はなおさらだ。複雑な感情と比較すると、音で伝えられる情報は実にわずかだ。さらに、今日の複雑な社会環境において、これら 2 つの技術がボイスチェンジャーや整形手術の課題を乗り越えられるかどうかはまだ不明です。

スマート相対理論は、この困難な問題に依然として 1 つの側面からのみ取り組もうとすると、結果は楽観的ではない可能性があると考えています。

AI 感情分析はどのような障害に直面しますか?

次に、なぜ私たちが楽観的ではないのかについて話しましょう。すると、人間はどうやって他人の感情を認識するのかという疑問が湧いてきます。動物は発する匂いを識別することで感情を判断できることはわかっていますが、人間の感情判断プロセスはそれよりもはるかに複雑です。人間の認識プロセスを参照すると、AI は少なくとも次の問題に直面しています。

1. 単一次元は不正確であり、多次元は良くありません。

感情を判断するアルゴリズムはどの次元から始めるべきでしょうか? 表情、声の変動の頻度、検索内容... かなり高い精度を達成したい場合、単一の次元から始めることは絶対に不可能です。温度や呼吸速度を追加するなど、次元が高すぎると、アルゴリズムにとって大きな課題になるだけでなく、リソースが不必要に浪費されることになります。重要なのは、脳波、人間のホルモン分泌、人間の磁場などから始めて、いくつかの次元とどの次元を選択するかということです。

2. 感情を定義することと感情を識別することは同じではありません。

プラサド氏が言ったように、私たちはさまざまな感情を定義できる必要があります。しかし、必ずしもうつ病の定義を与えることはできませんが、その人がうつ病であるかどうかはわかります。これは、私たちが生まれたときから社会的な行動の環境に浸っているためです。 AIと比較すると、私たちは十分に大きなデータベースを持っています。したがって、比較的完全なアルゴリズム モデルが存在する場合でも、このモデルをトレーニングするには非常に大きなデータベースが必要になります。この規模のデータ収集は、今日の科学技術の成果の支援があったとしても、短期間で達成できる簡単な作業ではありません。

3. 感情を識別する際に、AI はどのようにして「感情の壁」を突破できるのでしょうか?

私たち人間は、「三体」の「三太陽系人」ではありません。必要に応じて感情を隠します。 AIが「感情的な障壁」を突破できなければ、その旅を真に完了することはできないだろう。人間の行動は非常に複雑なので、最も高性能なコンピュータでも解釈できません。感情に関わるあらゆる試みは、AI 研究における最大の難しさです。

感情分析技術は将来どこで活躍できるのでしょうか?

最後に、テクノロジーの導入の可能性についてお話しします。ユーザーの感情状態を分析します。これは素晴らしいことのように聞こえますが、現在のところその用途は製品の販売とパーソナライズされたマーケティングに限られています。

Amazon は、ターゲットを絞った音声広告やプロモーションを提供するために、このスマート音声アシスタントも開発しました。 Spotify は、プレイリストと感情の相関関係に基づいて広告会社に広告スペースも販売しています。大手企業のたゆまぬ努力から、成果はまだ小さいとしても、この技術には依然として大きな可能性と背景があることが分かります。しかし、スマート・レラティブ・セオリーでは、この技術の主な応用段階はおそらくマーケティングではないと考えています。

例えば、MIT メディアラボは、感情認識技術を応用して、運転中のドライバーの疲労を検出したり、視聴者がテレビ番組とどのように関わっているかを研究したり、感情状態に基づく通常の医療手段では検出が難しいうつ病などの精神疾患を診断したりしたいと考えています...

たとえば、人間の感情認識の前に、まず動物の感情認識を試すことができます。動物の感情は人間の感情ほど複雑ではありません。飼い主がペットの感情を察知できる機器があれば、動物と人間はもっと仲良く暮らせるでしょう。ジャイアントパンダのような希少保護動物は、飼育も繁殖も難しいのではないでしょうか。飼育員が動物の感情をより深く理解できれば、貴重な動物の生存と繁殖をよりよく支援できるようになります。

例えば、この技術は乳児の成長を監視するのに非常に役立つかもしれません。無知で自分を表現する方法が分からない赤ちゃんにとって、感情を表現する最も直接的な方法は音と動作です。子どもの感情は比較的認識しやすく、気取らないものです。

もちろん、インペリアル・カレッジ・ロンドンのマヤ・パンディク教授は、この技術が将来、自閉症の子供やうつ病の人を助けることができるようになるだろうという希望を表明した。実際、自閉症や自閉症などの精神疾患であっても、早期に発見して治療するほど、効果は高くなります。感情を認識できる人工知能の「パートナー」が保育園や家庭に導入されれば、親が仕事で忙しくて十分な付き合いのない子どもたちは、こうした精神疾患を大幅に予防できる。また、治療を受ける子どもたちも、より低コストで質の高い個別治療を受けられるようになる。

要約する

感情認識の応用範囲は計り知れません。しかし、ある日、人間の感情が人工知能によって完全に認識できるようになれば、一連の倫理的、道徳的な問題も浮上するでしょう。他人の感情を認識する権利は誰にあるのでしょうか?プライバシー保護戦争の新たなラウンドをどうやって始めるのでしょうか?犯罪分野における感情認識技術の応用は?その時までに、「秘密を守れば腹が腐る」ことも危険な選択になるのでしょうか?

<<:  フロントエンドエンジニアは、これらの18のトリッ​​クをマスターすることで、ブラウザでディープラーニングを習得できます

>>:  李開復:人工知能に取って代わるのが最も難しい10の仕事

ブログ    
ブログ    
ブログ    

推薦する

...

人気は高まり続け、医療AIは業界の爆発的な成長の重要なポイントに達している

現在、世界の注目は5Gに集中しているが、人工知能の発展も軽視できない。わが国では、継続的な優遇政策の...

...

...

ガートナーなど権威ある組織:人工知能、国内外のどのAI技術が強いのか?

2020年末、我が国は第14次5カ年計画を発表し、2035年までの中国の長期目標を策定しました。 ...

大規模言語モデルの最大のボトルネック:レート制限

マット・アセイ企画 | ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:bl...

「人工知能」の発展を合理的に扱う

現在の人工知能の発展は、主にディープラーニングに代表される機械学習技術の恩恵を受けています。ディープ...

ビッグデータと AI を現代の教育とどのように組み合わせることができるでしょうか?

転載は歓迎しますが、署名し、「劉鵬の未来を見つめる」公開アカウントからの転載であることを明記し、この...

...

機械学習の基本概念を10枚の画像で説明する

機械学習の基本的な概念を説明するとき、私はいつも限られた数の図に戻ってしまいます。以下は、私が最も啓...

データマイニングの分野でトップ 10 の古典的なアルゴリズムの 1 つ - K-Means アルゴリズム (コード付きで非常に詳細)

k-means アルゴリズムは比較的単純です。 k-means アルゴリズムでは、クラスターはクラ...

クイックソートアルゴリズムの詳細な分析

[[121946]]序文以前、このブログでクイックソートアルゴリズムに関する人気のチュートリアル記事...

...

...

ラマ2 ビッグバン!バークレーは実機テストで8位、iPhoneでローカル実行可能、多数のアプリが無料でプレイ可能、ルカンも夢中

昨日、Meta は Llama 2 の無料商用バージョンをリリースし、再びオープンソース コミュニテ...