AIに「感情」を与える時が来たのかもしれない 今後のビジネスモデルはますます「感情的」なものになるでしょう。 ユーザーエクスペリエンスは製品設計において重要な考慮事項です。 その結果、多くの製品のユーザー インターフェイスには、ユーザーの感情状態を検出し、ユーザーと対話するときにシミュレートされた感情を使用できる機能が組み込まれ始めています。 著名な技術コンサルティング会社ガートナーが今年 1 月に発表したレポートには、次のように記されています。「 4 年以内に、デバイスは「家族よりもユーザーの感情状態をよく理解するようになる」」
人工知能に関して言えば、多くの人は、AlphaGo が囲碁で柯潔を何回打ち負かしたか、あるいは DOTA の後に OpenAI がいくつかのゲームで人間に勝ったかということだけに注目するかもしれません。 しかし、AIはかつて人間に特有だと信じられていた「感情」の分野でも進歩を遂げている。 現在、AIディープラーニング感情認識は、幸福、驚き、怒り、悲しみ、恐怖、嫌悪などの基本的な感情から、「嬉しい驚き」、「怒りの驚き」、畏敬の念など、20以上のより微妙な感情にまで発展しています。
オハイオ大学が開発したこの感情 AI は、写真の表情に基づいて 21 種類の感情を認識できます。 さらに衝撃的なのは、このシステムはこれらの感情を検出するのに人間よりも正確だったことだ。 機械による感情認識の基本原理は、顔面の血流の変化によって引き起こされる顔面筋の動きと顔色の変化を識別することにあります。 どちらも感情によって引き起こされる神経活動に関連しています。
顔面血管 【研究動画解説】: ビデオを読み込んでいます...表情研究の先駆者であるポール・エイクマンは、1971 年に「顔と感情における文化間の定数」という本を出版しました。 国や人種が違えば、言語や文化も異なりますが、基本的な感情表現は一貫しており、外的な表現も一定のパターンに従います。
したがって、機械に感情を生み出させることは複雑かもしれませんが、機械に感情を認識させ、それを模倣させることは、単なる「学習」の問題です。 コミュニケーションには感情が必要 人間の会話の内容がコミュニケーションの総体であるという誤解がよくあります。 実際、人間は言語だけでなく、声のイントネーション、表情、身振り、ボディランゲージでもコミュニケーションをとっています。 そのため、電子メールには誤解が生じる可能性が大いにあります。非言語的な手がかりがなければ、意図の多くは失われます。
コンピュータ開発の歴史には、コンピュータがより強力になるにつれて、その機能の大部分が人間とのやりとりの質の向上に適用されるという傾向がありました。 人間とコンピューターの間の最初の「インターフェース」はスイッチ、パンチカード、磁気テープであり、人間はそれらをコンピューターのバイナリ言語に変換するのに非常に複雑な手順を踏まなければなりませんでした。 しかし、その後、コマンドライン、GUI、音声インターフェースへと早送りされ、それぞれの進歩により、機械と人間のやり取りが容易になりました。
エニアック しかし、今日の音声言語インターフェースは、本質的には言葉だけを処理し、非言語的な手がかりは処理しないため、十分ではありません。 バーチャルアシスタントに話しかけると、話した言葉がテキスト化され、「公開」テキストになります。話しかけたときの声のトーン、表情、体の動きなどの情報は含まれません。 感情 AI の最大の利点は、人間とコンピューターのやりとりに言語的および非言語的なコミュニケーションがますます含まれるようになり、双方の理解が向上することです。 Siri (Apple)、Google Assistant (Google)、Alexa (Amazon)、Cortana (Microsoft)、Xiao Ai (Xiaomi) などの仮想アシスタントが、ユーザーの気分に応じて異なる反応を示すようになるのは、そう遠くないかもしれません。 スマートフォンのハードウェアの革新が弱い今日、ますます多くの企業がソフトウェアの堀を築く方法を見つけ始めています。 あなたの感情を理解し、安心感を与えてくれる音声アシスタントは大きな進歩となるでしょう。
ビジネスにおける感情の応用 人間の感情を検出し、シミュレートできる AI は、顧客サービス、仮想アシスタント、ロボット工学、工場の安全、ヘルスケア、輸送などを変革します。 Frost & Sullivan が実施した Cogito 調査では、回答者の 93% が、優れた顧客サービス対応は自社のイメージ向上に役立つと回答しました。 MIT ヒューマン ダイナミクス ラボの行動科学研究に基づいた Cogito の AI ソフトウェアは、顧客の感情状態を分析できます。 また、コールセンターの担当者に即座にフィードバックを提供し、顧客に「共感」してコミュニケーションをとることがより簡単になります。 Affectiva や Realeyes などの企業は、ウェブカメラを使用して顔の表情や心拍数を追跡する(顔の皮膚の変化を検出することにより)クラウドベースのソリューションを提供しています。 1 つの用途は市場調査です (消費者が広告を見ると、このテクノロジーによって広告内の画像やテキストに対する消費者の感情を検出できます)。 両社はまた、患者が適切に表現していなくても、自動コールセンターが患者の声から痛みや憂鬱を検知できる医療などの他の分野への進出も検討している。 日本のオムロンオートメーションが開発し、今年のCESで公開された卓球ロボット「フォルフェウス」。 卓球のスキルの一部は、ボディランゲージを読んで人間の対戦相手の気分やスキルレベルを確認する能力です。
人間と協働する産業用ロボットでは、「感情認識」により生産性や安全性を向上させることができます。 たとえば、産業用ロボットは工場労働者のボディランゲージを読み取ることで、人々がどのように、どこに移動するかを予測し、作業のダイナミクスを判断し、事前に危険を警告することができます。 チーハンテクノロジーのサンボット、ソフトバンクのペッパー、ホンダの3E-A18などのロボットが、空港、ショッピングモール、ホテルなどのサービスエリアに移動式キオスクとして配備されている。 人間の感情を理解し、模倣するように作られたこれらのロボットは、ボディランゲージ、音声パターン、顔の表情を読み取って、ユーザーの気持ちを理解したり、ユーザーが混乱している場合は、より満足のいく回答を提供したりすることができます。 感情検出のもう一つの主要かつ明白な応用は、自動車とトラックです。 ダッシュボード、座席、シートベルトに生体認証センサーとカメラを設置することで、車載 AI は運転者がストレスを感じているか、運転中に疲れすぎているかを判断し、事故を減らすことができます。 フォードは現在、欧州連合と協力してそのようなシステムの開発に取り組んでいる。 感情AIは消費者部門と公共部門で利用される Facebookは最近、「感情を検知する自撮りフィルター」の特許を取得した。 写真で検出された感情に基づいて、適切な自撮り「マスク」を自動的に選択するというアイデアです。 たとえば、自撮りをしている人が悲しそうな顔をしている場合、フィルターはデフォルトで漫画の涙のマークになります。幸せそうな顔をしている場合は、「ハッピーパンダ」が表示されます。
Nevermind というビデオ ゲームでは、バイオフィードバックを使用してプレイヤーの感情を検出し、それに応じて難易度を調整します (Affectiva のテクノロジ)。 思慮深いと思ったら、おそらくがっかりするでしょう。 プレイヤーが怖がるほど難易度が高くなる設定です!
ホラーゲーム ネバーマインド 「世論を監視する」ための強力なツール 上記は、いくつかの小さなプログラムへの応用例に過ぎません。すでに、これが「世論監視」の強力なツールになると考えている人もいると推測されます。 英国では、政府はFlyingBinaryとEmraysが開発したG-Cloud 10というサービスを使用して、ソーシャルメディアの投稿やコメントに基づいて感情を検出しています。 今年3月、中国のある学校は教室に特別なカメラを設置し、人工知能を使って生徒全員の感情状態を監視し、注意力を評価した。 これ以上言うことはありません。 しかし、感情 AI は非常に幅広い商業応用の見通しを持つと予測されます(少なくとも、男の子が恋に落ちるために必要なシステムになるでしょう)。 公共部門の場合、さらに多くの「理由」があります。
人間と同じ喜びや悲しみを分かち合うのではなく、ただうるさいだけだと思います。 |
科学技術の継続的な発展に伴い、人工知能、5Gネットワーク、生体認証、ロボットなどのインテリジェン...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
近年、ディープラーニングに基づく視覚認識技術の発展により、自動車のインターネット分野での自動運転の繁...
Appleは、ChatGPTやGoogleのBardのような大規模言語モデル(LLM)と競合する独自...
最も注目されているテクノロジー企業OpenAIと世界一の富豪マスク氏との壮大な戦いは新たなレベルに達...
人工知能、モノのインターネット、産業インターネットなどがもたらすインテリジェント化の波は、技術発展の...
何百ものトレーニング データの例を手描きせずに、シンプルなカラー スキームを自動的に適用できますか?...
AIを使って音楽を作曲した場合、AIが作曲した音楽と人間が作曲した音楽を区別できますか?今日はその...
大規模言語モデル (LLM) には、これまでにない言語理解および生成機能が備わっていますが、これらの...
大きなモデルはすべてコンテキスト ウィンドウをロールアップしました。Llama -1 のときは、標準...
翻訳者 | 李睿校正 | 梁哲、孫淑娟機械学習のワークロードでは、結果を迅速に生成するために効率的な...
今はお金を稼ぐのが難しく、ビジネスも簡単ではないと言う人もいますが、今こそ最高の時代だと言う人もいま...
51CTO は 2005 年に設立され、テクノロジー学習とメディアを統合したプラットフォームです。...