ネットユーザーたちは、顔認識技術の何が難しいのかと冗談を言っている。

ネットユーザーたちは、顔認識技術の何が難しいのかと冗談を言っている。

今朝、ジャック・マーは自身の微博に「ドイツで開かれたCEBITカンファレンスの開幕式が終わったばかりです。私はいくつかの考えや意見を共有しました。将来、インターネットは伝統的な産業と完璧に融合してこそ、永続的で健全な活路が開け、その融合の結果、真のデジタル(またはデータ)経済が形成されるでしょう。今後30年間、データ経済のおかげで、人類社会は真に大変革の時代を迎えるでしょう。もちろん、アリペイの顔認識決済技術も発表されました。」と投稿した。このニュースが流れるや否や、ネットユーザーはデータ経済に対しては平凡な反応を示したが、「顔認識技術」には大きな関心を示し、ほとんどのネットユーザーは顔認識技術を揶揄し、「整形手術を受けたら?」「双子を産んだら?」「化粧を落としたら…」などと顔認識技術の正確さを疑問視した。

顔認識技術

すると、私たちはこう尋ねずにはいられません。顔認識の技術的なボトルネックはどこにあるのか、そしてなぜそれがネットユーザーの間で不信感を引き起こすのか?顔認識とは、具体的には顔の視覚的特徴情報の分析と比較を利用して個人を識別するコンピューター技術を指すと言われています。これは、生体認証や人工知能の分野においても最も難しい研究テーマの一つと考えられています。難しいのは、主に人間の顔が生物学的特徴であるという事実にあります。

難しさ1: 顔が似すぎていて区別がつかない

人間の顔の特徴に関して言えば、顔の構造は皆似ているため、個人間の違いはあまり明らかではなく、顔を使って個人を区別することは困難です。さらに、双子や多胎出産の識別方法など、考慮しなければならない特殊なケースもあります。これらはすべて、顔認識技術を日常生活に実際に応用する上での障害となります。

難しさ2: 表情、照明条件、美容整形などの外的要因が認識に影響する

人間の顔の形は非常に不安定です。顔の筋肉の変化によって、人はさまざまな表情を作り出すことができます。顔の視覚的なイメージは、さまざまな角度から観察すると大きく変化するため、顔認識の安定性と精度に一定の課題が生じます。さらに、顔認識は、昼と夜、屋内と屋外などの照明条件、マスク、サングラス、髪、ひげなどの顔を覆うもの、そしてもちろん年齢や美容整形手術への人間の介入などの要因によっても影響を受けます。こうした外部要因が顔認識の速度と効果に与える影響をいかに回避するかは、常に科学研究の重要な方向性となってきました。

現在、中国では、アリペイに顔認識技術サポートを提供しているface++のほか、Orbit、漢王科技、四川大学智勝、iFLYTEK、Saiwei Intelligenceなどがあり、いずれも顔認識技術分野に携わっています。現段階では顔認識技術にはまだ多くの欠点がありますが、私たちは顔認識技術の将来の発展空間について依然として楽観的です。

<<:  人工知能、ディープラーニング、マシンビジョン、理解すべき概念

>>:  ディープラーニングAIを使用してマルウェアやAPTを検出し、防止する方法

ブログ    
ブログ    
ブログ    

推薦する

2つのセッションにおけるインターネット大手の提案の要約:デジタル経済とスマートカーが頻出語に

[[385182]]中国人民政治協商会議第13期全国委員会第4回会議が2021年3月4日に北京で開催...

人工知能が消去された画像を完璧な結果で再現します!

革命的な新しい人工知能プログラムは、画像の欠けている部分をすべて完璧に再現できることをすぐに納得させ...

マッキンゼーのパートナー、カレル・エルート氏:「3×Simpler」は産業用ロボットのユーザーエクスペリエンスを向上させます

2年前、イタリアのテノール歌手アンドレア・ボチェッリがイタリアのピサにあるヴェルディ劇場でルッカ・フ...

大規模グラフニューラルネットワークの応用と最新のパラダイムの探究

1. 大規模グラフメモリ/計算問題を解決するための3つのパラダイム2年前に作成したチュートリアルでは...

ロボットを放っておいてください!人間が本当に心配しなければならないのは人工知能だ

近年、人工知能の倫理的問題についての議論が盛んに行われている。最近終了した中国コンピュータカンファレ...

2020年のスマートセキュリティ技術の開発動向

インテリジェントセキュリティ技術とは、画像の取得、伝送、保存、ビデオ分析、ビッグデータ処理のほか、マ...

4 大検索大手は人工知能に夢中です。最も有望なのはどれだと思いますか?

近年、世界の科学技術分野で最もホットな言葉は「人工知能」です。グーグル、百度、ヤンデックス、ネイバー...

IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

昨年 10 月、マイクロソフトの AI および研究部門の研究者およびエンジニアのチームは、自社の音声...

顔認識技術はスマート建設現場やスマートコミュニティにどのようなメリットをもたらすのでしょうか?

スマートシティ、スマートコミュニティ、スマート交通は絶えず推進され、普及しており、ユーザーの使用習慣...

他社がまだ「大型モデル」衛星を打ち上げている一方で、マイクロソフトはすでに開発者にその使い方を教えている。

春から夏へと移り変わる季節は、世界のトップテクノロジー企業が毎年恒例のイベントを開催する季節です。 ...

とても怖い!最初のAIはすでに詐欺行為を行っている

​​ [[250441]]​​この記事はGeek View (ID: geekview) の許可を得...

...

AIインタラクションエクスペリエンスを向上させるにはどうすればよいでしょうか?まずこの三元理論を理解しましょう

概要:人工知能製品が徐々に人々の仕事、生活、娯楽に浸透し、あらゆる分野に革命的な変化をもたらすことは...

53ページのPDFが広く出回り、中核社員が次々と退職。OpenAIにはどんな秘密があるのか​​?

「OpenAIが2027年にAGIを実現する」という53ページのPDFがインターネット上で広く流通...