顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

昨今、人工知能はますます話題になり、応用されていますが、人工知能、機械学習、マシンビジョンとは一体何なのでしょうか? 人工知能やマシンビジョンなどのそのサブ分野について、それが何であり、どのように機能するかを明確に説明できる人はほとんどいません。

本日、編集部は顔認識の専門家であり、国家科学技術進歩賞二等賞受賞者であり、広東飛思智能科技有限公司のCEOである王国田博士に特別インタビューを行い、人工知能と顔認識アプリケーション間の関連技術概念を皆様に紹介しました。

[[185757]]

顔認識の専門家、王国天博士

王国田博士は次のように説明した。

人工知能(AI)はAIと略されます。これは、人間の知能をシミュレート、拡張、拡大するための理論、方法、技術、アプリケーション システムを研究および開発する新しい技術科学です。人工知能は、知能の本質を理解し、人間の知能と同様に反応できる新しいインテリジェントマシンを生み出そうとするコンピュータサイエンスの一分野です。この分野の研究には、ロボット工学、音声認識、画像認識、自然言語処理、エキスパートシステムなどがあります。

機械学習(ML)は人工知能の研究分野であり、主に確率論、統計学、近似理論などの複数の分野に関係する計算と知識の自動獲得のためのアルゴリズムを設計および分析します。

ディープラーニング (DL) は機械学習の一分野です。機械学習研究における新しい分野です。その目的は、人間の脳内で分析学習を行うためのニューラル ネットワークを構築し、シミュレートすることです。画像、音声、テキストなどのデータを解釈する人間の脳のメカニズムを模倣します。機械学習手法と同様に、ディープラーニング手法は教師あり学習と教師なし学習に分けられます。

顔認識の専門家である王国田博士は、異なる学習フレームワークの下で確立された学習モデルは非常に異なることを特に指摘しました。たとえば、畳み込みニューラルネットワーク(CNN)は、深層教師あり学習の下での機械学習モデルですが、ディープビリーフネット(DBN)は、教師なし学習の下での機械学習モデルです。

つまり、簡単に言えば、人工知能、機械学習、ディープラーニングは包括的です。コンピューティング能力とコンピューティング方法の探求を通じて、私たちは人工知能の本質、つまり自己学習と適応能力を備えた知的生物に近づいています。しかし、人工知能は単に数学モデルの精度を上げることだけと考えるのは間違いです。機械に擬人化能力を与えるには長い開発プロセスが必要です。結局のところ、コンピューターの誕生から現在のモバイルインターネットまで70年かかりました。顔認識技術の分野に20年以上没頭してきた顔認識の専門家である王国天博士は、この問題について深い理解を持っています。

王国天博士は次のように述べた。「ビッグデータと機械学習により、コンピューターは非常に賢くなり、特定の分野では人間の能力の限界を大幅に超えることが可能になりました。例えば、Google AlphaGoは囲碁の世界チャンピオンであるイ・セドルに勝利しました。人工知能の目的は、コンピューターが人間とチェスをすることだけではありません。今後数十年はビッグデータがもたらす知能革命に直面し、機械はますます総合的な能力を獲得すると言えます。」

しかし実際には、人工知能の応用範囲は奥深く、扱いにくく、複雑であり、あらゆる垂直分野への応用には想像を絶する障害を克服する必要があります。そこで、まずは脳の機能を分割し、少しずつ機械を賢くしていきます。人間の脳は、目や耳などのさまざまな感覚を使って外部情報を感知し、判断を下す必要があります。人間の目の代わりに機械を使って測定や判断を行うことをマシンビジョンといいます。マシンビジョンは人工知能の中で最も急速に成長している分野であり、今日誰もがよく知っている顔認識技術は、マシンビジョンで最も挑戦的なトピックの 1 つです。

顔認識の分野では、王国田博士は特に次のように強調しました。従来の顔の特徴はすべて手動で選択されており、たとえばSIFT、HOGなどですが、手動での特徴選択は非常に手間のかかる作業であり、選択された特徴の品質は経験と運に大きく左右されます。ディープラーニングは、特徴を自動的に学習し、サンプルをより適切に表現できる教師なし学習方法です。顔認識は非侵襲性、利便性、安全性などの特性から、幅広い応用展望と科学的研究価値を有しており、ディープラーニング手法を用いた顔認識の研究は、照明、表情、姿勢、低解像度などの問題を改善できる可能性がある。

顔認識の専門家である王国田博士の見解によれば、ディープラーニングに基づく顔認識方法は、スパースオートエンコーダニューラルネットワークとソフトマックス分類器を使用した深層階層ネットワークの構築を例にとり、深層階層ネットワークをトレーニングします。ディープラーニング法の顔認識率を検証するために、ORL、Yale、Yale-B、PERET顔データベースでアルゴリズムを評価しました。テスト内容には、ソフトマックス分類器の顔認識、ディープネットワークのトップレベルの微調整アルゴリズム、ディープネットワーク全体の微調整アルゴリズムの3つの側面が含まれていました。各データベースの顔画像の前処理には、ヒストグラム均等化、非局所平均アルゴリズム、ウェーブレット変換処理、Retinex 画像強化アルゴリズム、準同型フィルタリング アルゴリズムが含まれます。さらに、低解像度の問題は、ディープネットワーク全体の微調整アルゴリズムを使用してさらに検証されました。最後に、スパース オートエンコーダ ニューラル ネットワークとソフトマックス分類器に基づく顔認識システムを、MATLAB GUI プログラミングを使用して実装します。このシステムの深い階層型ネットワークのレベルとノードは調整可能で、完全な認識機能を備えています。

王国田博士は次のように結論付けました。「実験結果は、ディープラーニング法が元のデータの効率的かつ正確な抽象表現を持ち、照明、表情、姿勢、低解像度の条件下で、特に低解像度の場合に優れたパフォーマンスを達成したことを示しています。」

アルゴリズムがいかに強力であっても、実際のアプリケーション シナリオと組み合わせなければ、単なる空論に過ぎません。ランキングの向上や 100% に限りなく近い実験結果以外には、実際の価値はもたらさず、ましてや社会的な利益をもたらすことはありません。人工知能の本来の目的は、人力に取って代わり、人間を解放してより多くの価値を生み出せるようにすることです。顔認識技術もこの基本原則に従うべきです。現在、技術の発展と市場需要の急速な成長に伴い、顔認識による出退勤管理、遠隔オンライン本人確認、実名認証に必要な人的資源や物的資源の代替として顔認識を使用するなど、人間の顔は多くの分野で価値を発揮しています。セキュリティ分野での応用には、公共の場所の動的な監視、逃亡者の逮捕、人員管理などがあります。

最後に、顔認識の専門家の観点から、王国田博士は次のように断言した。「人間の目の効率と比較すると、人工知能の顔認識能力は人間のそれをはるかに上回っています。」しかし、これは機械がミスをしないという意味ではありません。そのため、顔認識の合格率を正確に表す専門用語に「エラー認識率」という用語があります。Feisi Technology に関して言えば、1 万分の 1 のエラー認識率で 98% の合格率を達成し、日常生活の応用シーンを満たすことは十分に可能です。結局のところ、人工知能の意味は、人間に取って代わることではなく、人間にさらに強力な能力を与え、より効率的に作業できるようにすることなのです。

<<:  このロボットは食べられますか?科学者は副作用なく食べても安全だと言っている

>>:  人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

ブログ    
ブログ    

推薦する

...

...

あなたの頭上に「ロボット」がやって来ます!起業家の知恵:リアルタイムで位置を特定し、自動的に警報を鳴らすスマートヘルメットの開発

[[317160]]建設作業中には、火災、電気、機械など、多くの潜在的な安全上の危険が存在します。安...

建設業界における人工知能の応用

研究によると、建設業界では、計画や建設のいずれの用途でも、人工知能技術の応用がますます一般的になりつ...

JVM メモリ管理 - GC アルゴリズムの詳細な説明

導入究極のアルゴリズムとは何ですか?実際、これは現在の JVM で使用されているアルゴリズムであり、...

古典的なJavaアルゴリズムの筆記試験問題を分析する

Java アルゴリズム プログラムに関する質問:同社には筆記試験問題が 1 つだけあり、10 分以内...

Equinix CIO: AI を活用して潜在能力の高いパートナーを見つける

多国籍データ インフラストラクチャ企業である Equinix は、機械学習の確率モデルを使用して潜在...

AI+医療がさらに一歩前進:免疫療法と精密医療の推進

免疫療法はがんの診断と治療に革命をもたらしていますが、まだ少数の患者(20%~30%)にしか効果があ...

需要が高まる最高AI責任者

出版社ファウンドリーの新しい調査によると、企業は生産性とイノベーションを高めるために人工知能に注目し...

パナソニック、AI企業ブルーヨンダーを60億ドル超で買収へ

海外メディアの報道によると、パナソニックは今年3月にアメリカのAIソフト開発会社ブルーヨンダーを70...

ByteDanceのLi Hang: 言語ビッグモデルに関するいくつかの観察と考察

この記事は、LLM に関する著者の見解を詳しく説明しています。主なポイントは次のとおりです。 Cha...

...

...

人工知能が医療画像をどのように変えるか AI は医療画像の世界における第二の目となる

人工知能は多くの分野に影響を及ぼしています。しかし、いくつかの大きな変化が起こっており、その 1 つ...

人工知能詐欺は注目に値する

[[263745]]あらゆるテクノロジーは諸刃の剣であり、人工知能テクノロジーも例外ではありません。...