9月26日、北京市内の中学校で、顔認証システムで本人確認がされた受験者が模擬試験室に入場した。写真は北京ニュース記者の呉江氏による撮影 Appleは常に業界に技術的な変化をもたらしています。 9月初旬のアップル社の記者会見で、「顔認識」が再び注目を集めた。フルスクリーンのiPhone XはFace ID技術を採用しており、中国人を「顔スキャンカーニバル」に巻き込んだ。 「顔スキャンで積立金をチェック」「顔スキャンで出勤・退勤チェック」「顔スキャンでセキュリティチェック」…日常の行動に「顔スキャン」という言葉が付けられることが多くなっている。北京の日壇公園の公衆トイレでも、トイレットペーパーを手に入れるために顔をスキャンしなければならない。 顔認識技術と行政の連携により、将来的には本人であることを証明するために何十枚ものスタンプを押す必要はなく、顔をスキャンするだけで済むようになるかもしれません。 中国国民の顔認識に対する強い関心は、関連分野の企業への資金調達にも反映されている。顔認識クラウドサービスプラットフォームのFace++と、人工知能ビジョンエンジンの構築に注力するSenseTimeは、シリーズCで1億ドル、シリーズBで4億1,000万ドルの資金調達を相次いで受け、人工知能分野の「ユニコーン」となった。 顔認識技術の商業応用の臨界点が到来したようだ。 iPhone Xはそれ自体では成功を収めることはできないかもしれないが、顔認識においては成功を収めた。 顔認識のための3つのアルゴリズム 顔認識とは何ですか?顔認識を定義すると、人間の生物学的特徴を使用して個人を識別する技術であり、一般的には、画像の取得、特徴の特定、および本人確認と検索という 3 つのステップで構成されます。簡単に言えば、顔認識とは、画像から骨格の特徴や眉毛の高さなど、顔の特徴の重要なポイントを抽出し、比較して結果を出力することです。 iPhone XのFace IDはコンピュータービジョン分野の起業家たちを興奮させているが、この顔認識は他の顔認識と同じではない。 AppleのFace IDは通常のカメラではなく、赤外線アクティブ認識技術を使用しており、3次元認識が可能になり、セキュリティが強化されています。 具体的な応用シナリオでは、顔認識は大まかに 1:1、1:N、N:N の 3 つのタイプに分けられます。 1:1レベルの顔認証は、最も基本的な「本人であることの証明」を実現します。 1:1とは、その名の通り、ユーザーが事前に個人の写真をアップロードしてシステム内に保存しておくことを意味します。認証のたびに、オフラインの写真とシステム内に保存されている写真情報を比較して、「本人であるかどうか」を判断します。 たとえば、駅のセキュリティ チェックを受けるとき、改札係員があなたの ID カードと本人を照合して、あなたが ID カードに記載されている人物であるかどうかを証明します。このシナリオは 1:1 のシナリオです。携帯電話のロック解除、顔認証による支払い、オンラインチケット購入、病院の受付、政府の公共福祉プロジェクト、各種証券口座開設、通信口座開設、インターネット金融口座開設など、これらはすべて 1:1 顔認証の応用シナリオです。他の方法と比較すると、1:1 認識は精度が高く、計算能力の要件も比較的低くなります。 1:N 顔認識アルゴリズムは、主に顔の検索、つまり「自分が誰であるかを証明する」ために使用されます。 1:1 の一対一の比較とは異なり、1:N では、写真をシステム内の多数の写真と比較する必要があり、複数の比較結果が類似性に応じて並べられます。 1 位にランクされた結果は正確ではない可能性があります。 1:N 顔認識アルゴリズムは、犯罪容疑者のスクリーニングや迷子の子供の捜索など、セキュリティ分野で主に使用されます。動的肖像認識を専門とするスタートアップ企業、インテリフュージョンは、2015年から深セン市龍崗区警察と協力し、地元の地下鉄の入り口、鉄道駅、都市の村、スーパーマーケットなどの場所に「ディープアイ」システムを構築している。オンラインになってから数か月後、このシステムは警察を支援し、2件の殺人事件の解決に成功した。 セキュリティ分野で利用される 1:N 顔認識は、動的かつ非協力的であることが特徴です。いわゆるダイナミックとは、システムが写真ではなく、カメラで撮影したビデオを認識することを意味します。非協力とは、識別対象がカメラの位置を感知して協力して識別作業を完了する必要がなく、識別対象が受動的な状態にあることを意味します。これによりデータ収集の利便性は向上しますが、同時にあなたの居場所が完全に公開されることになります。 1:1 認識と比較すると、場所、環境、光、収集角度、さらにはガラスの反射が 1:N 認識の精度に影響するため、1:N は比較的困難です。 N:N 顔認識は、実際には複数の 1:N 認識を同時に実行するのと同等であり、「誰が誰であるかを証明する」ために使用されます。 顔認識技術はまだ完璧ではない 顔認識技術の基礎研究に関しては、中国、欧州、米国はほぼ同レベルにある。しかし、商業的な応用に関しては、中国が間違いなく先行しています。 「顔認識は今のところそれほどハイエンドな技術ではありません。中国の大企業は目先の利益を重視しており、顔認識は人工知能の分野で彼らにとって最も早くて最良の収益化チャネルなのです。」北京航空航天大学の人間認識技術分野の専門家である冷彪氏は、グーグル(微博)などの大企業が顔認識技術を追求しないのは、より長期的な計画があるからだと考えている。 中国の人工知能起業家たちは集まるのが好きなようだ。 アリババ、バイドゥ、テンセント、JD.comなどの伝統的なインターネット大手から、Face++やSenseTimeなどの人工知能分野のユニコーン、市場に参入したばかりの起業家チームまで、顔認識は大企業の専売特許ではありません。サーバー側とモバイル側の両方の顔認識分野では、百の学派が争う傾向を示しています。 「顔認識の敷居はすでに非常に低いが、実際の応用シナリオでうまく行うことは容易ではない」。Ziniu Fundの創設パートナーである張全玲氏の言葉は、業界の多くの投資家の意見を代表している。 テレビ番組「The Brain」では、Baiduのディープラーニングベースのロボット「Xiaodu」が顔認識技術の現在の開発レベルを基本的に実証しました。顔の何千もの特徴点を簡単に抽出し、大量の画像を通じてディープラーニングトレーニングを実施して顔画像の前処理機能を実行し、1〜2秒以内に顔画像を効果的に識別して照合することができます。 同時に、小都氏は顔認識が早急に克服しなければならないいくつかの困難な問題も明らかにした。照明条件が悪い、角度が違う、情報がぼやけたり変形したりすると、認識エラーが発生する可能性がある。さらに、顔を覆うもの、帽子、ひげ、髪型、整形手術やPSも認識を妨げる可能性がある。 今年の3.15ガラでは顔認識の技術的な抜け穴が露呈した。司会者は観客の写真を使用するだけでよく、技術的な処理の後、観客自身とまったく同じ 3D 顔モデルをすぐに生成しました。司会者は観客の3D顔型を装着し、携帯電話のカメラに向け、アプリの指示に従ってまばたき、頭を回す、笑うなどの動作を完了し、システムをうまく騙して生体検出と認証を完了しました。 360人工知能研究所の視覚分析専門家である邱雪坎氏はインタビューで次のように語った。「現段階では、顔認識技術はあらゆる場面でまだ十分に成熟していません。顔照合の精度は非常に高いものの、ほとんどの顔認識システムは生体検知に十分な注意を払っておらず、使用されているアルゴリズムも比較的単純なため、解読するのは難しくありません。」 シナリオは起業家チームの躍進の鍵 テクノロジーがまだ完全に成熟していないという事実に加えて、テクノロジー系スタートアップ企業は、企業の成功をテクノロジーのみで判断するという誤解に陥りがちです。 「新しく設立された顔認識企業のほとんどは、まだ『うちの技術は他社より優れている』という段階だ」とプレエンジェルの投資ディレクター、江凱氏は言う。これらの企業はまだ商業化のシナリオを把握していないという。 Source Code Capitalの投資パートナーである張宏江氏(Weibo)も次のように述べている。「企業がアルゴリズムと少数の優秀な人材しか持っていなくても、データがない、またはデータを入手するのが難しく、応用シナリオがなければ、そのような企業は大きく成長することはできないでしょう。」 もちろん、多くの企業もデータを重視していますが、これは絶対的な基準ではありません。 「既存の技術が92点に達していると仮定すると、新しい技術が94点に達することができれば、ユーザーエクスペリエンスの差はそれほど大きくなく、それほど重要ではありません。」雲天利のソリューションマーケティングディレクターである王俊氏の見解では、技術は常に反復して更新されますが、技術が破壊的にならない場合、技術がもたらす価値は大幅に減少します。 もちろん、これはテクノロジーの重要性を否定するものではありません。しかし、すでにユニコーン企業が市場に登場している場合、テクノロジーは新しい企業の切り札になることはほとんどないでしょう。 「我々は現在、創業間もない顔認識企業に注目している。純粋に技術的なレベルよりも、実用的な問題を解決できる企業に注目している」と江凱氏は述べた。新興企業にとって商業化能力こそが突破口となる。技術力とビジネス能力の両方に重点を置く AI スタートアップ チームは、資本に好まれる可能性が高くなります。 現場のリソース、データ収集、資本力のいずれの面でも、大企業は起業家チームに対して比類のない優位性を持っています。大企業が市場に参入した後、スタートアップはどのように行動すべきでしょうか? 「スタートアップ企業の生き残りを支えるのは、業界への深いサービスと浸透力だ」匿名を希望する投資家は、スタートアップ企業が大手企業のイノベーションに簡単に取って代わられることはないだろうと語った。それどころか、大手企業の巨額の投資と基本的なイノベーションが、新たな分野でのチャンスの出現を後押しするだろう。例えば、AppleがiPhoneを積極的に推進し、GoogleがAndroidシステムを積極的に推進して初めて、モバイルインターネットの発展が本格的に爆発的に進み、UberやDidiなどの新たなチャンスが生まれました。 Face IDの登場は、顔認識のスタートアップチームにとっても新たなチャンスです。 ただし、顔認識が成熟したアプリケーションになるかどうかは、シナリオによって異なります。上記の投資家は、「消費や娯楽など、それほど高い結果が求められないシナリオについては楽観的ですが、金融決済など極めて高い精度が求められる分野については慎重です」と述べています。 この見解は、Yuntian Lifei のソリューション マーケティング ディレクターである Wang Jun 氏の見解と一致しています。 「ゼネラル・エレクトリックの元会長ジャック・ウェルチは著書『ビジネスの本質』の中で、製品そのものの価値の方が重要だと述べています。この世界では、最先端の技術が最も商業的価値があるわけではありません。逆に、大規模に複製するのが最も簡単な技術が最も普及しやすいと思います。そのため、セキュリティ要件がそれほど高くない分野での顔認識の応用については楽観的です。」 |
<<: バックプロパゲーションを用いた多層ニューラルネットワークのトレーニングの原理
>>: Alipay のディープラーニング エンジン xNN を公開
最近、中国の Apple App Store で「奇妙な現象」が発生しました。一部のアプリケーション...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
知乎のホットな投稿によると、中国のトップAI研究者でUCLA教授の朱松春氏が清華大学オートメーション...
熱帯雨林の杖が、ダンブルドアのようなあらゆる時代の並外れた魔法使いの伝説を生み出したのと同じように、...
今日のデータ主導の世界では、競争上の差別化を図ることが成功の鍵となります。この目標を達成するために、...
人工知能は現在非常に人気の高い技術であり、世界中の国々が研究に資金と人材を投入しています。人工知能を...
スーパーコンピュータは、従来のコンピュータでは解決できない問題を解決するためによく使用されます。しか...
翻訳者 |ブガッティレビュー | Chonglouここ数か月で、リリースされる AI ツールの数は増...
2020年という章が静かに変わり、多くの人々が安堵のため息をつくことができました。しかし、この一年は...
これら 5 つの重要なヒントは、製薬会社の幹部がデータ サイエンスの道への扉を開くのに役立つかもしれ...
米国現地時間9月8日木曜日、投資会社ニーダム・セキュリティーズは、アマゾン、グーグル、マイクロソフト...