最近、中国のビッグデータおよび人工知能製品と技術の大手プロバイダーであるPERCENTは、コンピュータビジョンの巨匠である李自清教授を自社のトップコンピュータビジョン科学者として採用し、同時に中国科学技術奥森と深い戦略的協力関係を築いたと発表しました。同社は、AI知覚層の視覚認識分野での配置を深め、知覚と認知を重ね合わせて、インテリジェントな意思決定の閉ループを構築します。 顔認識に関する世界特許11件 李子清教授は「顔認識のゴッドファーザー」として知られています。彼と彼のチームは、顔認識、顔検出、顔キーポイント位置決め、顔偽造防止、顔3D可変モデル、歩行者検出、歩行者追跡、歩行者認識、微細表情競争、国際ジェスチャー認識などのコアテクノロジーに関する国際コンテストで11の世界初を獲得しました。
写真: 李子清教授 Li Ziqing教授の研究分野には、統計的パターン認識と機械学習理論のほか、生体認証、インテリジェントビデオ監視、画像処理とコンピュータービジョン、画像とビデオの理解などが含まれます。研究チームを率いて、コンピュータービジョンと顔認識に関する論文を400本以上発表し、10冊の書籍を編纂しました。そのうち、「画像分析におけるマルコフランダムフィールドモデル」(Springer 1995、第2版2001、第3版2009)は、「画像分析分野における画期的な研究」と称えられ、引用回数は2,000回を超えています(Google Scholarによる)。IEEE Transactions on Pattern Analysis and Machine Intelligenceの副編集長を務めました。2004年以来、90を超える国際学術会議の議長、プログラム委員長、プログラム委員を務めています。 2004年、「中国科学院優秀百人計画」の候補者に選ばれ、中国科学院生体認証・セキュリティ研究センター所長に就任。彼は顔認識、パターン認識、コンピュータービジョンの分野への貢献により IEEE フェローに選出されました。 李自清教授は、間違いなく視覚認識分野のリーダーです。2001年に早くも、李自清教授は世界初のリアルタイム顔認識システム「Eye-CU」を開発しました。これは、ビル・ゲイツがCNNヘッドラインのインタビューで自ら説明しました。顔認識IoT/クラウドサービスのコンセプトは2009年に提案され、インテリジェントビジュアルIoTのコンセプトは2010年に提案されました。2012年には、インテリジェントビジュアルIoTが無錫公安局に実装され、2013年世界スマートシティ博覧会賞を受賞しました。 李子青氏の発明は国際的なイノベーションにも影響を与えている。同氏は2009年に顔認識の偽造防止技術の研究開発を開始した。2011年には欧州連合(EU)から第7次フレームワーク研究プログラムへの参加を招待され、12チーム中唯一の非欧州チームとなった。近年、彼はマルチスペクトル両眼深層学習認識システムを発明し、昨年CCTV 3.15によって暴露された顔認識セキュリティの脆弱性を完全に解決しました。また、彼は非常に高い技術障壁を持つ新世代のインテリジェントビジョンカメラを発明し、単眼フル照明とフル出力をサポートし、現在のスマートカメラの欠陥を解決しました。世界有数の科学雑誌「サイエンス」はかつて李教授と独占インタビューを行い、同教授の科学的業績を紹介し、コンピュータービジョンの分野における中国の革新能力は世界の最先端にあると評価した。 顔認識とインテリジェントビデオ監視の専門家として、10件以上の国家科学研究プロジェクトと主要な応用工学プロジェクトを主宰し、関連分野で10件以上の特許を取得または申請しています。特に公共安全の分野では、過去10年間で、李自清教授は実用的な顔認識システムとインテリジェントビデオ監視システムを開発し、それらは主要な国家安全部門に導入され、北京オリンピック、上海万博、国境検査、税関などの安全確保に非常に重要な役割を果たしました。 注目すべきは、彼が顔認識の国際標準策定者でもあることです。SAC/TC100/SC2の副議長として、中国の国家機関を代表して中国初のISO/IEC JTC1/SC37生体認証国際標準作業草案を作成し、それが採択されました。また、合計18の国家標準と業界標準を策定しました。 知覚と認知を重ね合わせて、インテリジェントな意思決定の閉ループを作り出す Transparency Market Research*** が発表した市場レポートによると、2014 年の世界のマシンビジョン市場の価値は 157 億ドルでした。 2015年から2021年にかけて年平均成長率8.4%で成長し、2021年までに285億米ドルに達すると予想されています。需要の爆発的な増加に伴い、コンピュータービジョンの技術開発も新たな質的変化を模索しています。 李子青教授は次のように考えています。「現在のコンピュータービジョンは、依然として2つの大きな技術的ブレークスルーに直面しています。第一に、ディープラーニングでは教師ありトレーニングにビッグデータが必要であり、手作業によるラベル付けには時間がかかり、手間がかかります。第二に、アプリケーションの観点から見ると、動的顔認識の誤報率が高すぎるため、生産プロセスにおけるビッグデータリソースが十分に活用されていません。」 現在の傾向から判断すると、人工知能技術のブレークスルーに対するソリューションは、技術の進化とそのアプリケーションの実装の過程で、徐々に統合へと移行する必要があります。 Li Ziqing教授はPERCENTのトップコンピュータービジョン科学者です。これは、それぞれの長所に基づいた両者の強力な組み合わせであり、知覚と認知を深く重ね合わせています。 一方では、テクノロジーとビジネスが深く統合され、実際のアプリケーション シナリオで閉ループ フィードバック注釈を取得し、生産プロセスからのビッグ データを使用して自律学習を行います。一方、物理的な世界では、知覚できるイメージの背後には、関係性、因果関係、動機など、視覚的に識別することが難しく、認知や推論などのプロセスを通じて完結する必要がある大量の情報があります。 Percentage の AI 認知エンジンは、知覚層の視覚認識にフィードバックを提供できます。百度は2015年以来、業界のデジタル変革に深く関わっており、企業や機関の実際的な問題を解決するために、意味理解を通じて情報を知識に変換し、中国最大の業界応用モデルライブラリと業界知識グラフライブラリを構築し、実際の応用シーンでビッグデータを通じて自律学習を行うための知覚層の視覚認識をより完全かつ自由にサポートできるようになりました。 さらに、知覚と認知の重ね合わせは、視覚的な動的認識の効果を向上させるのに役立ちます。リアルタイム顔認識の先駆者となった李子清教授は、PBXの技術革新の理念と一致する動的顔認識を実現する必要性を改めて提唱しました。ダイナミック ナレッジ グラフは、PBOD が開発、革新した最先端の知識抽出および知識融合技術です。動的、リアルタイム、柔軟に認識層をサポートして動的認識を実現し、データを迅速にビジネス知識に変換して、適応性と自己最適化機能を備えたナレッジ グラフを形成し、現実世界の動的な復元を実現し、複雑で変化するビジネス問題を解決します。 百分店の蘇孟会長兼CEOは、李自青教授と中国科学技術奥森との緊密な協力は、百分店の認知エンジンにインテリジェントな目を加えただけでなく、より深い意義を持っていると紹介した。知覚と認知の深い重ね合わせの後、複雑な内外環境における物事のリアルタイムの変化と物事間の深い相互作用と連携を迅速に判断できる。ビジネスに継続的に判断と分析を提供し、企業にリアルタイムで前向きな決定を提供し、知覚、認知、意思決定の閉ループを実現することができる。 李自清氏と蘇孟氏は共同で、人工知能分野における最先端技術の研究と革新的な応用の実践を引き続き深化させ、人材、学術、技術の交流を行い、業界全体に向けたコンピュータービジョンの顔認識ソリューションを共同で構築し、中国の伝統的な産業がAIのアップグレードを実現できるよう支援し、PBODの海外事業の発展に深く関与し、「一帯一路」沿いの国々がハイレベルの人工知能実験室を構築できるよう支援し、これらの国々に適したマシンビジョン技術と製品を開発し、情報知能レベルを向上させ、共同で「中国ソリューション」を構築し、より多くの国と国民が最先端の人工知能技術とアプリケーションの恩恵を受けられるようにすると表明した。 |
<<: 受注収益が7億人民元を超えるPercentが、なぜこれほど爆発的な成長を遂げることができたのでしょうか?
>>: 2018年のAI技術トレンドトップ10、AIの進歩が未来に与える大きな影響
[51CTO.com クイック翻訳] ロボットは登場しましたが、現在はほとんど世間の注目を浴びていま...
[51CTO.com からのオリジナル記事] 人工知能は最近とても人気があります。人々の焦点は、A...
9月21日、Microsoft GitHubは今年7月にエンタープライズユーザー向けにAIコードアシ...
確率を用いた異常検出アルゴリズム異常検出は、外れ値分析の統計タスクとして扱うことができます。 しかし...
[[186749]]かつてはSF作家や脚本家の領域だった人工知能が、今や着実に現実世界に進出しつつあ...
[[121946]]序文以前、このブログでクイックソートアルゴリズムに関する人気のチュートリアル記事...
最近、OpenAIのビデオ生成モデルSoraが人気を集めており、生成AIモデルのマルチモーダル機能が...
たとえば、RLHF の「人間」が入れ替わった場合、それは実現可能でしょうか? Google チームの...
[[416170]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
皆さんは多くの人工知能プロジェクトを見たり使用したりしたことがあると思いますが、そのほとんどは非常に...
何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...
2017 年後半を迎えるにあたり、データ サイエンスと機械学習を活用する企業が直面する共通の課題に...