ますます成熟する人工知能は、新型コロナウイルス感染症対策の最前線で「逆転者」と呼ばれる特別な集団となりつつある。 感染症に関する初期の科学研究の加速、最前線の感染症診断・治療や現場での予防・抑制の支援、バックエンドの情報プラットフォームの構築など、人工知能技術とソリューションはすでに登場し、実際の成果を上げています。 Syncedは、感染症対策における人工知能技術の応用の最新の進捗状況と効果を追跡し、感染症対策における人工知能従事者の英雄的物語に焦点を当てるために、「AIが感染症対策に取り組む特別レポート」を特別に立ち上げました。 本日は、シリーズの第 5 回目の記事、「コミュニティ防衛戦争: アルゴリズムが顔認識の「マスク」問題を克服し、その解決策が 2 日間で数千人のコミュニティに実装されました | AI が伝染病と戦う」です。 コミュニティは都市の感染症対策における重要なユニットであり、感染症の中期および後期には軽視できない検問所です。感染症の状況にうまく適応できる顔認識ソリューションだけが、この感染症との戦いで職務に忠実な「AIゲートキーパー」と呼ぶことができます。
南京市江寧区玉堂園コミュニティの南門では、マスクを着けた住民が入退出管理所に歩いて行った。システムは顔認識によりすぐに住民の身元と健康状態を識別し、門が自動的に開いた。
過去1年で急速な進歩を遂げたAIの代名詞ともいえる顔認証は、全国各地で普及し、鉄道の旅客ホールやスーパーのレジカウンターなどでも見られるようになり、今や他に類を見ない存在となっている。 予想外に、疫病が流行し、誰もがマスクを着用すると、カメラの後ろにいたものがストライキを起こし、認識できなくなりました。専門家の中には、マスクを着用すると顔の特徴のほとんどが隠れてしまい、正確さが30%に低下すると言う人もいます。 流行病に直面して、顔認識は役に立たず恥ずかしいものとなり、最終的には手動で行う必要があるようです。しかし、感染力の強いウイルスが蔓延しており、非接触型の検出および識別ソリューションが正しい答えです。 しかし、AI アルゴリズムの力は、反復と自己進化のための無制限のスペースにあります。 9日間の努力の末、AI企業がついに顔認識の「マスク」問題を解決しました。少なくとも限られたコミュニティ内では、マスク顔認識はもはや問題ではありません。 01 モデル測定への新しいアプローチ1月下旬、疫病は増加傾向にあり、休暇前に小石科技の経営陣は、この疫病予防キャンペーンにどのように参加するかについて議論を始めました。彼らは、疫病が社会秩序全体に大きな影響を及ぼし、会社の事業発展にも影響を与えると予測しました。 Xiaoshi Technology(正式名称はNanjing Zhenshi Intelligent Technology Co., Ltd.)は、南京に拠点を置く人工知能企業です。2015年に設立されました。顔認識技術を画期的に活用し、セキュリティ、小売、教育などの業界で導入されています。 同月末、小石科技は社内に緊急に防疫プロジェクトチームを立ち上げ、既存のソリューションと能力を組み合わせ、コミュニティと企業の防疫ニーズを満たすための技術研究開発を迅速に開始しました。 決定後、技術研究開発担当者と製品マネージャーで構成される20~30名のタスクフォースが組織され、技術的な実現可能性の分析を実施します。 遮蔽された状態での顔認識は業界で認識されている問題です。
挑戦の難しさを考慮して、小石科技AI研究所所長の胡建国氏は、まずアルゴリズムモデルから突破することを決定した。 これまで、チームは約 1,000 の基本モデルを蓄積していましたが、実際のニーズに合致しているかどうかはまだ不明でした。現時点では、業界にはマスク用の安定した効率的な顔認識アルゴリズムがまだありません。 モデルの評価にはマスクを着用した人の顔検査データが必要であり、経営陣は全従業員とその親族を緊急動員し、2日間かけて小規模なデータセットを収集した。 その後、研究者らはコンピューティング クラスターをリモートで呼び出してモデルを評価し、目の特徴を顔全体の特徴と統合し、注意メカニズムと組み合わせて目の特徴を強調するという効果的なモデルのアイデアを発見しました。研究者らは独自に開発した軽量ネットワークを通じて、目のキー ポイントのモデルを個別にトレーニングし、マスクによる遮蔽下でのモデルの顔認識率を向上させました。 胡建国氏は、コンピュータービジョンにおける注意メカニズムは人間の視覚の選択性と似ており、その中核的な目標も大量の情報から最も関連性の高い情報を得ることであると説明した。マスクを着用した顔の目は、顔認識の重要な情報となっています。マスクベースの顔認識では、目のキーポイントと注目メカニズムを組み合わせて目の特徴を強調する方法が採用されています。目の特徴マップと顔全体の特徴マップのマルチレベル融合により、顔の有効な情報を十分に抽出し、マスクで顔が隠されている場合のモデルのパフォーマンスを向上させます。 顔認識モデルの注目メカニズムの効果。1列目は元の画像、2列目はヒートマップ、3列目はガイドバックプロパゲーションマップ、4列目はガイドバックプロパゲーショングレースケールマップを表しています。この図では、人間の目の領域がより注目されていることがわかります。 顔認識モデルのトレーニングプロセス中に、胡建国のチームは、特徴マップ抽出のために事前にトレーニングされた目のキーポイントネットワークを同時に読み込み、顔認識ネットワークによって抽出された特徴マップと組み合わせ、注意メカニズムと組み合わせて目の特徴を強調し、認識精度を向上させました。 内部テスト セットでは、モデル結果は通常のアルゴリズム モデル インジケーターよりもわずか 5% 低くなります。これに先立ち、業界内の他のソリューションの一般向けマスク顔認識率は依然として 80% ~ 90% の範囲にとどまっていました。 このアイデアは、以前は一般的なタスクではうまく機能しなかったため、広く使用されていませんでしたが、マスク認識シナリオでのパフォーマンスはすべての人の期待を上回りました。 2月4日、小石AIアルゴリズムチームがモデルテストの結果を受け取った後、胡建国氏と彼のチームは、モデル指標の低下は深刻ではなく、実際の生産で効果的に操作できると判断しました。 02 「パイロットプロジェクトは2日以内に実施されます」モデルの初期検証の後、数百人からなるチームがアルゴリズムの開発と製品の準備に着手しました。 旧正月6日目以降、防疫対策と道路封鎖のため、胡建国さんのように多くの人が家に閉じ込められ、リモートワークしかできない状況になっている。しかし、基本的な生活とは別に、研究開発スタッフはほぼすべてのエネルギーを仕事に注ぎ込んでおり、アルゴリズムの開発のために夜通し働く従業員もいます。 翌日、彼らは南京市江寧区東山街政府から最初の緊急実施任務を受け、2日以内に東山街の玉堂園コミュニティでパイロットプロジェクトを実施するよう求められた。 緊急の需要と不十分なアルゴリズム検証により、R&D チームには多大なプレッシャーがかかりました。 小石科技はまた、緊急に各種の緊急対応計画グループを設立し、研究開発、最前線での展開、業務、物流などの業務を担当しています。管理チーム全体が率先して、すべての情報が同期され、適切に配置されていることを確認し、日常業務を要約してレビューし、基本プロセスに問題がないことを確認しています。 しかし、特別な時期には、特にいくつかの基本的なサポートにおいて、あらゆるところに問題が存在します。たとえば、設置要員を見つけることは困難です。このプロセスは、すべての資材、人材、サポート リソースができるだけ早く準備されていることを確認するために、何度も確認する必要があります。
玉堂園の常住人口は約1,500~1,700人。顔認識による入退管理を導入する上で、住民の顔をデータベースに登録することは重要なステップとなる。しかし問題は、地元警察が所有者の顔データを提供したにもかかわらず、入居者が多かったためそのデータが使用できなかったことだ。 手作業によるデータ入力は非効率で、一定のリスクも伴います。そのため、R&D チームは、住民が現場でコードをスキャンして指定エリアでデータ入力を完了できる、便利なデータ入力用の小さなプログラムを特別に開発しました。 データ入力をできるだけ早く完了するために、いくつかの通りからボランティアや党員が支援に参加しました。住民たちは驚くほど協力的で、1日以内に住民全員の顔登録が完了しました。 2月7日、Xiaoshi Technologyはパイロット展開を完了しました。配備中に遭遇する困難は、実験室環境で遭遇する困難よりもはるかに大きい。胡建国氏は、マスク不足のため、高齢者の中には手作りのマスクを着用する人もいるが、手作りのマスクはより広い範囲をカバーし、より多様なスタイルを持っている可能性があり、実際の配備で大きなプレッシャーをもたらすとも述べた。 幸いなことに、製品の発売後、一部のアルゴリズムのしきい値とアクセス制御システムの場所を調整しただけです。人口 2,000 人未満のコミュニティでは、マスク着用での顔認識により、非常に効率的なアクセスが実現しました。
コミュニティが住民をより適切に管理できるように、カスタマイズされた入退出ルールシステムも導入されました。たとえば、隔離観察期間を完了していない住民は外出を禁止でき、コミュニティ以外の住民は入退出を禁止できます。 コミュニティはマスク着用での顔認識アクセス制御システムを通じて、接触リスクを軽減しながら、住民の分類管理と正確な識別を実現できます。これは、帰省のピークを迎えているコミュニティにとって、タイムリーな救済策です。 その後1~2日間、南京の各レベルの指導者による検査に耐え、小石テクノロジーは政府の承認と信頼を獲得した。疫病対策の緊急性により、新たな任務が続いた。政府は小石科技に対し、数日以内に数十のコミュニティの展開を完了するよう要求した。 その後、任務はさらに激化し、短期間で東山街に285のコミュニティを展開するというプレッシャーも小石テクノロジーにかかっていました。 03 総攻撃「展開戦闘」パイロットの完了に伴い、小石科技は2月7日の夜に全人員戦闘状態に入り、同社の従業員の80%以上が最前線での展開と遠隔サポートの両方で、流行プロジェクトに全面的に従事しました。 実際の展開に参加した小石科技の最前線の従業員は、業務担当者や技術担当者など、さまざまな職種から構成されています。いずれにしても、隔離が完了すれば、できるだけ早く最前線のサポートに赴き、生産を担当し、設備の設置やユーザーの質問への回答などを行います。
展開およびデバッグスタッフ 胡建国氏は、特に最前線の実施要員は人員が限られており、製品の設置場所も多いため、基本的に昼夜2交代制で働いていると述べた。仕事が激しいため、毎日早朝まで忙しく、中には朝の4時や5時まで働く人もいる。 アルゴリズム担当者は最前線の展開もサポートし、製品で発生した問題や技術的な改善のアイデアを持ち帰り、時間との競争の中でモデルをバージョンごとに更新します。 「2月7日から1週間も経たないうちに、私たちはすでにモデルのバージョンを4~5つ更新していました」と彼は付け加えた。 AI研究所は、データのラベル付けとクリーニングを行うために、テスターや管理スタッフを含むリモートサポート担当者を招集しました。 急速な進歩により、2月12日現在、わずか5日でXiaoshi Technologyのソリューションは20以上のコミュニティに導入され、4万人以上のコミュニティ住民にサービスを提供しています。さらに、企業や政府機関などの他のシナリオでも活用されています。 しかし、新たな問題が発生します。例えば、小石科技が12日に展開したコミュニティには、2,500世帯、常住人口が1万人近くいる。これほど人口規模が大きいと、テクノロジーに新たな課題がもたらされる。 これは、人口が一定規模、例えば数十万人の中にいると、非常に似た目を持つ人が必ず見つかるからです。口や鼻などの有効な情報が遮られると、その分解像度が低下します。 「バックエンドのデータを手動で検証していたところ、人間が区別できないデータに遭遇した」と胡建国氏は語った。 「固有のデータ制限と有効な顔情報の欠如により、顔認識の応用は非常に困難になります。」 疫病対策の緊急の必要性と政府の高い期待の下、Xiaoshi AIアルゴリズムチームもモデルを集中的に反復しながらかなりのプレッシャーにさらされました。 「半月以内に約2万人を支援するという目標を掲げました。」 同時に、小石科技はサプライチェーンの不足により棚上げになっていた赤外線温度測定装置の開発と改良も進めており、早ければ1週間以内にAI温度測定機能を備えた顔認識アクセス制御製品の試験運用が可能になるかもしれないと語った。 |
<<: 研究AI面接に合格するには? RedditユーザーがGoogleの面接体験を語る
>>: 世界のAI競争は中国と米国がリード。人工知能は過大評価されているのか?
人間にとって画像を認識するのは簡単ですが、機械がそれを実現するには長い時間がかかりました。コンピュー...
ウイルス分析、ワクチン開発、医薬品研究開発から診断支援、スマート温度測定、AI消毒まで…新型コロナウ...
[[324391]]インターネットの破壊的イノベーションは、自らの業界から生まれることはありません...
今年は生成AI技術が大変人気です。ChatGPTの登場以来、多くの大規模な生成AIモデルが雨後の筍の...
デジタル時代において、ビッグデータと人工知能はビジネス界の重要な原動力となっています。大量のデータが...
1. グラフニューラルネットワーク入門グラフ ニューラル ネットワークについて説明する前に、まずグラ...
YouTubeは本日、クリエイターカンファレンス「Made on YouTube」において、AIを活...
[[353152]]人工知能は新興の破壊的技術として、科学技術革命と産業変化によって蓄積された膨大な...
商業ビルでは、顧客と居住者の快適性がポジティブな体験を保証するために重要です。快適さの重要な要素は、...
[[411126]]この記事はWeChatの公開アカウント「Python Chinese Commu...