コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

翻訳者 | ブガッティ

レビュー | Chonglou

1950 年代のコンピュータービジョンの最初の使用例は、入力されたテキストと手書きのテキストの分析でした。初期の商用アプリケーションは単一の画像に焦点を当てており、光学文字認識、画像セグメンテーション、オブジェクト検出などが含まれていました。顔認識の先駆的な取り組みは1960年代に始まり、テクノロジー大手は2010年頃から関連機能を展開し始めた。

コンピュータービジョンの市場規模は2022年に140億米ドルに達すると推定され、2023年から2030年にかけて19.6%のCAGRで成長すると予想されています。コンピュータービジョンの新たなブレークスルーやスタートアップは数多くありますが、他の AI テクノロジーと比較すると市場規模はまだ小さいです。たとえば、生成 AI の市場規模は 2032 年までに 1.3 兆ドルに達すると推定されています。

コンピュータビジョンの新たなユースケース

今日では、どこへ行ってもカメラがあなたをスキャンし、コンピュータービジョンアルゴリズムがリアルタイムで分析を行っている可能性があります。コンピュータービジョンの主な使用例には、ドキュメントのスキャン、ビデオ監視、医療用画像処理、交通流の検出などがあります。リアルタイムコンピュータービジョンのブレークスルーにより、自動運転車の開発が可能になり、レジなし店舗や在庫管理などの小売業のユースケースが進化しています。

特に自動車市場や消費者市場ではコンピュータービジョンが主なアプリケーションとなっているため、このような消費者向けのユースケースを目にしたり読んだりしたことがあるかもしれません。

製造業、建設業、その他の産業企業でコンピュータービジョンがどのように使用されているかはご存じないかもしれません。これらの業界の企業はテクノロジーへの投資が遅れる傾向にありますが、製造、デジタル建設、スマート農業などの分野におけるインダストリー4.0の取り組みにより、業界のリーダーは新興テクノロジーがもたらす機会をより深く理解できるようになっています。

製造工程における無駄を削減

コンピュータービジョンは製造業に大きなチャンスをもたらし、コンピュータービジョンアルゴリズムは 99% の精度を達成しています。この技術を使用している企業がわずか 10% であることを考慮すると、その可能性は特に驚異的です。産業界ではデジタル革命が起こりつつあるのでしょうか、それともこれらの企業はコンピュータービジョンテクノロジーの導入で遅れをとり続けているのでしょうか?

製造業では、動的材料の製品品質を識別することが主要なユースケースであると、IndustrialML の CEO である Arjun Chandar 氏は述べています。「高フレームレートのカメラを使用し、フレームごとに機械学習モデルを適用することで、生産ライン上の欠陥を迅速に特定できます。」

世界中の製造業者は毎年最大 8 兆ドルを無駄にしていますが、コンピュータービジョンは、機器、製造部品、環境要因を監視することで、製造業者がこれらの損失を削減するのに役立ちます。

Chandar 氏は、多くの製造業のユースケースの基盤となるテクノロジーが主流であると述べました。「これらは主に2Dカメラを使用しますが、高解像度と毎秒20フレーム以上のフレームレートを備え、畳み込みニューラルネットワーク（CNN）を使用します。」

精度を向上させるには、メーカーはこのデータを充実させる戦略が必要です。「一般的な製造環境のようにトレーニング能力を高めるには、製品品質の良い画像の数が欠陥の数をはるかに上回る必要があります」とチャンダール氏は付け加えた。

このギャップを埋める 1 つの方法は、合成データを使用することです。これは、開発チームがテストデータの多様性を高めるために使用する方法です。

シンタックス・データ・マネジメント・アンド・イノベーションのパートナーであるイェンス・ベック氏は、メーカーは基本的な目視検査の手順から始めて、その後、より高度な自動化の機会を探ることができると述べた。「車の接着剤の跡のチェックなど、目視検査にコンピュータービジョンと AI が組み合わされているのを目にしています」と同氏は語ります。「顧客にとってのビジネス価値は、手動の手順を自動化して総合設備効率 (OEE) を向上させることだけでなく、検査を文書化し、コンピュータービジョンを製造実行システム (MES)、そして最終的にはエンタープライズリソースプランニングシステム (ERP) に統合することにあります。」

工場現場の安全性の向上

品質と効率性に加えて、コンピュータービジョンは、工場やその他の職場での作業者の安全性の向上や事故の削減にも役立ちます。米国労働統計局によると、2021年に製造業で負傷または病気になった人は約40万人に上った。

「コンピュータービジョンは、人間の監視システムよりも迅速かつ効率的に従業員に対する潜在的なリスクと脅威を継続的に特定することで、作業員の安全性を向上させることができます」と Synthesis AI の CEO 兼創設者である Yashar Behzadi 氏は述べています。「コンピュータービジョンがこれを正確かつ確実に実行するには、大量のデータを使用して機械学習モデルをトレーニングする必要があります。これらの特定のユースケースでは、構造化されていないデータは多くの場合、ラベル付けされていない生の形式で機械学習エンジニアに渡されます。」

製造業者が潜在的な安全上の問題を浮き彫りにする画像を保有している可能性は低いため、合成データの使用は安全関連のユースケースでも重要です。 Behzadi 氏は次のように付け加えました。「合成データなどの技術は、正確にラベル付けされた高品質のデータを提供することで、機械学習エンジニアの負担を軽減します。このデータはエッジケースを考慮し、時間とコストを節約し、不正確なデータによって引き起こされる厄介な問題を回避できます。」

「コンピュータービジョンの利点には、リアルタイム分析、効率性の向上、意思決定の改善などがあります」と、Gramener のロジスティクスおよびサプライチェーン SBU の責任者である Sunil Kardam 氏は述べています。Kardam 氏は、他のいくつかの典型的な使用例を紹介しました。

材料の移動を追跡し、製品やパッケージの欠陥を特定し、廃棄物を削減します。
権限のない人物の行動を監視してプロトコルを施行する
文書処理を合理化し、在庫を最適化し、保険金請求を容易にし、効率的な物流管理を可能にします。

Kardam 氏は、コンピュータービジョンはカメラと、YOLO、Faster R-CNN、OpenCV などの高度なアルゴリズムに依存していると考えています。同氏は、コンピュータービジョン用の機械学習モデルは「スマートカメラとクラウドベースのAPIによって強力な機能が提供され、エッジデバイスまたはクラウドで処理できる」と述べた。

電力網の監視

製造のほとんどは屋内で行われ、エンジニアはカメラの設置場所や照明を追加するタイミングなど、環境をある程度制御できます。屋外エリアや風景を、搭載されたカメラ、ドローン、航空機、衛星を使用して分析する必要がある場合、コンピュータービジョンの使用ケースはより複雑になります。

Buzz Solutions の CTO、COO、共同創設者である Vik Chaudry 氏が、ドローンの使用例を紹介しました。「コンピュータービジョンは、米国全土で信頼性の高い相互接続された電力網を確保するために、電力網、公共設備、変電所の障害を監視および特定するために使用されます」と彼は述べました。「米国全土の多数の公共設備から収集された何千もの画像を基に、コンピュータービジョンは脅威、障害、異常を正確に特定できます。」

電力線火災は重要な懸念事項です。全米合同消防センターによると、1992年から2020年までに米国全土で3万2000件以上の電線による山火事が発生しており、カリフォルニア州で2番目に大きな山火事は電線が木に近すぎることによって引き起こされた。公益事業会社は現在、メンテナンスを最適化し、リスクを最小限に抑えるために AI を活用する機会を評価しています。

「このソフトウェアは既存の公益事業会社からの実際のデータと画像を使用するため、非常に正確で、天候、整備不良のインフラ、気温上昇によるさまざまな脅威を特定できます」とショードリー氏は言う。「この技術により、広範囲にわたる停電や送電網に起因する災害を防ぎながら、迅速かつ効率的なメンテナンスが可能になります。」

脳コンピューターインターフェース

将来を見据えて、AAVAA の CTO である Naeem Komeilipoor 氏は、コンピュータービジョンと新興テクノロジーデバイスにおける新たな境地を明らかにしました。「産業現場で使用されている脳コンピューターインターフェース（BCI）技術は、特に視界が悪く、気温が極端に高い、あるいはカメラの使用が制限されている危険な環境において、特定の産業用コンピュータービジョンの使用事例に対する補完的なアプローチとして機能する可能性がある」と同氏は述べた。

危険な状況で修理を完了することも 1 つのユースケースですが、より一般的なユースケースは、建設、製油所作業、またはその他の現場作業で両手を使って機械設備を検査または操作する必要がある場合です。

「建設現場での修理作業を例に挙げてみましょう。スマートグラスに使用されているBCI技術は、外部カメラを必要とせずに目の動きを追跡する代替手段を提供するため、作業員は困難な状況でも適切に作業を継続できます」とコメイリプール氏は述べた。「BCI はカメラに頼るのではなく、脳や眼電位 (EOG) などの生体信号を解釈して眼球運動を監視します。この技術では、特殊なセンサーで捉えた眼球運動を分析するために、高度な信号処理と機械学習アルゴリズムが必要です。」

原題:コンピュータビジョンの次のブレークスルー、著者: アイザック・サコリック

<<: Microsoft と Meta が提携し、Bing 検索を Meta AI チャットボットに統合

>>: