コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

翻訳者 | ブガッティ

レビュー | Chonglou

1950 年代のコンピューター ビジョンの最初の使用例は、入力されたテキストと手書きのテキストの分析でした。初期の商用アプリケーションは単一の画像に焦点を当てており、光学文字認識、画像セグメンテーション、オブジェクト検出などが含まれていました。顔認識の先駆的な取り組みは1960年代に始まり、テクノロジー大手は2010年頃から関連機能を展開し始めた。

コンピュータービジョンの市場規模は2022年に140億米ドルに達すると推定され、2023年から2030年にかけて19.6%のCAGRで成長すると予想されています。コンピュータービジョンの新たなブレークスルーやスタートアップは数多くありますが、他の AI テクノロジーと比較すると市場規模はまだ小さいです。たとえば、生成 AI の市場規模は 2032 年までに 1.3 兆ドルに達すると推定されています。

コンピュータビジョンの新たなユースケース

今日では、どこへ行ってもカメラがあなたをスキャンし、コンピューター ビジョン アルゴリズムがリアルタイムで分析を行っている可能性があります。コンピューター ビジョンの主な使用例には、ドキュメントのスキャン、ビデオ監視、医療用画像処理、交通流の検出などがあります。リアルタイム コンピューター ビジョンのブレークスルーにより、自動運転車の開発が可能になり、レジなし店舗や在庫管理などの小売業のユースケースが進化しています。

特に自動車市場や消費者市場ではコンピューター ビジョンが主なアプリケーションとなっているため、このような消費者向けのユース ケースを目にしたり読んだりしたことがあるかもしれません。

製造業、建設業、その他の産業企業でコンピューター ビジョンがどのように使用されているかはご存じないかもしれません。これらの業界の企業はテクノロジーへの投資が遅れる傾向にありますが、製造、デジタル建設、スマート農業などの分野におけるインダストリー4.0の取り組みにより、業界のリーダーは新興テクノロジーがもたらす機会をより深く理解できるようになっています。

製造工程における無駄を削減

コンピューター ビジョンは製造業に大きなチャンスをもたらし、コンピューター ビジョン アルゴリズムは 99% の精度を達成しています。この技術を使用している企業がわずか 10% であることを考慮すると、その可能性は特に驚異的です。産業界ではデジタル革命が起こりつつあるのでしょうか、それともこれらの企業はコンピューター ビジョン テクノロジーの導入で遅れをとり続けているのでしょうか?

製造業では、動的材料の製品品質を識別することが主要なユースケースであると、IndustrialML の CEO である Arjun Chandar 氏は述べています。 「高フレームレートのカメラを使用し、フレームごとに機械学習モデルを適用することで、生産ライン上の欠陥を迅速に特定できます。」

世界中の製造業者は毎年最大 8 兆ドルを無駄にしていますが、コンピューター ビジョンは、機器、製造部品、環境要因を監視することで、製造業者がこれらの損失を削減するのに役立ちます。

Chandar 氏は、多くの製造業のユースケースの基盤となるテクノロジーが主流であると述べました。 「これらは主に2Dカメラを使用しますが、高解像度と毎秒20フレーム以上のフレームレートを備え、畳み込みニューラルネットワーク(CNN)を使用します。」

精度を向上させるには、メーカーはこのデータを充実させる戦略が必要です。 「一般的な製造環境のようにトレーニング能力を高めるには、製品品質の良い画像の数が欠陥の数をはるかに上回る必要があります」とチャンダール氏は付け加えた。

このギャップを埋める 1 つの方法は、合成データを使用することです。これは、開発チームがテスト データの多様性を高めるために使用する方法です。

シンタックス・データ・マネジメント・アンド・イノベーションのパートナーであるイェンス・ベック氏は、メーカーは基本的な目視検査の手順から始めて、その後、より高度な自動化の機会を探ることができると述べた。 「車の接着剤の跡のチェックなど、目視検査にコンピューター ビジョンと AI が組み合わされているのを目にしています」と同氏は語ります。「顧客にとってのビジネス価値は、手動の手順を自動化して総合設備効率 (OEE) を向上させることだけでなく、検査を文書化し、コンピューター ビジョンを製造実行システム (MES)、そして最終的にはエンタープライズ リソース プランニング システム (ERP) に統合することにあります。」

工場現場の安全性の向上

品質と効率性に加えて、コンピューター ビジョンは、工場やその他の職場での作業者の安全性の向上や事故の削減にも役立ちます。米国労働統計局によると、2021年に製造業で負傷または病気になった人は約40万人に上った。

「コンピューター ビジョンは、人間の監視システムよりも迅速かつ効率的に従業員に対する潜在的なリスクと脅威を継続的に特定することで、作業員の安全性を向上させることができます」と Synthesis AI の CEO 兼創設者である Yashar Behzadi 氏は述べています。「コンピューター ビジョンがこれを正確かつ確実に実行するには、大量のデータを使用して機械学習モデルをトレーニングする必要があります。これらの特定のユース ケースでは、構造化されていないデータは多くの場合、ラベル付けされていない生の形式で機械学習エンジニアに渡されます。」

製造業者が潜在的な安全上の問題を浮き彫りにする画像を保有している可能性は低いため、合成データの使用は安全関連のユースケースでも重要です。 Behzadi 氏は次のように付け加えました。「合成データなどの技術は、正確にラベル付けされた高品質のデータを提供することで、機械学習エンジニアの負担を軽減します。このデータはエッジケースを考慮し、時間とコストを節約し、不正確なデータによって引き起こされる厄介な問題を回避できます。」

「コンピューター ビジョンの利点には、リアルタイム分析、効率性の向上、意思決定の改善などがあります」と、Gramener のロジスティクスおよびサプライ チェーン SBU の責任者である Sunil Kardam 氏は述べています。Kardam 氏は、他のいくつかの典型的な使用例を紹介しました。

  • 材料の移動を追跡し、製品やパッケージの欠陥を特定し、廃棄物を削減します。
  • 権限のない人物の行動を監視してプロトコルを施行する
  • 文書処理を合理化し、在庫を最適化し、保険金請求を容易にし、効率的な物流管理を可能にします。

Kardam 氏は、コンピューター ビジョンはカメラと、YOLO、Faster R-CNN、OpenCV などの高度なアルゴリズムに依存していると考えています。同氏は、コンピュータービジョン用の機械学習モデルは「スマートカメラとクラウドベースのAPIによって強力な機能が提供され、エッジデバイスまたはクラウドで処理できる」と述べた。

電力網の監視

製造のほとんどは屋内で行われ、エンジニアはカメラの設置場所や照明を追加するタイミングなど、環境をある程度制御できます。屋外エリアや風景を、搭載されたカメラ、ドローン、航空機、衛星を使用して分析する必要がある場合、コンピューター ビジョンの使用ケースはより複雑になります。

Buzz Solutions の CTO、COO、共同創設者である Vik Chaudry 氏が、ドローンの使用例を紹介しました。 「コンピューター ビジョンは、米国全土で信頼性の高い相互接続された電力網を確保するために、電力網、公共設備、変電所の障害を監視および特定するために使用されます」と彼は述べました。「米国全土の多数の公共設備から収集された何千もの画像を基に、コンピューター ビジョンは脅威、障害、異常を正確に特定できます。」

電力線火災は重要な懸念事項です。全米合同消防センターによると、1992年から2020年までに米国全土で3万2000件以上の電線による山火事が発生しており、カリフォルニア州で2番目に大きな山火事は電線が木に近すぎることによって引き起こされた。公益事業会社は現在、メンテナンスを最適化し、リスクを最小限に抑えるために AI を活用する機会を評価しています。

「このソフトウェアは既存の公益事業会社からの実際のデータと画像を使用するため、非常に正確で、天候、整備不良のインフラ、気温上昇によるさまざまな脅威を特定できます」とショードリー氏は言う。「この技術により、広範囲にわたる停電や送電網に起因する災害を防ぎながら、迅速かつ効率的なメンテナンスが可能になります。」

脳コンピューターインターフェース

将来を見据えて、AAVAA の CTO である Naeem Komeilipoor 氏は、コンピューター ビジョンと新興テクノロジー デバイスにおける新たな境地を明らかにしました。 「産業現場で使用されている脳コンピューターインターフェース(BCI)技術は、特に視界が悪く、気温が極端に高い、あるいはカメラの使用が制限されている危険な環境において、特定の産業用コンピュータービジョンの使用事例に対する補完的なアプローチとして機能する可能性がある」と同氏は述べた。

危険な状況で修理を完了することも 1 つのユースケースですが、より一般的なユースケースは、建設、製油所作業、またはその他の現場作業で両手を使って機械設備を検査または操作する必要がある場合です。

「建設現場での修理作業を例に挙げてみましょう。スマートグラスに使用されているBCI技術は、外部カメラを必要とせずに目の動きを追跡する代替手段を提供するため、作業員は困難な状況でも適切に作業を継続できます」とコメイリプール氏は述べた。 「BCI はカメラに頼るのではなく、脳や眼電位 (EOG) などの生体信号を解釈して眼球運動を監視します。この技術では、特殊なセンサーで捉えた眼球運動を分析するために、高度な信号処理と機械学習アルゴリズムが必要です。」

原題:コンピュータビジョンの次のブレークスルー、著者: アイザック・サコリック

<<:  Microsoft と Meta が提携し、Bing 検索を Meta AI チャットボットに統合

>>: 

推薦する

テンセントAIが新たな記録を樹立:ACL 2020に27本の論文が選出

最近、計算言語学会(ACL)は公式ウェブサイトでACL 2020の採択論文リストを発表し、合計779...

ニューヨーク州が顔認識を「禁止」する法律を制定。なぜキャンパス内で AI が頻繁に「失敗」するのか?

アメリカは顔認識技術と全面的に戦っている。米ニューヨーク州は最近、2022年まで学校での顔認識やその...

Google Project Ellman が Gemini AI モデルのシナリオを公開

Googleチームは、AI技術を使ってユーザーの写真や検索エンジンのクエリ情報を処理し、ユーザーの生...

テンセントが独自開発したHunyuanモデルが正式にリリースされ、Tencent Cloudを通じて一般に公開されました。

国産大型モデルはパラメータ優先から実用性優先へとシフトし、長期化期に入っている。 9月7日、2023...

人工知能は企業で実用化されつつある

AI は、従来のプロセスや従来のテクノロジーにまき散らされた魔法の精霊ではなく、ビジネスのやり方を根...

Pythonで完全な異常検出アルゴリズムをゼロから実装する

確率を用いた異常検出アルゴリズム異常検出は、外れ値分析の統計タスクとして扱うことができます。 しかし...

5つのユニークで興味深いChatGPTコマンド

今日は、非常に実用的な 5 つの指示を紹介します。これらの指示は、出力コンテンツの一貫性、記事のスタ...

人工知能教師が将来果たす8つの役割

人工知能の急速な発展は目まぐるしく、教育、特に教師への影響は甚大です。人工知能は、退屈で面倒な仕事に...

ディープラーニングの基本概念のチートシート

ディープラーニングは多くの初心者にとってわかりにくいかもしれません。急速に発展するにつれて、多くの新...

...

...

[ビッグガイがやってくるエピソード4] データ駆動型の製品意思決定とインテリジェンス

データと製品を組み合わせるトピック 1 は、データと製品の組み合わせです。Stitch Fix を例...

...

ビッグデータと人工知能がオンラインゲームをどう変えるのか

2017 年に成熟したと言われる 2 つの技術的進歩があるとすれば、それは間違いなく仮想現実と人工知...

...