3Dの名の下、「インテリジェント製造」の包囲はAIビジョンユニコーンの新たな戦場です

3Dの名の下、「インテリジェント製造」の包囲はAIビジョンユニコーンの新たな戦場です

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

2022年、政府の「両会」ではスマート製造がホットワードとなった。

一方では、国家発展改革委員会、工業部、科学技術部など8つの部門が「インテリジェント製造業発展第14次5カ年計画」の公布に関する通知を出し、国家トップレベルの設計を提案した。他方では、北京、上海、広州、深センなどの一級都市などの地方政府が対応する政策の詳細を発表し、インテリジェント製造業の推進に制度的保障を与えた。

インテリジェント製造を実現し、産業の高度化を推進する過程において、マシンビジョンは欠かせない技術として、機械が「はっきりと見て、注意深く見て、しっかりと把握して、素早く伝える」ことを可能にする架け橋の役割を果たしています。

つまり、機械が人間の労働に取って代わるようにしたい場合、まず機械に「目」を装備して「見る」ことができ、それから人間のように働けるようにする必要があります。これがマシンビジョンです。

人工知能の一分野として、マシンビジョンには、高精度、危険な作業環境への適用性、高い認識効率、中断のない操作など、人間にはない利点があります。実際、マシンビジョンは新しいものではなく、外観検査や識別、貨物の仕分けなどの産業プロセスで広く使用されてきました。

現在のマシンビジョンは、依然として主に2Dに基づいており、つまり、カメラで物体の平面の写真を撮り、画像分析や比較によって物体を識別します。その制限は、物体の平面の特徴しか観察できず、画像精度が照明条件の影響を受けやすいことです。そのため、技術要件が低い一部の低中級製造業に適しています。

バイオテクノロジー、精密半導体など、極めて高い測定精度が求められる一部のハイエンド製造分野では、従来の 2D ソリューションではニーズを満たすことができなくなっています。3D ビジョンが徐々に登場し、市場の新たな人気を集めています。

2D から 3D へ: 複数の次元の違い

3D ビジョンは、3D カメラを通じて物体の 3 次元座標情報を収集し、アルゴリズムを通じて 3 次元ステレオ画像を実現します。

2D ビジョン システムと比較すると、3D ビジョンの利点は、情報データ (主に空間座標) の追加次元により、体積、形状、距離などの情報を測定するニーズを満たすことができることです。さらに、3D ビジョンは照明条件の影響を受けにくく、画像精度は 2D ビジョンよりもはるかに高く、同時に、情報を迅速に処理する能力は 2D ビジョン システムとは比べものになりません。

簡単な例を挙げると、曲面や曲率を持つ物体を測定する場合、2D ビジョンでは 2 次元画像しか生成できず、物体の実際の状況をほとんど反映できません。一方、3D ビジョンでは 3 次元画像が生成され、物体の表面、曲率、深さなどの実際の情報を提示できるため、機械や人にとっての参照価値が高くなります。

製造業のインテリジェント化が進むにつれ、3D ビジョンに対する市場の需要も高まっています。米国の市場調査会社 Grand View Research のレポートによると、世界の 3D マシンビジョン市場は 2027 年までに 34 億 6,000 万米ドルに達すると予想されています。予測期間中、市場の年間複合成長率は 14.7% になると予想されており、潜在的なブルーオーシャン市場となっています。

Juejinzhi は、インテリジェント製造における 3D ビジョンの現在の応用が、単一のシーンから、位置決め、誘導、生産、仕分け、組み立てなどの複数のリンクを含む生産ライン全体の強化へと発展していることを知りました。

スマートフォンの製造プロセスを例に挙げてみましょう。2D ビジョンの時代において、最も広く使用されているアプリケーション シナリオは品質検査、つまりサイズと欠陥の検査であり、これにはマザーボード、コンポーネント、パッケージという 3 つの主要部分が関係します。 3Dビジョンはこれらのプロセスを直接カバーし、検出精度と速度に優れています。また、積載、生産、テスト、梱包などのシナリオに応用を拡大し、元の生産ラインのインテリジェントな変換を実現します。積み込みと積み下ろし、仕分け、輸送リンクでは、異なる製品タイプに応じて、リアルタイムで作業タスクを計画して完了する必要があります。

これは実際に、メーカーの柔軟な生産に便利です。 C2Mビジネスモデルの推進により、企業はリアルタイムのユーザー注文に基づいて生産規模を決定する必要があります。以前の機械化生産は、柔軟性が非常に弱いバッチ生産でした。3Dビジョンにより、産業用ロボットと自動化設備の知能レベルが向上し、実際の生産ニーズに応じてさまざまな製品を柔軟に生産できるようになりました。

例えば、冬季オリンピックの時に大人気だったビン・ドゥエン・ドゥエンは、今では入手困難になっています。メーカーは、生産戦略をリアルタイムで調整し、生産材料、生産量、品質検査の配置を柔軟に設定し、「氷点下」を増やし、「雪点下」を減らす必要があります。生産プロセス全体で3Dビジョンを使用することで、人件費を削減し、生産効率を向上させることができます。

したがって、3D ビジョンと 2D ビジョンの違いは、単なる 1 次元の情報の違いではなく、情報という新たな次元がもたらす生産モデル、効率、ビジネス モデルの変化が核心的な意味を持つことになります。

ただし、上記の例はすべて理想的な条件下での仮定です。現実には、3D ビジョンには多くの利点があるものの、広く使用されるようになるまでには解決すべき問題がまだ多く残っています。

3Dビジョンの難しさ:シーンとコスト

民生用電子機器とは異なり、インテリジェント製造分野における 3D ビジョンの応用は、シーンの断片化により複雑になります。

Entropy Intelligence Technology の創設者である Zhao Qing 氏は、Leifeng.com とのインタビューで、3D ビジョン技術の応用には 2 つの大きな困難があると述べました。

  • 3D ビジョン技術は、アプリケーション シナリオに対する高い適応性を備えている必要があります。
  • 3Dビジョン技術とモーションプランニング技術の連携。

まず、製造業の生産シナリオは非常に複雑で、実験室での 3D ビジョンの効果が実際のシナリオに反映されない可能性があります。このため、3D ビジョンはアプリケーション シナリオに高い適応性を持つ必要があります。たとえば、反射、暗闇、コーティング、遠距離などの条件下でも物体を正確に認識および識別できるかどうかなどです。

第二に、物体の三次元情報を認識した後、3D ビジョンを動作計画技術に接続してタスクを完了する必要があります。これには、衝突回避検出、手と目の座標変換、リズムの最適化、力の制御などの技術が含まれます。

しかし、機械が人間のように脳から指示を送るだけで動作を完了することは難しく、入力された情報を解釈し、さまざまな部分に指示を送信してコマンドを実行する必要があります。リンクのいずれかが間違っていると、ミッションは失敗します。

最後に、標準化によってテクノロジー自体をさまざまなシナリオに適応させることは困難です。同じシナリオであっても、テクノロジーに対する要件は異なります。たとえば、製品の欠陥検出に関しては、メーカーごとに基準が異なり、欠陥の定義も異なるため、標準化された欠陥検出プロセスを策定することが困難です。

シナリオベースの困難さに加えて、3D ビジョンが依存するセンサー (主にカメラ) は、コストを削減し、費用対効果を向上させながら、周囲光の干渉に対する強い耐性、高い測距精度、および高解像度を実現することができません。

したがって、現在の 3D ビジョンのアプリケーションでは、主に使用シナリオと予算に基づいてカメラを選択し、カメラの撮影結果に基づいてカスタマイズされたアルゴリズムを開発します。この高コストで長期にわたる開発モデルは、実際のシナリオにおける 3D ビジョンの適用を著しく制限します。

国産3Dビジョン技術への道:困難だらけ

中国マシンビジョン産業連盟の統計によると、国内のマシンビジョン業界は中小企業が主流で、売上高1億元以下の企業が83.5%を占めているのに対し、キーエンスの売上高は長い間100億元を超えている(2020年は321.61億元)。比較すると、売上高が1億元を超える国内企業はオプト(2020年は6.42億元、キーエンスのわずか2%)のみである。

2Dビジョンが主流だったマシンビジョンの分野では、キーエンスとコグネックスが世界市場を独占しており、3Dビジョン技術の登場は現状を変える技術的な推進力とみられていると言えます。

新しい技術である 3D ビジョンが直面するシナリオベースの困難は、すべての企業が解決しなければならない問題です。現在、キーエンスやコグネックスなどの外資系企業であれ、ハイクビジョンなどの国内セキュリティ大手であれ、多くのAIビジョン企業やマシンビジョン企業であれ、3Dビジョン技術分野では同じスタートラインに立っています。

しかし、外国の大手企業と比較すると、国内企業には3つの本質的な欠点があります。

  • シーンの理解。

Keyence と Cognex はどちらも数十年の歴史があり、マシン ビジョン市場の大部分を占めています。長年の蓄積により、3D ビジョンの応用を探求する上で優位に立っています。過去の経験に基づいて多くのシーンの難しさを探求できるため、不必要な費用を削減できます。

国内企業は設立されてからまだ日が浅く、シナリオを理解するには段階的な探究が必要であり、多くの回り道をする必要もあるため、時間と費用の面で大きなコストがかかります。

  • ハードウェア機能の不足。

マシンビジョンの主なロジックは、収集された画像情報を分析および処理することであり、インテリジェントデバイスは処理された情報に基づいて対応する判断を行います。このプロセスでは、レンズとレンズの品質が画像情報の正確さを得る上で重要な役割を果たします。

国内企業のほとんどは、アプリケーション層に重点を置き、対応するハードウェア機能が欠けているソフトウェア アルゴリズムで市場に参入しています。中国の3Dビジョン用コアカメラのほとんどは、IDS、コグネックス、キーエンス、キヤノンなど海外から購入されています。レンズに関しては、ハイエンド市場は依然としてライカ、シュナイダー、ニコン、富士などの海外ブランドによって独占されています。

  • 安定した顧客基盤。

顧客にとって、パートナーを任意に変更すると、試行錯誤のコストが簡単に増加する可能性があります。新しいテクノロジーに関しても、顧客は既に協力関係にあるテクノロジーサプライヤーを選択する傾向があります。明らかに、外国の巨大企業は絶対的な優位性を持っており、国内企業が発展したいのであれば、一歩一歩「アップグレードしてモンスターと戦い」、技術と製品でユーザーの信頼を獲得し、徐々に独自の顧客基盤を構築するしかありません。

これは、深い現実を反映しています。つまり、新しいテクノロジーに対してはすべての企業が平等である一方で、既存の企業は依然として、独自のビジネス エコシステムに基づいて、新しい (小規模) 企業に対して次元削減攻撃を仕掛けることができるのです。

したがって、国内企業が海外の大手企業に追いつきたいのであれば、技術革新に加えて、安定したエコシステムを確立する必要があり、それは長く困難なプロセスです。

結論

現在、民生用電子機器における 3D ビジョンの広範な応用は、マシン ビジョン企業に大きな刺激を与えています。スマート製造が次のブルーオーシャン市場となる中、3D ビジョンで企業の生産を強化する方法を模索し始めている企業がますます増えています。

しかし、家電製品とは異なり、スマート製造業では驚異的な応用が困難です。市場全体の需要が細分化されているため、前者の開発モデルを再現することは不可能です。企業は実際のシナリオで最適な実装ソリューションを見つけなければなりません。

国内企業にとって、固有の欠陥は克服できない障害ではありません。シナリオを理解し、技術を深く掘り下げ、一歩一歩しっかりとした基盤を築き、追いつくために、外資系大手企業よりも多くの時間とエネルギーを費やす必要があります。これには、ビジョン企業の努力だけでなく、光学や製造などの複数の業界の共同の進歩も必要です。

<<:  清華大学の博士研究員が、AlphaCode の背後にある技術的原理を 10 分かけて説明しました。プログラマーはそう簡単に置き換えられるものではないことがわかりました。

>>:  ビッグデータがなくてもディープラーニングは可能でしょうか?中小企業のトレーニングのための新しいソリューション、大規模モデル

ブログ    

推薦する

調査レポート:世界のテクノロジー支出は2024年に5.3%増加して4.7兆ドルに達する

調査によると、2024年の世界のテクノロジー市場では期待できる出来事がたくさんあることが分かっていま...

ホワイトハウスのAIに関する大統領令がサイバーセキュリティリーダーに何を意味するか

AIは引き続きテクノロジーの注目を集めており、2023年の最後の四半期を迎えるにあたり、AIの力を活...

オリンピックのコーチたちが、人工知能によって職を奪われる危険に直面する番なのだろうか?

中国の飛び込みドリームチームは、「消える水しぶき」の技術に長けており、オリンピックのあらゆる大会で金...

...

...

Microsoft の Zhu Chenguang: 事前トレーニング済みモデルの次のステップは何ですか? PLMの「不可能の三角形」を突破する

近年、大規模な事前トレーニング済み言語モデル (PLM) により、さまざまな NLP タスクのパフォ...

人工知能を背景とした公共読書空間の探究と創造

5Gネットワ​​ークの発展と人工知能アプリケーションの人気の高まりにより、スマート無人書店の出現は、...

人工知能はプログラムを記述するためにコードを「盗む」ほど賢いが、プログラマーは職を失うことを心配する必要はない

人工知能システムはますます賢くなってきています。囲碁をしたり株を取引したりできるだけでなく、今ではコ...

自動化とロボットの違いと適用可能なシナリオ

[[421134]]ロボット工学と自動化には違いがありますか? 自動化が適用されるかどうかわからない...

国産大型モデルの推論能力がGPT-3.5を超えた! OpenAI評価リストの第1層に入る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ロビン・リー、馬化騰、ジャック・マーがAIについて語る: 世界は劇的に変化しています。心配するのではなく、責任を取るべきです。

[[333020]]ロビン・リー:業界の人々はAIに大きな可能性があることを知っており、悲観的な時...

...

「小さいけれど優秀」な大規模言語モデル Zephyr 7B の詳細な説明

Zephyr は、Hugging Face がリリースした一連の大規模言語モデルであり、蒸留教師あり...