ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

近年、ディープラーニング技術の登場により、視覚画像処理はますます普及し、さまざまな分野で広く利用されるようになり、実践者も多数登場しています。しかし、多くの人はディープラーニングの使い方しか知らず、従来の画像処理アルゴリズムはもう役に立たないと考えています。画像処理はすでにどこにでもあり、従来の画像処理アルゴリズムは時代遅れであり、画像処理の敷居は非常に低く、誰でも使用できると誰かが言っているのを聞いたことがあります。正直に言うと、私は時々そのような発言を聞くと言葉を失います。

今日はたまたま時間があるので、このことについてお話ししたいと思います。まず、画像処理が主に何をするのかを分析しましょう。どの業界で画像処理が使用されるかに関係なく、主に認識、分類、位置決め、検出、寸法測定、視覚誘導などの機能が実装されています。

ディープラーニングが従来の画像処理技術に取って代わったとよく言われるので、今日は具体的な例をいくつか挙げてみたいと思います。ディープラーニングで何を達成できるのか、従来の画像処理技術が役立つかどうかを確認します。

まず、上記ビジョンの主な機能について簡単に説明させていただきます。識別と分類は相互に関連しています。顔認識、ナンバープレート認識、文字認識、バーコード/QRコード認識、商品カテゴリ認識、果物認識などはすべて画像認識技術です。認識後、認識結果が直接示される場合もあれば、分類が必要な場合もあります。たとえば、混載生産ライン上の製品を識別した後、それらを分類して梱包する必要があります。

位置決めにはさまざまな種類があります。ターゲットのおおよその位置を知るだけでよい場合もあれば、ロボットが自動的に把握できるように正確な位置決めが必要な場合もあります。検出には、ターゲット検出、欠陥検出などが含まれます。多くの場合、ターゲット検出では、ターゲットがシーン内に存在するかどうかを知ることだけが必要です。多くの場合、欠陥検出では、欠陥が存在するかどうかを検出するだけでなく、欠陥のサイズとカテゴリを決定する必要があります。

寸法測定の目的は非常に明確で、対象物の特定の寸法が要件を満たしているかどうかを視覚的に検出することです。視覚誘導は、ロボットの自動把持と組み合わせて使用​​され、目標位置の正確な位置決めが求められます。多くの場合、ロボットが移動したときに把持物が落下する可能性のある緩い把持を回避するために、把持の特定の位置を特定する必要もあります。

以下では、ディープラーニングを使用してどのように実装できるかを示す具体的な例をいくつか示します。同社はこれらの画像を公開したくないため、以下の写真はすべてほんの一部しか撮影しておらず、何の写真なのかはわかりません。

以下の例はすべて実際のビジネスニーズであり、画像は現場で撮影されたものです。簡単な文字認識から始めましょう。これは簡単な文字認識システムです。認識要件は、文字が正しいかどうかを毎秒20回の速度で判断することです。予算は視覚システムに2万元、生産ライン100本、合計200万元です。やるべきかやらないべきか?200万は少ない金額ではないが、1台あたり2万台しかない。こうすることで何か利益があるのでしょうか? 上位のコンピューターは文字が間違っていることを認識し、自動的に削除する必要があります。

簡単に分析すると、検出速度は1秒あたり20回であり、各製品は50ミリ秒以内に完了する必要があることがわかります。同時に、ホストコンピューターは拒否メカニズムに信号を送信する必要があります。安定した信号伝送を確保するために、20ミリ秒が予約されています。残りの30ミリ秒は、写真撮影と画像処理に使用されます。ディープラーニングのトレーニング方法を考えてみましょう。産業用コンピューターの構成方法は? PLC、除去装置、カメラ、光源、レンズ、キャビネット、その他の小型アクセサリのコストはいくらですか? 現場で手動でデバッグするにはどれくらいのコストがかかりますか? 総コストはいくらですか?

もう一つの例を挙げます。次の図は、溶接欠陥の検出を示しています。溶接欠陥には多くの種類があります。かつてある人がディープラーニングを使用して 1 週間かけてトレーニングと検出を行い、検出結果が非常に良好だと言っていました。しかし、1 か月後、彼は私に来て、費用が払えないので検出結果が非常に悪かったと言いました。その理由について考えることができますか?

もうひとつ例を挙げます。下の写真はバーコードの認識です。こんなに不明瞭なバーコードは珍しいのではないでしょうか?ディープラーニングを使って認識してみてください。

別の例として、次の図は、両側の厚さが一定であるかどうか、および表面に欠陥があるかどうかを検出します。ディープラーニングをどのように活用するか?ある人はディープラーニングを使用して半年間オンサイトでデバッグしましたが、結局顧客は満足しませんでした。

下図のように、ロボットによる自動把持を実現するためには、把持した物体の傾斜角度を検出し、ロボットの姿勢を調整する必要があります。これをディープラーニングでどのように実現できるでしょうか。

以下は、しばらく使用されていたスプリングです。スプリングのサイズを測定して、適格かどうかを判断する必要があります。ベアリング、ギア、スレッドなどの同様のパラメータもあります。ディープラーニングを使用してこれを測定するにはどうすればよいですか?

上記の例は、実際の事例のほんの一部に過ぎません。ボルトの自動締め付け、掴みムラ、ミクロン単位の精密位置決めなど、同様の検出は後を絶ちません。しかし、残念なことに、ディープラーニングの使い方しか知らない人が多くいます。画像の基本的な概念すら理解していないのに、画像処理が普及し、ディープラーニングが他の画像処理方法に取って代わったと結論付けている人もいます。もっと実際の事例に触れていれば、そんなことは言わないでしょう。

ディープラーニングを使う人は、画像を渡すだけで学習できると思って使っている人が多いです。効果が出ないと学習サンプルを追加したり、パラメータを調整したりして、効果が出るだろうと考えてしまいます。画像に対する理解が少し浅いとしか言​​いようがありません。最も一般的な画像アプリケーションは、顔認識とナンバープレート認識です。この種の認識ではディープラーニングに問題はなく、要件も高くありません。認識時間が長くなったり、認識エラーが発生したりしても、大きな問題にはなりません。顔認識で支払いができない場合は、手動で支払うことができます。ナンバープレート認識やアクセス制御システムで顔を認識できない場合は、手動でドアを開けることができます。この状況は、完全に自動化されたアプリケーション シナリオでは許可されません。

ディープラーニングは、製品の欠陥検出、分類、識別によく使用されますが、状況によって異なります。さらに、多くの場合、ディープラーニングのトレーニングだけでは不十分です。トレーニングの前に、他の画像処理アルゴリズムを使用する必要がある場合があります。

一部の人にとって、公開データセット上でディープラーニング モデルを実行し、記事を書くことは問題ありません。しかし、応用レベルに到達するにはまだ長い道のりが残っています。私の知り合いの会社では、目視検査を行うために博士号を持つ人を何人も雇っていたのですが、半年以上経っても結果が出ず、上司に叱られました。なぜかご存じですか?

ディープラーニングの応用シナリオがあることは否定できませんが、これは目視検査の一部にすぎません。ディープラーニングでは実現できない検査の側面はまだたくさんあります。さらに、現在の目視検査は多くの単純なシナリオでしか使用できません。多くの複雑なシーンは、どのようなアルゴリズムを使用しても検出できません。視覚画像処理アルゴリズムには、まだ長い道のりが残っています。

ディープラーニングを直接使用して画像をトレーニングする場合でも、多くの場合、元の画像が直接トレーニングに使用されるのではなく、フィルタリング、強調、しきい値セグメンテーション、エッジ検出、形態学的操作など、元の画像に対して何らかの処理が必要になります。場合によっては、画像に何らかの処理を施した後、画像の特徴を直接抽出してディープラーニングのトレーニングに使用します。視覚分野で働く多くの人は、この原理を理解しています。

以前にも言いましたが、論文を書きたいだけなら、一方向の徹底的な研究をすればいいのです。徹底的な理論的研究も有望ですが、個人に少し高い理論的能力が求められます。実用的な視覚アプリケーションにあまり触れたことがない場合は、画像処理が普及し、他の画像処理アルゴリズムが使用されなくなり、ディープラーニングが他の画像処理アルゴリズムに取って代わったことは言及しない方がよいでしょう。

では、従来の画像処理アルゴリズムは今でも役に立つのでしょうか? この質問に対する答えは明らかだと思います。それでもまだ理解できない場合は、これまで携わった視覚プロジェクトがいくつあるか、何がわからないか、視覚検査で何ができるのか、どのように行うのかを本当に理解しているかを、よく考えてみてください。単一の画像処理アルゴリズムの助けを借りて実現される視覚検査はほとんどありません。したがって、アプリケーション レベルでは、ビジュアル業界を容易に処理できるようにするには、さまざまな画像処理アルゴリズムの使用と、さまざまなアルゴリズムの組み合わせによるアプリケーションに習熟する必要があります。夏休みが近づいてきました。夏休みは学習に最適な時期です。この休暇と学習プラットフォームを活用して、画像処理関連のアルゴリズムの応用を素早く習得しましょう。

<<:  Fooocus: シンプルで強力な安定した拡散 WebUI

>>:  AIと透明性:AIによる意思決定プロセスの重要性

ブログ    

推薦する

...

2Dラベルのみを使用してマルチビュー3D占有モデルをトレーニングするための新しいパラダイム

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

人工知能トレーナーという職業は魅力的ですか?

人工知能については誰もが知っていますが、人工知能トレーナーについてはどのくらい知っていますか? [[...

人工知能が金融を変える5つの方法

人工知能 (AI)、機械学習 (ML)、ディープニューラルネットワーク (DNN) は、金融業界のビ...

新しいディープラーニング プログラムは、ロボット工学の課題をどのように克服できるのでしょうか?

データ サイエンティストがディープラーニングについて話すとき、通常は画像の生成、検出、分類、回帰タス...

...

AI人工知能は弱い:あなたを瞬時に複製できる仮想人間が登場

今、テクノロジー界で最もホットな話題はAI(人工知能)です。将来、世界はこれらの人工知能に支配される...

人工知能の環境コスト: 計算能力のために私たちは何を犠牲にする覚悟があるのでしょうか?

コンピューティング能力の需要が高まり続けるにつれて、さまざまな環境への影響が生じ、人工知能 (AI)...

製造業における人工知能の活用事例トップ10

世界経済の礎である製造業は、人工知能 (AI) が推進する技術革命の最前線にあります。この記事では、...

配達員はSF映画のハイテク技術を駆使し、平地を歩いているかのように100キロの重量を運ぶ。

昨日、配達員の動画がインターネット上で話題になった。動画では、ハミングバードデリバリーの配達員がテイ...

...

超便利!追加のコードを書かずに依存性注入の5つの原則をマスターする

この概念に初めて遭遇した場合、一瞬理解できないかもしれません。インターネット上のさまざまな説明により...

人工知能はクリーンエネルギーへの移行で数兆ドルの節約に貢献できる可能性がある

U+のレポートによると、風力発電所などの他のクリーンエネルギー源と組み合わせて人工知能を使用すると...

分析とAIがIoTの成長を牽引

「未来の工場には、男性と犬の2人の従業員しかいないでしょう。男性は犬に餌を与え、犬は男性を監視して機...