人工知能における画像処理人工知能には画像処理のためのさまざまなタスクがあります。この記事では、物体検出と画像セグメンテーションの違いについて説明します。 どちらのタスクでも、画像内の興味のあるアイテムの位置を見つけたいと考えています。たとえば、防犯カメラの写真のセットがあり、それぞれの写真に写っているすべての人の位置を特定したいとします。 これには通常、オブジェクト検出と画像セグメンテーションという 2 つの方法を使用できます。 物体検出 - 予測された境界ボックス物体検出について話すとき、通常は境界ボックスについて話します。これは、画像処理によって写真内の各人物の周囲の四角形が識別されることを意味します。 境界線は通常、左上隅の位置 (2 つの座標) と幅および高さ (ピクセル単位) によって定義されます。 ターゲット検出方法を理解するには? 画像内のすべての人物を識別するというタスクに戻ると、境界ボックスによるオブジェクト検出のロジックを理解できます。 私たちの頭に最初に浮かんだ解決策は、画像を細かく切り分け、各サブ画像に画像分類を適用して、その画像が人間であるかどうかを区別することでした。 単一の画像を分類することはより簡単な作業であり、物体検出の重要な側面の 1 つであるため、この段階的なアプローチを採用しました。 現在、YOLO モデル (You Only Look Once) がこの問題を解決するための素晴らしい発明です。 YOLO モデルの開発者は、バウンディング ボックス メソッド全体を一度に実行できるニューラル ネットワークを構築しました。 物体検出のための現在の最先端モデル
画像セグメンテーション - マスクの予測画像を段階的にスキャンする代わりに、絵画のフレームから離れて、画像にピクセル単位で注釈を付けるという論理的な方法もあります。 これを行うと、基本的には入力画像を変換した、より詳細なモデルが得られます。 画像セグメンテーション手法を理解するにはどうすればよいでしょうか? アイデアは非常に基本的なものです。製品のバーコードをスキャンする場合でも、アルゴリズムを適用して入力情報を変換し(さまざまなフィルターを適用することにより)、バーコードシーケンス以外のすべての情報が最終画像に表示されないようにすることができます。
これは画像上のバーコードを見つけるための基本的な方法ですが、画像セグメンテーションで行われることと似ています。 画像セグメンテーションの戻り形式はマスクと呼ばれます。これは、元の画像と同じサイズの画像ですが、各ピクセルには、オブジェクトが存在するかどうかを示すブール値のみが含まれます。 複数のカテゴリを許可すると、より複雑になります。たとえば、ビーチの景色を空気、海、砂の 3 つのカテゴリに分類できるようになります。 画像セグメンテーションに最適なモデル
比較の概要物体検出
画像セグメンテーション
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 |
>>: ディープラーニングのコードを信頼できるのはなぜでしょうか?
清華大学の胡世民教授が中国科学院の院士に選出されました! 2023年に両アカデミーから新たに選出され...
ビジネスにおける人工知能 (AI) は、今日の企業にとって急速に一般的な競争ツールになりつつあります...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
「公共交通機関では健康コードの提示が求められますが、提示できない場合はどうすればよいですか?」予防と...
AI 音声クローニングは、音声の固有の特徴を捉えて正確に複製する技術です。この技術により、既存のサウ...
IT リーダーはすでに人工知能と機械学習テクノロジーの恩恵を受けています。最近の調査によると、経済が...
調査会社IDCが2020年6月に発表した調査レポートによると、人工知能の取り組みの約28%が失敗して...
世界的なデジタル変革ブームが到来し、ビジネス環境が急速に変化する中、業界の再編と再編が加速しています...
人工知能は、強化された接続性とインテリジェントな自動化を通じて、インダストリー 4.0 に破壊的な変...
EUCAIM (EUropean Federation for CAncer IMages) プロジ...
貴州省黔南州応急管理局は、最近、貴州省黔南州都雲市でウイルス消毒作業を行うためヘリコプターを派遣した...