画像をデジタル化して特徴を抽出するための、事前トレーニング済みのディープラーニングモデル6つ

画像をデジタル化して特徴を抽出するための、事前トレーニング済みのディープラーニングモデル6つ

[51CTO.com クイック翻訳] ユビキタスセンサーは毎日大量の画像を収集しており、人工知能技術を使用して画像の特徴を自動的に抽出する需要が高まっています。ディープラーニング モデルを使用すると、衛星画像の分析、ポイント クラウド データのデジタル化、地理的特徴の抽出に至るまで、面倒なタスクを簡単に自動化できます。組織は、建物の足跡の抽出から難破船の検出まで、さまざまなアプリケーション シナリオに使用できる 6 つの事前トレーニング済みのディープラーニング モデルにアクセスできます。

1. 建物のフットプリントの抽出

建物フットプリント抽出モデルは、現在最も人気のあるモデルの 1 つです。このディープラーニング モデルは、高解像度 (10 ~ 40 cm) の画像から建物のフットプリントを抽出するために使用されます。建物のフットプリントの抽出は、都市計画や開発、保険、課税、変更検出、インフラストラクチャ計画、その他のさまざまなアプリケーションなどの業界でのマッピングおよび分析ワークフローの基盤として使用できます。

新しいディープラーニングモデルは建物の足跡を自動的に抽出できる

このモデルは米国向けに設計されましたが、世界の他の地域でも非常に優れたパフォーマンスを発揮しました。以下は、結果の一部を示すストーリー マップです。モデルは更新され、より多くのデータでトレーニングされました。このディープラーニング モデルは、元のモデルではできなかった、非常に近い建物でも非常に正確に認識できます。結果の違いは次の図に示されています。

グラフを見ると、水域、ドック、建物が通常存在しないエリアでは誤報率が大幅に低下していることがわかります。

2. 道路からの抽出

新しい道路抽出モデルを使用して、衛星画像から道路の軌跡を抽出できます。道路は、郡、市、州、または連邦政府機関がインフラストラクチャ計画、都市計画、および効率的な情報モデルの開発に必要とする主要な GIS レイヤーの 1 つです。道路のデジタル化と更新には時間がかかる場合があります。このモデルはデジタル化プロセスの大部分を自動化します。これは、マルチタスク抽出ツール arcgis.learn モデルに基づいています。これは、次の図に示すように、道路セグメント間の接続を提供できる非常に高度なモデルです。

U-Net などのセマンティック セグメンテーション モデルを使用すると、衛星画像から道路ネットワークを抽出する際に、断片化された道路セグメントが生成されることがよくあります。これは、衛星画像では、道路沿いの木々、建物、影などの障害物により道路を抽出することが困難であるためです。このモデルは、人間が特定の方向に沿って追跡することで道路に注釈を付ける作業にヒントを得たマルチタスク学習を採用しています。

このモデルは、下の写真に示すように、未舗装道路や油井現場へのアクセス道路でも使用できます。

3. 土地被覆分類

環境システム研究所 (Esri) は、2020 年 10 月に初の土地被覆モデルをリリースしました。このモデルは、米国国立土地被覆データベース (NLCD) データセットでトレーニングされ、Landsat-8 衛星画像コレクションで動作します。作成された土地被覆マップは、都市計画、資源管理、変化検出、農業、および地球表面に関する情報を必要とするその他のさまざまな用途を理解するために使用できます。

現在、Sentinel-2 画像で使用するための、より高解像度の土地被覆分類モデルがリリースされています。このモデルはヨーロッパのさまざまな国に適用できます。また、データベースの生成に使用されたのと同じ Sentinel-2 シーンを使用して、CORINE Land Cover (CLC) 2018 でもトレーニングされています。土地被覆の分類は複雑な作業であり、従来の方法では達成が困難です。下の図に示すように、ディープラーニング モデルは、これらの複雑なセマンティクスを学習し、より良い結果を提供する能力が非常に高いです。

このストーリー マップには、複数の地域におけるモデルの分類結果が表示されます。

このモデルは、2 つの異なる時間の画像に対して実行し、山火事などによって引き起こされる土地被覆の変化を確認できるため、変化の検出にも使用できます。都市化の進展は下の図に示されています。新興住宅地は赤く色付けされています。

4. 人間の居住地

高解像度の地図は、人間の居住パターンを理解する上で間違いなく価値があります。比較的低解像度の衛星画像から小さな地図を生成することにもそれ自体価値があり、地域または世界の成長パターン、人口分布、資源管理、変化の検出、その他さまざまな統計を理解するために使用できます。一例としては、ワクチン接種プログラムがあり、地図上に村々をマークして、必要とするすべての人がワクチンを利用できるようにしています。

次の画像は、Landsat 8 衛星画像に適用され、抽出された新しい人間居住モデルの結果を示しています。

このモデルを通じて、都市化が世界中の変化にどのような影響を与えるかがわかります。たとえば、次のグラフでは、2015 年から 2021 年の間にアラブ首長国連邦のシャルジャ周辺で人間の足跡がどのように増加したかがわかります。

Sentinel 画像から人間の居住地を抽出するモデル。

5. 難破船の検出

新しいモデルには、航空写真に加えて、水深データを使用して水中の難破船を検出するモデルも含まれています。これはニッチな業界ではありますが、S57 航海図を維持することは重要な要件です。標識のない航路での難破は、船舶や港に損害を与え、人命や財産の損失を引き起こす災害につながる可能性があります。

このモデルには、必要な前処理手順を提供し、処理を簡素化するジオプロセシング ツールが含まれています。

6. 画像内のナンバープレートと顔をぼかす

センサーの数が大幅に増加し、大量のデータが流入するにつれて、プライバシーなどの問題が懸念されるようになります。研究機関はこのニーズを満たすために2つのモデルをリリースしました。これらのモデルは、ストリートビュー画像内の顔やナンバープレートを匿名化したりぼかしたりするために使用されます。これらのモデルは、ArcGIS Pro のディープ ラーニングを使用したピクセルの分類ツールで使用できます。

モデルの結果の例を下図に示します。

[[387769]]

これらは、ワークフローを自動化し、効率化するために過去数か月間に開発されたモデルの一部にすぎません。

原題: 画像からデジタル化して特徴を抽出するための 6 つの事前トレーニング済み DL モデル、著者: David Cardella

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  ワンクリックで 2D GAN を「3D」化、CUHK が教師なし 3D 再構築の新しい方法を提案

>>:  膨大な顔情報が収集されている: 315 Galaが顔認識の混乱を暴露

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Open LLM リストが再び更新されました。Llama 2 よりも強力な「Duckbill Puss」が登場します。

OpenAI の GPT-3.5 や GPT-4 などのクローズドソース モデルの優位性に挑戦する...

2020 年のソフトウェア テストの 5 つのトレンド

[[285865]] [51CTO.com クイック翻訳] デジタル技術の広範な応用に伴い、ソフトウ...

Pudu Technology が「2021 年最も革新的な中国のケータリング ブランド トップ 100」に選出されました

最近、ケータリングボスインサイダーが主催する「Upward 2021・第6回中国ケータリングイノベー...

...

イメージフリーの認識がさらに一歩前進! ScalableMap: 大規模高精度地図に向けた新しいソリューション!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

AI研究 | 陸宇:人工知能はオンライン教育を改善する大きな可能性を秘めている

工業情報化部科学技術庁は、感染予防・抑制に努め、感染拡大を阻止するために、「人工知能の力を十分に発揮...

データに最適な埋め込みモデルの選択: OpenAI とオープンソースの多言語埋め込みの比較テスト

OpenAI は最近、次世代の埋め込みモデルである埋め込み v3 をリリースしました。同社では、この...

オペレーターの人工知能への道

1年間の開発を経て、人工知能の技術とアプリケーションは、特に通信業界で徐々に爆発的に増加しました。 ...

EasyDLは、臨床試験データの敵対的学習と複数のアルゴリズムの比較を簡単に処理します。

[51CTO.com からのオリジナル記事] 画像学習は高度なアルゴリズムであり、画像への高い適応...

Facebookが削除した10億の顔情報は、インターネット上の単なる「データゴミ」だ

[[433430]] Facebook が名前を Meta に変更し、Metaverse への本格的...

AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

ポッドキャスティングは、よりカジュアルな形式のオーディオストーリーテリングへと進化しています。複雑な...

人工知能の未来は必ずしも明るいとは限らない

私はいつも映画に出てくるロボットが大好きで、悪いロボットも好きです。しかし不安なのは、私たちの周りの...

...

Google Brain エンジニアの講演: TensorFlow とディープラーニング

この記事は、Google Brain エンジニアの Zhou Yuefeng 氏が QCon Sha...