鉄道欠陥検出における機械学習の実用化

鉄道欠陥検出における機械学習の実用化

【51CTO.com クイック翻訳】はじめに

列車が走行しているとき、線路には大きな圧力がかかることが多く、この過程で欠陥が生じて、図 1 に示すように列車事故につながる可能性があります。

図1: 欠陥のあるレールによる列車の脱線

レールの欠陥と予防的検出は鉄道の安全において極めて重要な分野です。この記事では、鉄道の線路診断で広く使用されている超音波検出技術について説明し、分析します。

欠陥検査結果を分析する際の大きな問題は、数百キロメートルの線路にわたって欠陥データを取得するための自動検査機能が現在不足していることです。手動で欠陥を探す場合、欠陥を見逃す可能性が高く、結果は主に検査員の経験と人的要因に依存します。

問題の説明

この研究の主な目的は、鉄道線路の超音波検査マップ上の欠陥を 85% 以上の精度で自動的に検出するニューラル ネットワークの実用的なプロトタイプを作成することです。

超音波検査によるレール欠陥の分類

ニューラル ネットワークをトレーニングするには、レールの超音波検査の初期データがデジタル形式で必要であり、これは、B スキャン (BSCAN) の形式で表示される対応する欠陥マップを備えた検出器を使用して取得できます。

BSCAN の原理は、一定の角度と距離でレールにパルス超音波信号を入力し、その反射信号を記録することです (図 2 を参照)。反射信号強度グラフでは、異なる入力角度の信号によって異なる明るさの点が生成されます。異なる入力角度を使用して超音波信号を検出するのは、欠陥がさまざまな特性を持ち、反射信号の深さが欠陥の深さと形状に依存するためです。

図2: 6つのセンサーを使用したレール深さ測定ソリューションの例

欠陥を分類するには、レール欠陥分類の原則を考慮する必要があります。ロシア鉄道公社が2017年に発表した文書「非破壊レール検査の結果の解読に関する声明」によると、分類されたレールの欠陥はすべて3桁の数字でコード化されている。

データセットを作成するために、最も一般的な 8 つの欠陥が選択されました。表 1 および 2 は、選択されたレールの欠陥、欠陥コード、および BSCAN の外観を示しています。

表1: 欠陥コードとその欠陥図のリストのパート1

表2: 欠陥コードとその欠陥図のリストのパート2

現実世界の欠陥マップフレームワークでトレーニングされたニューラルネットワークの最初のバージョン

既存の欠陥マップ データベースを分析したところ、さまざまなメーカーが製造したデバイスにはさまざまな信号処理アルゴリズムがあり、送信機と受信機の数も異なるため、すべてを同時に使用することは不可能であることがわかりました。各欠陥グループには Avikon-11 検出器が使用され、2 つのステーション間のトラック上で 20 個を超える欠陥は検出されないと推定されました。これは、効果的なニューラル ネットワークを作成するためには非常に少ない欠陥数です。そのため、特定の場所にある基準欠陥レールの既存の場所にも欠陥マップのセットが採用されています。このような鉄道区間は「制御デッドゾーン」と呼ばれます。図3は鉄道線路のデッドゾーンの欠陥マップを示しています。

図3: Avikon-11検出器で表示されたレールセクションの欠陥画像

連続した欠陥マップは、個々のセグメントに「カット」することができ、その後、並べ替えて個別のファイル (フレーム) として保存できます。図 3 (ポイント 5) に示されている各カット フレームには、レール断面に沿ったすべての検査領域が同時に含まれています。測定チャネルを包括的に考慮することで、利用可能なすべての情報機能を使用して欠陥画像フレームを分類できるようになります。しかし、[500, 800]の条件点で構成されるフレームの数は非常に多く、ニューラルネットワークのトレーニングに多くの時間と計算コストがかかります。さらに、より大きなデータセットが必要になります。欠陥を含むデータセットのサイズを拡張するには、図 4 に示すように、オフセット フレーム方式を使用できます。したがって、1 つの欠陥に対して 50 フレーム以上を取得できます。このアプローチにより、データセットを 9 つのクラスにわたって 1,000 から 60,000 に増やすことができました。クラス 0 は欠陥のない線路です。

図4: 欠陥を含む拡張データセットを作成するために使用されたフレーム

このプロセスでは、出力に完全接続分類器 (CNN) を使用して明確な分類を行うための畳み込みニューラル ネットワークが合成されます。トレーニングされたニューラル ネットワークは、検証データに対して 35% の精度を示しました。利用可能な 9 つのクラスのそれぞれの精度は、純粋にランダムな分類器の精度よりも 3 倍高くなります。ニューラル ネットワークの構造とハイパーパラメータの選択により、認識精度を向上させることはできません。この段階では、十分なサイズの一般的なデータセットの不足が、ニューラル ネットワークの非効率性につながる主な要因となっています。

モデルデータでトレーニングされたニューラルネットワーク、第 2 版

モデル データでトレーニングされたニューラル ネットワークの最初のバージョンが非効率的だった理由は、使用されたアルゴリズムが貧弱だったからではなく、トレーニング用の代表的なデータ セットが不足していたためであり、これが主な要因でした。鉄道の線路をテストする場合、新しいデータが取得されるにつれてデータ セットが拡大していくプロセスは、数年かかることもあります。ここで実行されるタスクは、モデル データを使用してニューラル ネットワークをトレーニングする可能性を検討することです。

モデリングはデータセットを増やすプロセスを高速化する方法であるため、数学モデルに基づいてさまざまなカテゴリの欠陥フレームのサンプルを取得する必要があります。

モデリングタイプの選択

ニューラル ネットワークの動作とトレーニングの主な原則は、入力時に受信した可視画像を抽象化し、それを高レベルの視覚概念に変換し、同時に重要でない視覚的詳細を除外することです。ニューラル ネットワークは画像のみを記憶する必要があり、詳細は邪魔になるだけなので、レール内の超音波伝播の正確な物理モデルを作成する必要はありません。レール内の超音波伝播の物理モデルでは、結果として生じるさまざまな形態の欠陥とその位置を説明することができません。このような欠陥は手作業で作成する必要があり、その数は数万に上ります。レールに超音波を導入し、反射信号を測定するモデル、そのランダム性、多くの要因(発電機の位置など)への依存性、およびその他の問題は解決されていません。

この研究では、各タイプの何千もの欠陥を処理するニューラル ネットワークをトレーニングするためのデータ セットを生成するための、パラメトリック シミュレーション モデルを作成する方法が提案されています。

このニューラル ネットワークの実用的なプロトタイプを構築するために、超音波入力角度が α = 0 (厳密に下向き) のチャネルが選択されました。フレームの長さ(トラックの長さに沿って)は 1000 条件ポイントに増加され、これは認識精度にとって非常に重要です。

プロトタイピングとモデリングのために、数学モデルが LabVIEW 環境で開発されました。得られた数学モデルは、反射器から得られる波形だけでなく、振幅の分布も考慮します。共通パラメータ モデルの出力で取得される各フレームは、モデルの各パラメータごとにランダム ジェネレーターが存在するため、一意です。表 3 と 4 は、鉄道線路内のさまざまな異質構造の測定データとモデル化データの BSCAN の例を示しています。

表3: レールボルト穴の測定データとモデルデータのBSCAN例

表4: 測定された欠陥とモデル欠陥スキャンの30セット(表面欠陥とレールヘッド欠陥)

単一のレール障害の超音波検査から測定されたデータと、取得されたモデル データを比較すると、それらの類似点を理解することができます。モデルデータから学習するニューラルネットワークによる実際の欠陥の認識の精度指標に基づいて、得られたモデルの妥当性を確認することが提案されています。

さまざまなレールの故障モデルから、レールの超音波検査用のフレームを取得できます。同時に、モデルのパラメータは変化し、実際の状況で発生する可能性のあるさまざまな組み合わせが得られます。

  • さまざまな深さの欠陥。
  • さまざまな座標欠陥。
  • ボルト穴の形の欠陥とプロセスリフレクタのそれぞれの相対位置。
  • ボルト穴の数に応じて、ボルト接続をさまざまな方法で組み合わせることができます。
  • レールのさまざまな形態の欠陥とプロセスの不均一性。
  • 鉄道線路内のすべての不均質構造の振幅応答のランダム性。

モデルデータサンプルの例

図5は、欠陥表面欠陥とレールヘッド欠陥のモデルフレーム30セットを含むサンプルを示しています。

図5: 30の欠陥グループを持つサンプルモデルフレーム - 表面欠陥とレールヘッド欠陥

比較のために、図 6 に Avikon-11 検出器からの実際のデータを示します。

図6: 欠陥グループ30の実際のフレームのサンプル - 表面欠陥(レールヘッド欠陥)

図7は、欠陥レールネック欠陥モデルフレーム33セットのサンプルを示す。

図7: 33個の欠陥ネック欠陥モデルフレームのサンプル

比較のために、図 8 に Avikon-11 検出器からの実際のデータを示します。

図8: 欠陥レールネック欠陥実フレーム33セットのサンプル

図9は欠陥(レールネック部の欠陥)モデルフレーム55セットのサンプルを示す。図 10 は、55 セットの欠陥がある実際のフレームを示しています。

図9: 55個の欠陥レールネック欠陥モデルフレームのサンプル

図10: 55個の欠陥がある実際のフレームのサンプル - レールネックの欠陥

図11は、欠陥のない状態のモデルフレームのサンプル(ボルト穴ありとなし)を示しています。

図11: 欠陥のない状態のモデルフレームのサンプル(ボルト穴ありとなし)

表5に従って、モデルフレームの各グループにカテゴリ番号(コーディングタグ)を割り当てます。

表5 - 割り当てカテゴリ

作成された数学モデルにより、指定された 4 つのクラス (上記の表の 0、1、2、3) に対して 10,000 個のトレーニング データ、1,000 個の検証データ、および 1,000 個のテスト データのバランスの取れたセットを生成できるようになります。このようなデータセットの生成時間は 10 分です。

アイデアの妥当性

さらに、この研究では、作成されたデータセット上での畳み込みニューラル ネットワーク (CNN) モデルの合成、トレーニング、および合成 (モデル) データの検証を実行しました。実践では、トレーニング データの認識精度は 98%、テスト データの認識精度は 97% であることが示されています。

実際の欠陥フレーム(検出器によって測定)を識別する精度を確認するために、コントロールデッドゾーンからのラベル付きフレーム(Avikon-11 検出器データセットによって確認、ここでは 3000 サンプル)が、作成されたニューラル ネットワークの入力に提供されました。 Avikon-11検出器の測定データの認識精度は92%です。

得られた精度は良好な結果です。ただし、精度を向上させる方法はいくつかあります。不一致マトリックス (図 12 に表示) は、ニューラル ネットワークがどのフレームで間違いを犯したかを理解するのに役立ちます。

図12: ミスマッチマトリックス

マトリックスを分析すると、ニューラル ネットワークがクラ​​ス 3 (欠陥グループ 55) のフレームで大きな予測エラーを起こし、クラス 0 (欠陥のない状態) のフレームでは、ニューラル ネットワークがそれをボルト穴の位置として識別していることがわかります。類似性のため、グループ 55 には欠陥があります (図 13 を参照)。この場合、他のチャネルの情報シンボルを追加して、予測の精度を向上させる必要があります (この場合は通常、ボルト穴が存在するため、レール ネック制御チャネル)。これは図13を説明しています。

図13: フレームエラーを3つのカテゴリに割り当てる例

現在、ニューラル ネットワークが分類すると「決定」したフレーム上の情報シンボルを強調表示するアルゴリズムが認識システムに追加されています (図 14 の黄色の背景)。

結論と今後の開発戦略

92% の精度が達成されたことは、モデル データを使用してネットワークをトレーニングし、レールの超音波検査から実際の欠陥マップを自動的に識別するためにそれを適用できる可能性を実証し、トレーニング データが少ないという問題を解決しました。これにより、自動欠陥認識システムを生成するソフトウェアの導入プロセスが大幅に加速されます。このアイデアのさらなる発展には、次のステップが含まれます。

(1)レール頭部制御チャネル、レール首部制御チャネル、レール底部制御チャネルのモデル統合。

(2)ノイズを除去するためにモデルを調整する。

(3)生成した欠陥を実際の欠陥マップ(欠陥が導入された実際のノイズマップ)に「インプラント」(配置・導入)する。

(4)ニューラルネットワークの精度を向上させるためにモデルを改良する。

実用的なプロトタイプの提案された開発フェーズでは、次の追加が可能になります。

  • 欠陥の特定精度
  • 特定された欠陥カテゴリーの数
  • 選択した検査装置のすべての測定チャネルにわたって欠陥を自動的に検出する完全なシステムを作成します。

得られたモデルは、目的の検出器に適合させることができます。

原題: 機械学習を使用した鉄道欠陥の検出、著者: Alex Kaluzhniy

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

>>:  マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

推薦する

...

...

AI時代が到来。アンドリュー・ン氏はすべての子供に人工知能について教えるべきだと訴える

ChatGPTやGPT-4などの大型モデルの発表により、人工知能技術の進歩と応用が注目されるようにな...

複合 AI: エンタープライズ AI の成功の鍵

最近、Dynatrace は、AI への投資が増加し続けるにつれて、「複合 AI」が企業による AI...

...

Adobe は GAN をステッチされたモンスターに変え、1024 解像度の全身ポートレートを空中から作り出した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google の新しい AI ツールが人間のコールセンター従業員に取って代わる可能性があります。

[[237962]]海外メディアの報道によると、Googleは本日開催されたCloud Nextカ...

...

機械学習があなたの好きな音楽を発見する方法: パーソナライズされた音楽推奨の背後にある科学

今週の月曜日も、他の月曜日と同様に、Spotify の 1 億人を超えるユーザー全員に新しいプレイリ...

CPU、TPU、GPU、DPU、QPUについて学ぶ

AIの人気に伴い、CPU、TPU、GPU、DPU、QPUなどの略語がさまざまなメディアで飛び交ってい...

...

...

...

ディープラーニングでは音声認識の問題を解決できない

[[212222]]音声認識にディープラーニングが導入されて以来、単語の誤り率は急速に低下しました。...

人工知能時代のデザイン業界の未来

人工知能 (AI) は設計の仕事を引き継ぐのでしょうか? 将来的にはデザイナーに取って代わるのでしょ...