1. 通信ネットワーク運用シナリオまず、通信ネットワーク運用の背景についてご紹介します。
1. 通信ネットワーク運用シナリオの概要通信ネットワーク運用は主にネットワークの障害や問題を扱い、それらは作業指示書に記録されますが、作業指示書には多くの専門用語が含まれており、データ量が多く、構造が多様で、標準化されていないという特徴があります。この種のデータは非常に価値があり、より優れた分析と応用を通じて反映される必要があります。これまで、作業指示書におけるリアルタイムのネットワーク問題の処理には専門家の経験に頼っていました。このアプローチには、次のような問題がありました。
上記の課題に対し、AI研究開発センターでは、ナレッジグラフに基づいて通信ネットワークの運用を支援し、運用・保守の効率化を図る方法を模索したいと考えています。ナレッジグラフは強力な関係表現機能を備えており、グラフベースでさまざまな関連性分析を処理できます。ある程度、人間のような知識推論を実行でき、従来のストレージ方法と比較して、クエリ時の結果フィードバック速度が速くなります。 さらに、グラフ データベースは、より直感的で柔軟な方法でデータを提示し、高性能な深い関係のクエリ、分析、および推論機能を備えています。ネットワーク分野では、ネットワークセキュリティ、ネットワーク最適化、障害診断、インテリジェントな質疑応答などのインテリジェントアプリケーションの完成をサポートします。 2. ネットワーク運用知識の源このセクションでは、ネットワーク運用ナレッジのデータ特性をいくつか紹介します。表には、業務から取得できるデータを示します。例えば、作業指示書の場合、ネットワーク障害が発生したと判断された後、対応するアラームが発行され、ネットワーク運用保守作業指示書が発行されます。その後、運用保守作業員は運用保守作業指示書に基づいて問題を追跡して処理します。障害解決プロセスは、元の障害問題作業指示書に記録されます。そこに含まれるデータのほとんどは実際には半構造化データであり、差別化されていないフィードバックは主に大量の非構造化テキストです。作業指示データの利点は、データ量が多く、ソースが安定していることです。欠点は、作業者が問題の分析と処理中に問題を解決しようと急いでいるため、記録とフィードバックの内容を簡略化してしまい、情報が欠落してしまう可能性があることです。 また、一部事例データもございます。この部分のデータは、専門家や運用保守担当者が多数のネットワーク障害の問題に対処する過程で蓄積した経験であり、後で同様の問題に遭遇したときに解決できるようにケースドキュメントに書き込まれます。事例データは、障害の発見、分析、処理の全プロセスを網羅して包括的に記録されていますが、事例データの量は比較的少なく、専門家ごとに文書の書き方が異なるため、事例データのスタイルが多様で、ソースが不安定になっています。 3 番目のタイプはビジネス ルール データです。これは主に、ネットワーク障害の問題を実際に処理するときに運用および保守担当者が記述して使用するビジネス ルール ロジックで構成されます。これらのビジネスロジックルールは、実際の使用において非常に有効であり、非常に重要な知識情報ですが、形式が多様でソースが異なるなどの問題もあります。実際の使用では、複数の異なるシステムから派生している場合があり、意味を正確に理解するには専門家の解釈が必要です。 最後のタイプは専門家の経験であり、これは専門家の心に蓄積された高度に専門的で貴重な実践的な取り扱い経験です。この部分を体系的に理解するには、専門家とコミュニケーションを取り、例から学ぶことが必要です。主に専門家の執筆成果に依存しているため、適時性は比較的低くなります。 3. ナレッジグラフに基づくインテリジェントネットワーク運用技術ソリューション上記にまとめた各種データの特性を踏まえ、事例データ、作業指示データ、運用保守マニュアルなどの多次元異種データから知識を抽出し、ネットワーク運用構造化知識ベースを構築します。構築した知識ベースに基づいて、検索プラットフォームと推論プラットフォームを作成し、ビジネスシナリオにおけるネットワーク障害知識の検索や対処策のインテリジェントな意思決定などのアプリケーションを実現します。現場の運用・保守担当者向けに、データと知識に基づいたインテリジェントな運用・保守システムを構築します。この図はシステムの基本的な技術アーキテクチャを示しています。 2. ネットワーク操作イベントのナレッジグラフの構築第 2 部では、主にネットワーク操作イベント知識グラフの構築プロセスを紹介します。
1. ネットワーク操作イベント知識グラフ構築プロセスナレッジグラフを構築するプロセスは誰もがよく知っています。最初のステップは、オントロジーを構築することです。この部分ではビジネスに対する深い理解が必要となるため、主に専門家の協力に依存します。知識抽出の部分では、業界で比較的効果の高いUIEモデルを利用してエンティティ抽出と属性抽出を行いますが、関係マッピング方法はオントロジー構築の過程で固定されているため、関係抽出はあまり必要ありません。主に原因、障害、解決策などのコンテンツとそれらの固定された関係に関心があります。知識融合部分では、専門用語の曖昧さ解消に基づいて、主にエンティティレベルの曖昧さ解消が実現されます。上記のプロセスで取得された構造化データは、主に Neo4j グラフ データベースに保存されます。以上がネットワーク操作イベントナレッジグラフの全体的な構築プロセスであり、次のセクションで詳細に紹介します。 2. ネットワーク操作イベント知識グラフオントロジー構築左の図は、作業指示データのオントロジーの構築を定義しています。作業指示書には、作業指示書番号、業務区分、大分類と小分類、業務カテゴリなどの情報を含む、実際に発生したネットワーク操作イベントが記録されます。また、障害の原因、障害処理方法、処理結果などの抽出に重点を置いています。処理プロセス中に発生するインタラクションも記録されます。インタラクションプロセス中に、処理された処理イベントをリンクするための一連の処理アクションが抽出されます。 例えば、まず指標の原因を分析し、次に設備の状況と業務指標を確認し、一連の内容を確認した後、関連する操作を実行します。問題が時間がかかり、自然災害などの不可抗力や設備の交換の必要性により長時間待機する必要がある場合、運用保守担当者は制限時間を超えないように作業を一時停止するように申請できます。これは、比較的重要なネットワーク運用イベントです。また、アラーム情報には、アラーム名、デバイス番号、ネットワーク番号、ネットワーク関連アドレス、コンピュータルーム、カテゴリなど、障害の詳細が記録されるため、これも重要です。 この事例のオントロジー構築では、主に経験要約データが使用されます。データには、関連する機器、関連する作業指示、およびそれが属するネットワーク層などの基本情報が含まれています。障害発生、障害原因、障害処理方法、および処理効果に関する情報の抽出に重点を置いています。処理プロセスが非常に詳細に記録され、分析プロセスがより明確になるため、作業指示データよりも応用価値が高くなります。 3. ネットワーク操作イベント知識グラフからの知識抽出このセクションでは、知識抽出を実行する手順を紹介します。まず、注釈ツールを使用して、作業指示データのエンティティ情報を注釈します。UIE モデルを主に使用しているため、必要な注釈データの量は多くありません。以前の BERT モデルの使用のように、大量の注釈データは必要ありません。約 1,000 件の作業指示データを注釈することで、要件を満たすことができます。注釈は主に、障害の原因、解決策、ネットワーク アラーム機器、アドレス、時間などの情報に焦点を当てています。 データのラベル付け後、2 番目のステップでは、UIE の強力な統合抽出モデル ベースに基づいて抽出モデルをトレーニングし、トレーニングされた抽出モデルを使用して結果を抽出し、抽出結果を検証します。最後に、さまざまなプロンプト戦略が設定され、UIE を使用してイベントが抽出されます。イベントは主に、障害の分析と解決、機器の廃棄状況などです。 上記は知識抽出の主な手順です。イベント抽出タスクについては以下で詳しく説明します。 イベント抽出タスクは、主にテキスト内のイベントの存在を検出し、イベントの構造と内容を構造化された形式で出力することです。たとえば、作業指示書内の完全なアラーム処理プロセスは、発生、処理プロセス、ハングアップの有無というイベントとして理解されます。発生する主なイベントとしては、インジケータ異常、機器故障、ネットワーク要素リンク異常などが挙げられます。異なるイベントでは、対応するパラメータの役割も異なります。たとえば、インジケータが異常な場合は、インジケータのアラーム値や期限値などの情報が表示されます。ネットワーク要素リンクが異常な場合は、アラームの場所、アラーム単位、異常現象情報に重点が置かれます。 処理中は、追加のワークステーション、返品注文の確認、アラーム回復の確認、機器のメンテナンス、その他の関連機器インジケーターの検査と問題分析が行われます。
最後に、ハング イベントに関して言えば、ハングは主に、解決に長い時間を要する困難なネットワーク障害によって発生します。停止イベントでは、停止の理由と停止期間を記入し、障害イベントを追跡して迅速な解決を図る必要があります。次に、観察フェーズがあります。これは主に、障害が解決され、アラームが回復した後、一定期間観察することです。一定期間内に同じ問題が再発しない場合は、問題が解決されたことを意味します。観察の後にはデバッグのステップがあります。問題が解決された後、関連するいくつかの回路がデバッグされ、関連するサービスが復元されたことが検証および確認されます。 4. ネットワーク操作イベントのナレッジグラフ構築結果イベント ナレッジ グラフの全体的な構築は、主に元の作業指示書、ケース、その他の非構造化データと半構造化データをエンティティ リレーションシップ構造化データに整理し、情報の利用をより効率的かつ便利にすることです。第二に、構造化された運用および保守ナレッジ ベースでは、アラーム、作業指示、ケース、その他の情報を関連付けることができます。同じネットワーク障害について話している限り、関連するすべての知識を取得でき、関連する問題に対処する方法についてより包括的な理解が得られ、より正確な問題解決の提案を行うことができます。 データベースストレージには、データ量の点ではインターネット大手のナレッジグラフほど大きくない Neo4j グラフデータベースを選択しました。これは主に通信ネットワーク運用分野のナレッジベースです。構築された倫理知識ベースは、主に作業指示事例の専門知識Q&Aや専門用語の知識検索など、運用保守知識の検索と管理に使用されます。知識抽出の応用では、主にグラフエンティティ関係の抽出や関係リストの管理などの操作を実行します。 3. ネットワーク運用ナレッジグラフの応用次に、構築したイベントナレッジグラフを、主に以下のアプリケーションを含むネットワーク運用シナリオに適用する方法を紹介します。
1. 志星クラウドネットワークブレイン知識ベースプラットフォーム作業指示書とケースデータに基づいて構築されたナレッジグラフに基づいて、作業指示書とケースの効率的なグラフベースのインテリジェント検索を可能にするZhixing Cloud Network Brainナレッジベースプラットフォームを構築しました。また、操作と保守の知識、知識の関連付け、ケースの重複チェック、補助ケースの作成と修正の効率的で高速な検索もサポートします。右側はグループ内で立ち上げられた「Zhixing Cloud Network Brain Knowledge Base Platform」です。システム図を見ると、主な機能として作業指示、ケース、専門用語による文章作成、質疑応答などが含まれていることがわかります。以下の構造図には、システム内の機能モジュールも詳細にリストされています。 2. 智星クラウドネットワークブレインインテリジェントアシスタントアプリケーションの 2 番目の部分は、Zhixing Cloud Network Brain 上にインテリジェントな運用および保守アシスタントを構築することです。 2022年には、業務プロセスにデジタルワークステーションが設置されました。このデジタルワークステーションには、フロントエンドロボット画像の表示は含まれていません。ユーザーとのやり取り中に発生する問題に対して、対応する回答とガイダンスの推奨事項を提供できます。その後、運用保守知識ベースに基づいて、自然言語処理関連技術を使用して作業指示ケースを推奨し、豊富な運用保守知識を備えたインテリジェントアシスタントを作成して、グループや企業が運用保守プロセスにおける複雑なタスクを解決するのに役立ちます。実際のアプリケーションでは、インテリジェントな運用保守アシスタントは、元の回線ネットワーク システムの内容に影響を与えず、比較的軽量で使いやすいツールです。 さらに、専門家は、Zhixing Cloud Network ナレッジ ベースを使用して、過去のネットワーク運用および保守中に発生した障害の数、障害の原因の種類の数、障害の種類ごとの対応する解決策、実際の処理プロセスにおける問題の解決策、および最終的な処理結果を照会することもできます。クエリ機能に加えて、専門家が知識を蓄積し、関連するケースの作成を支援することで、作業効率が大幅に向上します。知識+AIインテリジェントインタラクティブ運用保守アシスタントを構築することで、ネットワーク運用保守における障害問題処理の自動化率が向上しました。 3. ネットワーク運用・保守作業指示書処理の動的推奨3 番目の部分は、ネットワークの運用および保守作業指示書の処理プロセス中に動的な推奨事項に適用されます。処理プロセスは主に作業指示書の回覧を伴います。図の障害作業指示書では、障害の説明、障害のカテゴリ、その他の障害エンティティが自動的に抽出され、障害を正確に特定します。障害ナレッジグラフを検索して、ナレッジベース内の類似の障害または類似の障害原因を取得し、この履歴情報に基づいて適切なソリューションを推奨します。このプロセスでは、作業指示情報が読み込まれるにつれて、障害箇所の精度が高まり、新しい関連情報が更新されて検索判断条件に追加され、推奨結果が再生成されます。推奨結果を動的に更新することで、最前線の担当者に権限を与え、運用保守担当者に関連業務の実行を正確に指示することができます。 図は上記のプロセスの論理構造を示しています。一番上には読み取られている作業指示書があり、作業指示書番号、障害カテゴリ、アラームの説明、障害の説明などの情報が含まれています。この情報から、履歴グラフ データベースを検索し、問題が単一のボード ステータス障害によって発生している可能性が 70.5% あることがわかります。この問題の解決策には、リセット修復とデバイスの交換があります。たとえば、最初にリセット修復を試みます。リセット修復が成功しない場合は、デバイスが老朽化しているか損傷していることを意味します。この場合、関連する機器を交換して修理することができます。また、今回の障害はアップグレード作業中のデバッグが原因である可能性が 15.5% あります。この場合、通常の業務操作中に表示されるアラーム情報はブロックできるため、関連する処理は必要ありません。上記のプロセスに基づいて、障害処理中に正確なガイダンスが実現されます。 IV. 展望最後はChatGPTの影響によってもたらされた前向きな考え方です。まず、ナレッジグラフ構築プロセスにおける知識生成リンクは、ChatGPT の支援によりさらに簡素化できます。たとえば、専門的な非構造化データを ChatGPT に渡すと、サンプルがゼロの場合やデータ注釈が 100 個以内の場合に専門的な抽出結果が得られ、ドメイン知識の統合も自動的に完了します。 2 つ目のポイントは、蓄積された知識グラフを、垂直分野における知識補足として ChatGPT モデルに追加することです。運用と保守の対話プロセス中に、インテリジェントアシスタントのレベルをより高いレベルに向上させることができます。また、使用中にビジネス担当者からのフィードバックに基づいてモデルを反復的に更新できるため、知識の自動反復とアップグレードのクローズドループが実現します。 3 点目は、ネットワーク運用・保守のインテリジェント化を支援するプロセスにおいて ChatGPT が実現するインテリジェントかつ自動化された処理により、運用・保守の作業負荷がさらに軽減され、運用・保守担当者は設計系の作業やシステム自体の検討作業など、作業の 20% のみに集中できるようになることです。 上記は、既存の歴史的研究に基づいたいくつかの考えであり、いくつかの関連するアイデアを提供します。より多くの想像力を働かせて、これらの方向に努力していただければ幸いです。当社は、通信分野におけるモデル連携にさらに興味を持っており、ネットワーク運用プロセスにモデルを適用することで、業務プロセスの効率化と認識精度の向上、運用保守担当者の作業負荷の軽減を実現したいと考えています。 5. 質疑応答Q1: 大きなモデルを作成した後でも、知識グラフを通じて Zhixing Cloud Network の脳インテリジェント アシスタントを構築することは適切でしょうか? KBQA や FAQ の質問応答方式は、大規模モデルのコンテキストでは次元削減の影響を受ける可能性があるためです。A1: この部分は実践を通じて探求する必要があります。ビッグモデルが KBQA を完全に置き換えることができるかどうかはわかりません。しかし、ネットワークの運用と保守のシナリオでは、ネットワークを保守する際に、知識の正確さと良好な相互作用効果が比較的重要です。そのため、初期段階では、より直感的に説明できるナレッジグラフの形式に依拠します。この形式は、実際のアプリケーションでより多くの利点があります。 また、ビッグモデルの分野でも関連プラクティスを積極的に実施し、主にビッグモデルを使用して視覚的なナレッジグラフを迅速に構築し、運用と保守の問題の解決を支援するナレッジサポートを提供します。また、ビッグモデルの問題については、最前線のビジネス担当者とも話し合いました。ビジネス担当者は、ビッグモデルはナレッジグラフのような推奨ソリューションを合理的に説明できず、推奨される結論の強力な根拠を提供するには不十分だと感じています。これは信頼の問題につながるため、ビッグモデルの実際の適用にはさらなる検討が必要です。 Q2: 通信ネットワーク運用イベント知識グラフのオントロジーはどのように構築されますか?A2: オントロジーの構築は主にビジネスの理解に基づいています。弊社のデータソースは、作業指示書というフォームに相当します。フォームには、業務に関連する設備、発生した障害、障害発生時刻などの一連の情報が記録されており、そこから一連の構造を要約して本体のコンテンツを形成します。 この構造には、より詳細なビジネスコンテンツが含まれます。たとえば、作業指示番号は、関連する知識を関連付けるための一意の識別子として使用されます。作業指示番号は、障害、アラーム情報、障害の原因、および問題の解決策に関連付けることができます。さらに、作業指示番号を問題を処理する担当者に関連付けて、その処理方法とフィードバックを記録することもできます。また、ビジネス自体の評価システムも用意されており、さまざまなカテゴリとサブカテゴリ、および他のビジネス側面の分析が含まれます。 |
<<: Colab で Meta の MusicGen を使用して音楽を生成する方法
2019年6月28日、北京で2019年北京人工知能産業サミットフォーラムが開催されました。主催は工業...
私たちは、日常の習慣から抜け出し、長い間待ち望まれていた自分自身を変えるために、ちょっとしたモチベー...
F# の並列ソート アルゴリズムで最も一般的な方法の 1 つは、まず処理するデータを複数の部分に分割...
人工知能への熱狂が世界を席巻している。国は人工知能の分野で戦略的な配置を開始しており、人工知能の人材...
勉強計画(いつも顔を叩かれるような気分です)煙台での仕事を辞めて北京に来ました。アルゴリズムが苦手だ...
近年、事前学習済みの拡散モデル[1, 2, 3]の開発により、テキストから3Dコンテンツへの自動作成...
リアルタイムAI映像解析技術とは?リアルタイム AI ビデオ分析は、ビデオ ストリームを分析して、特...
現在、人々の生活や仕事のペースはますます加速し、インターネット電子商取引プラットフォームは急速に発展...
[51CTO.comからの原文] インテリジェント運用保守(AIops)は、IT運用保守の分野で最...
生成型人工知能 (GenAI) が驚異的なスピードで進歩するにつれ、その真の価値を活用したい企業にと...
生成型検索エンジンは、入力クエリとオンライン引用に対する応答を直接生成することで、ユーザーの情報ニー...