3 つの AIOps プラクティス: 可視化、自動化からインテリジェンスまで

3 つの AIOps プラクティス: 可視化、自動化からインテリジェンスまで

2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開催されました。このサミットは、人工知能、ビッグデータ、モノのインターネット、ブロックチェーンなど12の核心的なホットトピックに焦点を当て、国内外から60人の第一線の専門家を集めています。これはハイエンドの技術の饗宴であり、トップクラスのIT技術者が学び、ネットワークを拡大するための見逃せないプラットフォームです。

「コンテナにおける AIOps」セッションでは、Xinju Networks のディレクター兼副ゼネラルマネージャーである Cheng Yongxin 氏が、「AIOps 実践の 3 つの軸: 可視化、自動化からインテリジェンスへ」と題した素晴らしい講演を行いました。程永馨氏は、20年近く運用保守管理に携わり、IT技術アーキテクチャ、運用保守管理モデル、ツールの変遷を目の当たりにしてきました。今回の講演では、エンタープライズレベルのAIOpsの進化の軌跡を詳しく説明し、実際のシナリオから突破口を開き、AIOpsの実装を中心に展開しました。

AIOps プラットフォームの製品化における困難を克服する方法

モビリティ、ビッグデータ、クラウドコンピューティング、人工知能などの新しいテクノロジーの推進により、IT テクノロジー アーキテクチャは、従来の「IOE アーキテクチャ」から「インターネット アーキテクチャ」へと静かに変化してきました。インターネット アーキテクチャに関係するネットワーク要素、テクノロジー スタック、サービスなどの要素の数は飛躍的に増加しており、運用と保守のプレッシャーはますます大きくなっています。この流れの中で、運用保守管理モデルはITILからDevOpsへと進化し、運用保守管理ツールもITOM、ITOAからAIOpsへと破壊的な変化を遂げてきました。

ガートナーは AIOps プラットフォームのマーケットガイドを提供していますが、データ管理、モデルアルゴリズム、シナリオ駆動の 3 つの要素に基づいて AIOps プラットフォームを実装できるのでしょうか。実はそうではありません。このプロセスには複数の困難があります。まず、開発が得意な開発者は運用保守が得意ではなく、運用保守が得意な運用保守担当者は開発が得意ではありません。次に、垂直方向に複数の反復と水平方向に大規模な反復を経験してきた、さまざまな規模の多くの歴史的なシステムは、AIOps と完全に互換性があるでしょうか。第三に、AIOps プラットフォームの製品化では、過去と将来の両方のニーズを考慮し、静的安定性とアジャイル開発のニーズを満たし、規模と業界の境界を超越できる必要があります。

Xinju Networkは2006年の設立以来、通信、電力、航空、金融などの大手企業や機関に運用・保守管理サービスを提供してきました。程永馨氏は、業界の実務経験を組み合わせて、可視化、自動化、インテリジェンスという3つのAIOps実装戦略を提案しました。Xinju NetworkによるAIOpsインテリジェント運用保守プラットフォームの構築を例に挙げ、シナリオ主導がAIOpsを実装する最良の方法であることを確認しました。

AIOps を実装するための 3 つの重要なステップの視覚化

視覚化はなぜそれほど重要なのでしょうか?なぜなら、計測はすべてのマネジメントの始まりであり、可視化はマネジメントの結果の提示だからです。 AIOps 実装のプロセスにおいて、欠かせないリンクは、できるだけ多くの指標を定量化し、指標を視覚化することです。このプロセスでは、企業はビジネスからリソースまでの3次元的かつ詳細な相関分析を実現するために、3次元視覚監視システムを構築する必要があります。

図1 新居ネットワーク可視化インテリジェント監視システムのフレームワーク

図 1 に示すように、Xinju Network のインテリジェント監視および警報システムは、オペレーティング システム、データベース、仮想化、ネットワーク機器、ミドルウェア、ストレージなどの統合データを収集し、ユーザーが監視画面を通じてさまざまなシステム指標の状態をリアルタイムで確認できるようにします。さらに、インテリジェントなアルゴリズムを通じて構築されたビジュアルヘルスモデルにより、システム監視がインテリジェントなスコアリング形式に簡素化され、監視の決定が簡素化されます。

自動化: AIOps を実装するための 3 つの重要なステップ

AIOps を実装する 2 番目のステップは自動化です。インストール、展開、パッチ配布、検査操作など、頻繁に行われる多数の操作については、自動化によって運用および保守担当者の作業負荷を軽減できます。

AIOps シナリオ: 自動障害分析

図2 リアルタイム障害経路解析

図 2 に示すように、ビッグデータとインテリジェント分析機能が自動処理プロセスに導入され、運用と保守におけるリアルタイムの障害経路分析と迅速な障害箇所特定を実現し、複雑なシステムにおける「点、線、面」障害の影響を分析します。

AIOpsシナリオ: データベースの運用と保守の自動化

図3 データベースのインテリジェントな運用と保守、インテリジェントなSQL最適化

すべての PaaS の中核はデータベースにあり、データベースの運用保守作業は運用保守全体の中で非常に大きな割合を占めています。図3に示すように、Xinju NetworksはDPMデータベースインテリジェント運用保守プラットフォームを具体的に立ち上げました。現在、Oracle、DB2、MySQL、SQL Serverなどの複数の一般的なデータベースをサポートし、1つのプラットフォームで複数のデータベースのインテリジェントな運用保守管理を実現します。問題を迅速に発見して特定し、最適化の提案を提供するだけでなく、アプリケーションのバージョン変更プロセスによって発生するSQLの問題に対してターゲットを絞った最適化の提案を行い、リスクの高いSQLを自動的に識別してレビューし、アプリケーションの起動によってもたらされるリスクを軽減します。

AIOps実装の3つの成果:インテリジェンス

可視化と自動化の段階を経て、企業の運用と保守の問題の 80% が解決されました。では、次はインテリジェンスに向けてどのように進むべきでしょうか?突破口はシナリオ主導にあります。 Xinju Network は、エンタープライズレベルの運用保守サービス市場での 10 年以上の実績に基づき、インテリジェント検査、リソース管理、アプリケーション容量、ネットワーク セキュリティ、ユーザー エクスペリエンス、障害診断、災害復旧切り替え、セキュリティ監査など、自動化からインテリジェンスに移行できる 8 つの主要な運用保守シナリオをまとめました。

図4 インテリジェント実装の前提条件:運用と保守のビッグデータ

図4に示すように、程永馨氏は特に、インテリジェンス化の前提条件である運用と保守のビッグデータの重要な役割を強調しました。新居ネットワークを例に挙げると、新居ネットワークは、統一された収集、多次元、3次元の視覚監視システムを備え、8つの運用保守シナリオの自動化を実現した後、新居ネットワークが独自に開発したIVORYビッグデータログ分析プラットフォームに基づいて、AIOpsリアルタイム運用保守データ分析に重点を置き、障害の早期警告、異常な隠れた危険のタイムリーな発見、傾向分析を実現しました。 IVORY は、業界での長年の運用と保守の経験を​​組み合わせ、アラームの自己修復や自動障害回復などの機能を徐々に探求し、モバイル オペレーターと金融業界での生産慣行を実装しました。

Xinju Networks AIOps エンタープライズレベルの実践と進化の道

新居ネットワークのAIOpsエンタープライズレベル実践の全体的な実践と進化の道筋は、運用保守プラットフォームの基本機能、運用保守ビッグデータとツール機能、AIOps機能とシナリオ実装の3つの段階に分かれています。各段階の関連する構築と対策を図5に示します。

図 5 Xinju Network AIOps エンタープライズレベルの実践と進化のロードマップ

程永馨氏は講演の中で、国家商業銀行データベースのインテリジェント運用・保守、金融リスク管理データ展開のためのビッグデータ分析アプリケーション、金融企業に提供される全体的なAIOpsインテリジェント運用・保守プラットフォームなど、Xinju Networksが複数の金融企業クライアントのAIOps実装を支援した事例についても言及した。金融業界の情報構築において、新居ネットワークは「企業レベルの製品+地域化されたサービス」の両輪駆動戦略を堅持し、10年以上にわたって大規模な企業の運用・保守サービスで豊富な経験を積み、金融技術の革新を推進し、金融業界における新技術の応用を加速しています。

<<:  人間の生理学的パラメータのモニタリング分野に焦点を当て、Pulse Geekはウェアラブルでこの分野に参入し、AIを活用して心臓の守護者となる

>>:  MIT は、思考を通じて機械にタスクを実行させるブラックテクノロジーを開発

ブログ    
ブログ    
ブログ    

推薦する

2019年にロボット分野で注目すべき5つのトレンド

2019 年に注目すべき 5 つのロボット トレンドは次のとおりです。 [[259551]] 1. ...

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

オリンピック数学を勉強したことがない彼に、システム アーキテクトになれるかと誰かが尋ねました。他にも...

GANを別の視点から見る: 別の損失関数

ジェレミー・ハワード氏はかつて、Generative Adversarial Network (GA...

世界錬金術時代が始まった? MIT、住宅や道路を無制限のバッテリーに変える「カーボンセメント」スーパーキャパシタを開発

おそらく今回、私たちは本当に人類の歴史における特異点に立っているのかもしれない。最近、MIT のカー...

COVID-19は非接触アクセス制御の新時代を加速させる

現在、新型コロナウイルス感染症のパンデミックが世界的に拡大し、私たちの知る世界は大きく変化しています...

AI人材獲得をめぐる世界的な戦いにおいて、子どものプログラミングはどれほどの影響力を持つことができるのでしょうか?

[[226531]]人工知能の発展において、人材の確保は間違いなく重要な鍵となります。人工知能は、...

24時間365日対応のAI教師は生徒にどのような影響を与えるのでしょうか?

伝統的な教育方法は、過去 1 世紀か 2 世紀の間にあまり変わっていません。通常、生徒は教室で教師の...

大型模型+ロボット、詳細なレビューレポートはこちら、多くの中国の学者が参加

大型モデルの優れた能力は誰の目にも明らかであり、ロボットに統合されれば、ロボットはより賢い脳を持つこ...

OpenAI エンジニア必読: 苦い教訓

OpenAIが動画生成モデルSoraをリリースしてから1週間が経ちましたが、その人気は衰えていません...

百度CEOロビン・リー:AI時代のオープン性が技術の進歩を推進

8月19日、2017年ヤブリ中国起業家フォーラム夏季サミットが銀川で開催されました。百度の創業者で会...

マイクロソフトとグーグルのAIジレンマ:お金を稼ぐためにもっとお金を使う

7月26日のニュースによると、将来、人工知能はマイクロソフトやアルファベットなどのテクノロジー大手に...

...

RLHF にはもう人間は必要ありません! Googleチームの研究により、AIによる注釈が人間のレベルに達したことが証明される

たとえば、RLHF の「人間」が入れ替わった場合、それは実現可能でしょうか? Google チームの...

...