新居ネットワークの程永馨氏:AIの助けを借りて、運用保守プラットフォームは新たな活力を得ました

新居ネットワークの程永馨氏:AIの助けを借りて、運用保守プラットフォームは新たな活力を得ました

[51CTO.com からのオリジナル記事] 運用と保守の発展を振り返ると、スクリプト、ツール、プラットフォーム、インテリジェンスの 4 つの主要な時代に分けることができます。この進化には、主に 2 つの理由があります。1 つ目は、大型および小型のコンピュータ、PC サーバー、仮想マシン、コンテナーなどのインフラストラクチャが徐々に増加していること、2 つ目は、分散型およびマイクロサービス ソフトウェアの規模が爆発的に拡大し、呼び出し関係がますます複雑になっていることです。このような大規模かつ複雑で絶えず変化するシステムを前に、人的資源だけではもはや維持できず、私たちはインテリジェントな運用と保守という新しい方法を模索し始めました。

最近、2018 WOTグローバルソフトウェアおよび運用技術サミットの重鎮ゲストであり、企業情報管理で15年の経験を持つビッグデータおよび運用管理分野の上級専門家であり、Xinju Networkのディレクター/副ゼネラルマネージャーであるCheng Yongxin氏が51CTOの独占インタビューに応じた。運用と保守の進化、AIOps の概念、技術的な難しさ、適用状況、そして新世代の AIOps インテリジェント運用保守プラットフォームについて説明します。


可視化により価値が提示され、自動化により効率性が高まり、インテリジェントな運転能力が実現します。

2004年頃から中国では大規模なITシステム構築が始まりました。初期の頃は、大型の IOE 機器が中心でした。機器は高価で、数も少なく、規模も小さく、独立した閉鎖されたコンピュータ室に設置されていました。操作とメンテナンスは、基本的にコンピュータ モニター上の SecureCRT コマンドラインを通じて実行されていました。

IT システム アーキテクチャが従来の IOE 集中型アーキテクチャからインターネット分散型アーキテクチャへと進化するにつれ、IT 機器は数十台から数万台、さらには数十万台にまで増加しており、ツールがなければ運用や保守作業はまったく実行できません。そのため、可視化、自動化、インテリジェンスが、運用・保守ツールの構築における 3 つの方向性と要件となっています。

視覚化。まず、これまでディスプレイの裏に「隠れていた」各種設備情報、性能指標、ログ情報をキャプチャし、リーダーや運用保守エンジニアが運用保守大画面で直接リンク断や指標異常を明確に確認し、迅速な判断と対処ができるようにする必要があります。したがって、可視化とは、運用保守作業を黒画面から白画面に変換することであり、そのためには、さまざまな運用保守データを統一的に収集、保存し、集約して表示する必要があります。この間、Xinju Network のアプローチは、アプリケーション層、プラットフォーム層、デバイス層を垂直に接続し、ネットワーク全体の IT 機器に水平にアクセスして、ネットワーク全体からデータを収集し、特定のアルゴリズムを組み合わせて表示することで、運用および保守担当者が視覚化を通じて価値を提示できるように支援することでした。

オートメーション。より客観的に言えば、セルフサービス、つまり、運用保守担当者が大量の設備の運用と保守の標準化された操作の問題を解決できるように支援し、大量の反復作業、プリセットソリューション、オーケストレーションを通じて完了できるアプリケーションをリリースし、プログラム設定または半手動介入によって自動的に完了できるため、運用と保守の効率が向上し、人的エラーの割合が大幅に削減されます。この観点から、自動化は知能への前兆であると考えることができます。自動化の主な目的は、第一に効率性の向上、第二に安全性と制御の確保、第三に人員への依存度の低減です。これら 3 つのポイントを達成するには、プラットフォームに固められていない標準化されたプロセスは役に立たず、シナリオ主導でない運用保守プラットフォームの構築は空論に過ぎないことを理解する必要があります。実際の運用保守シナリオと運用保守プラットフォームを組み合わせた自動化だけが、企業の効率を真に解放することができます。

知能。インテリジェンスの目標は、人間の脳を機械に置き換え、現代の設備の計算能力、膨大な運用保守データ、絶えず進化する機械学習アルゴリズムを使用して、問題分析、障害予測、意思決定診断を行うことです。これにより、運用保守担当者はリアルタイムで運用保守画面に注意を払う必要がなくなり、障害処理の効率がさらに向上し、障害が発生する前にシステムの再起動、業務フローの制限、設備容量の拡張を自動的に決定して、故障の可能性を減らします。真のインテリジェンスを実現するには、ツールだけでは不十分です。実際の運用と保守のシナリオを組み合わせ、データの価値を最適化し、インテリジェンスで運用と保守の機能を推進し、最終的には発見、意思決定分析から問題解決までのクローズドループソリューションを実現する必要があります。

程永馨氏は、保守運用の3つの段階を一言でまとめました。価値の可視化、自動化による効率の解放、インテリジェントな運転能力です。主な目的は、保守運用の効率と品質を向上させ、保守運用の人員を解放し、保守運用をバックエンドからフロントエンドに移行させ、新技術が企業のビジネス成長をどのように推進するかにもっと注意を払うことです。

AIOps - 機械学習アルゴリズムによるIT運用・保守機能の変革とアップグレード

今日、IT システムは非常に複雑かつ大規模になっており、企業のデータ センターの規模は 2 年ごとに 2 倍になっています。同時に、企業業務のIT化の度合いが高まるにつれて、ITサポートに対する要求も高まり、コア業務は1分間の中断も許容できず、運用・保守に多大なプレッシャーがかかります。そのため、運用・保守業界自体も、かつて提唱された自動化から現在のインテリジェンス化へと変化・改善が進んでいます。

近年、AI技術がさまざまな応用分野で実装・実践されるにつれ、IT運用・保守はインテリジェントな運用・保守の新時代を迎え、AIOpsという概念が登場しました。しかし、AIOps は人工知能運用ではなく、機械学習アルゴリズムによる IT 運用および保守機能の変革とアップグレードを重視したアルゴリズム IT 運用です。

AIOps は、人間が実行する必要がある複雑な判断やデータ分析をアルゴリズムや機械に委任し、運用と保守の効率と品質を大幅に向上させます。自動化が運用保守の肉体労働の解決策であるとすれば、AIOPSの登場は、データサイエンス、機械学習、ニューラルネットワークなどのアルゴリズム技術をさらに活用し、自動化された運用保守だけでは解決できない運用保守データの全体に基づいて、運用保守の意思決定、障害予測、根本原因分析などの問題を解決し、物理的な人間の時間と体力をさらに解放し、機械が機械を支援してIT運用保守を実行できるようにすることです。

Gartner のデータによると、AIOPS の企業導入率は過去 2 年間で約 10% であり、2019 年には 25%、2020 年には 50% に達すると予想されています。現在、応用と研究の主な分野は 4 つあります。

1. データの異常検出と傾向予測、つまり、膨大な指標から異常な変化や傾向をいかに迅速に発見するか。例えば、Xinju Network の AIOps インテリジェント運用保守プラットフォームのサーバーパフォーマンス障害予測モジュールは、この目的のために開発されました。

2. 根本原因診断:システム異常が発生した場合、Baidu のログベースのインテリジェント障害位置特定システムなど、問題の根本原因を迅速に特定する方法。

3. タスクロボットは、マイクロサービスフレームワークでシステム API を学習、理解、使用するために人間を模倣し、API 例外が発生したときに人間の介入なしにプロアクティブなアクションを実行できます。

4:キャパシティ分析などの運用・保守データに基づく意思決定分析。

程永馨氏は、AIは多くの業界で応用されているものの、依然として比較的最先端の技術であり、莫大な投資が必要であると述べた。 AIOPSにとって、アルゴリズム、データ、専門知識はすべて不可欠です。一般大衆と比較して、運用保守業界はAI人材の魅力が弱いため、この分野の専門家は比較的弱く、できるだけ早く独自のAI人材システムを構築する必要があります。

AIを翼として、運用保守プラットフォームは新たな活力を得る

中国で最も先進的な IT 運用および保守サービス プロバイダーの 1 つとして、Xinju Networks はユーザー満足度を常にサービス標準として遵守しています。 IT システム アーキテクチャがアップグレードおよび変更されるにつれて、ユーザーの IT システム管理エクスペリエンスを保証するために、運用および保守サービスも進化しています。例えば:


  • お客様の複雑なアーキテクチャの管理能力の向上を支援するために、当社は単一のデータベース サービスの提供から包括的な運用および保守サービス プロバイダーへと進化し、IT 全体の運用と保守、アーキテクチャ、および計画サービスをお客様に提供しています。
  • 大規模システム構築後の品質問題に対処するため、エンドツーエンドのパフォーマンス最適化、アプリケーション品質管理、データ資産管理などのソリューションとサービスを含む、業界における包括的なユーザーエクスペリエンスとパフォーマンス管理を提案しています。
  • 企業の膨大な設備の管理能力を向上させるために、当社は視覚的、自動化、インテリジェントな運用・保守管理プラットフォームをカバーする「エンタープライズレベルの製品+ローカライズされたサービス」を顧客に提供します。
  • 企業が大規模化するビジネスデータを管理し、データの価値を高めるために、当社はデータ資産管理の「ファイブスターモデル」を提案し、包括的なビッグデータおよびデータ資産管理ソリューションを提供します。

程永馨氏は、新居ネットワークが数年前に運用保守製品部門を設立し、AIOpsに基づく新世代のインテリジェント運用保守プラットフォームを構築したことを紹介した。長年にわたり、さまざまな業界の顧客向けにアプリケーションの大規模な反復アップデートを実施してきた。このプラットフォームは、中国移動の地方企業に導入され、約2万台のデバイスと数百の業務システムを管理し、監視と警報、自動運用と保守、構成管理、スケジュール管理、意思決定管理などの機能を提供しています。AIウィングを装備した後の運用保守プラットフォームの新たな活力を十分に発揮し、傾向分析、インテリジェント診断、障害の自己修復、意思決定分析などの面で効果的に機能しています。

AIOps の新世代インテリジェント O&M プラットフォームの最も重要な進化は、2016 年にリリースされたビッグデータ ログ分析プラットフォーム IVORY です。主に O&M ビッグデータに基づく分析と予測の問題に対処し、大量のログ データと O&M データのインテリジェント分析を通じて、O&M の意思決定、インテリジェント診断、根本原因分析などの機能を提供し、O&M を従来の受動的な対応からインテリジェントな分析と予測へと高めています。

IVORYは、先進的なビッグデータ技術とアーキテクチャ、非構造化データ処理技術、異常検出、機械学習などの関連技術手段を適用しており、これもXinju NetworkによるAIOPSコンセプトの実装です。

インタビューの最後に、程永馨氏は、新居ネットワークは長年にわたり、顧客に優れたIT運用・保守管理サービスを提供することに尽力しており、サービスモデル、製品機能、人材システムの革新を通じて優れたユーザーエクスペリエンスを提供していると述べました。

今後、Xinju Network は次の 2 つの側面に重点を置きます。

1.「エンタープライズレベルの製品+ローカライズされたサービス」の両輪駆動により、サービス効率とユーザー満足度を継続的に向上させます。

第二に、通信や金融などの大手顧客との成熟した先進的な運用保守管理経験を活かし、より多くの顧客にサービスを提供します。10年以上にわたる運用保守に関する深い理解と実践経験に基づいて、業界で卓越したインテリジェントな運用保守製品を生み出し、国産ソフトウェアの競争力を高めたいと考えています。

【今月のトップ5ランキング】


  1. 張震: AIOps の 6 つの技術的難しさと CreditEase の運用と保守における大きな変化
    ​​
  2. 新居ネットワーク 程永馨:AIの翼で運用保守プラットフォームに新たな活力が
  3. SIEM&AIからSIEM@AIへ AIが次世代のエンタープライズセキュリティの頭脳を構築
  4. 線形ネットワークに基づく音声合成のための話者適応
  5. Zhuanzhuan のアーキテクチャ アルゴリズム部門の Sun Xuan: AI によるマイクロサービス アーキテクチャ

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  [ディープラーニングシリーズ] PaddlePaddle と Tensorflow を使用したクラシック CNN ネットワーク AlexNet の実装

>>:  分散型コンセンサスアルゴリズム: 想像以上に複雑

ブログ    

推薦する

MySQLにおける結合アルゴリズムの実装原理の分析

MySQL には、有名なネスト ループ結合という結合アルゴリズムが 1 つだけあります。他の多くのデ...

3D MRI および CT スキャンのディープラーニング モデルの概要

医療画像データと他の日常的な画像との最大の違いの 1 つは、DICOM シリーズ データを扱う場合、...

...

MITとHKUは、Transformerを超える精度を持つ物理モデルに基づく視覚推論フレームワークを提案

[[437809]]動的視覚推論、特にオブジェクト間の物理的な関係についての推論は、コンピューター ...

この「PhD Study Simulator」はとてもリアルです。何回諦めるように説得されるか試してみてください。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能認知学習—教育の未来?

人工知能(AI)はどこにでもあります。スマートセンサーを使用して素晴らしい写真を撮影するスマートフォ...

これはGPT-4が愚かである理由についての新たな説明である

かつては世界で最も強力だと考えられていたGPT-4も、リリース以来、いくつかの「信頼の危機」を経験し...

将来、人工知能ロボットに置き換えられる可能性のある10の仕事

専門家は、将来的には職業の約 70% が自動化されると予測しています。運転手、教師、ベビーシッター、...

AIは「技術力」の集中を加速させる。巨大企業によるAIの独占は深刻な結果をもたらすのか?

AI テクノロジーがかなり集中化しており、テクノロジー大手が優位に立っていることにお気づきですか?...

2020 年に注目すべき 6 つの機械学習のユースケース

2020 年には人工知能 (AI) が飛躍的に進歩し、機械学習はこのテクノロジーの最も成功し、広く普...

意思決定インテリジェンス: 人工知能における新たな方向性

[[353168]]記者趙光麗最近、中国科学院自動化研究所(以下、自動化研究所)は、「妙算智慧」戦術...

ハードウェアクラッキングに耐えられるハッシュアルゴリズムにはどのようなものがありますか?

[[185577]] 1. はじめにブルートフォース クラッキング ツール hashcat を使用...

清華大学のAI学生が顔を見せて歌う、この応用は将来に期待される

最近、清華大学初のAI学生がついにその本性を現した。伝えられるところによると、彼の名前は華志兵。清華...

ロボットは「痛みを恐れ」始めており、人間の介入なしに「自分自身を癒す」こともできる。

[[348121]]私の印象では、ロボットは火や剣を恐れていないようです。彼らには痛覚はなく、単な...

メタヘッドセットが舌トラッキング機能を追加、ネットユーザー衝撃「理由は聞かないし、知りたくもない」

突然でしたね… Meta の MR ヘッドセットは舌を追跡できるようになりました。効果は次のようにな...