WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするために IT システムに依存しているほとんどの組織にとって頭痛の種です。

エンジニアの善意、巧みな設計、堅実な開発手法にもかかわらず、重要なビジネス アプリケーションを実行するために企業に導入されているソフトウェア システムとハードウェア システムは停止しやすく、毎年何百万ドルもの労働力、収益、顧客の不満の損失が生じています。

IT ダウンタイムをより正確に予測して対応するために、IT チームはトポロジ、ログ、チケット、アラートなどのソースから取得したデータを精査し始めます。しかし、これらの異なるデータ ソースとさまざまなツールがあっても、チームは単一の共有された視点から停止のトラブルシューティングを行うのに苦労していました。幸いなことに、IBM Cloud Pak for Watson AIOps を使用すると、これらすべてが可能になります。

ログ異常予測

Watson AIOps の最新の特許出願中のログ異常検出テクノロジーは、Splunk、Humio、LogDNA、Logstash などのログ集約ツールからの IT アプリケーションおよびインフラストラクチャ ログを自動的に解析し、リアルタイムで異常を自動的に検出します。これは、しきい値や誤った文字列一致タイプに基づく従来のアラート技術よりもはるかに高速であり、インシデントを診断する平均時間を大幅に短縮します。ログ解析中にログから特徴を抽出し、異常予測を実行するためにディープラーニングアルゴリズムを使用します。ユーザーは、異常を検出するために静的なしきい値や手動のルールを設定する必要はありません。 IT 運用スタッフが積極的に関与して異常を診断し、インシデントを解決します。さらに、選択した IT ツールセットを通じて明らかにされた洞察を解釈し、IT 運用スタッフが将来同じタイプのインシデントを自動的に解決できるようにします。

指標異常予測

Watson AIOps のメトリックベースの異常検出テクノロジーは、New Relic、AppDynamics、SolarWinds などのさまざまなシステムからのメトリック データを分析し、企業内のメトリックの正常な動作を自動的に学習して、その中で異常を検出します。実証済みの時系列アルゴリズムスイートを使用して、季節性や重要な傾向を捉え、予測を実行します。

イベントのグループ化

イベントは、IT 運用環境で発生した注目すべき出来事を表します。たとえば、アプリケーションが利用できない、またはディスクがいっぱい/十分な容量がないなどです。イベントのグループ化と分類の目的は、IT 運用管理者が気を散らすものを減らし、すぐに対応する必要がある重要なイベントの解決に集中できるようにすることです。 Watson AIOps は、時間、空間、関連ルール マイニングなどの複数のアルゴリズムを使用して、メトリック、ログ、チケットから検出された異常をグループ化することで、インシデントのグループ化を可能にします。

静的および動的トポロジ管理

アプリケーションおよびネットワーク トポロジとは、企業内のさまざまなミッション クリティカルなアプリケーション間の接続を示すマップまたは図を指します。静的トポロジとは、アプリケーションとインフラストラクチャ コンポーネントの情報が展開され、上記の上に構築されたマップを指します。対照的に、動的トポロジとは、実行時に環境が変化するにつれてリソースとその関係をキャプチャし、ほぼリアルタイムで同じ可視性を提供する動的マップを指します。

Watson AIOps の Topology Manager を使用すると、現在のトポロジーと履歴トポロジーを比較して、「何が起こったのか?」や「何が起きているのか?」などの質問に答えることができます。これは、インシデントに至るまでの詳細を調査し、時間の経過に伴ってトポロジ (および状態) がどのように変化するかを確認するのに役立ちます。さらに、断層の位置を位相的に特定することもできます。

断層の位置と爆発半径

エンティティ メンションは、例外ログ、アラート、チケット、イベントで参照されるリソース名 (サービスまたはアプリケーション コンポーネント名、サーバー名、サーバー IP アドレス、ポッド ID、ノード ID など) です。イベントがグループ化された後、イベント内の異常ログ、メトリック、アラート、およびエンティティの言及が抽出されます。これらのエンティティは、質問を見つけ、識別されたエンティティを、エンティティの言及が見つかった時刻と一致する対応する動的トポロジ インスタンスに配置するために、トポロジ リソースを使用して解決できます。アプリケーション、インフラストラクチャ、ネットワーク層のトポロジ グラフを走査することで、影響を受けるコンポーネント (爆発半径) を特定できます。

インシデント解決

Watson AIOps は、ServiceNow などのツールに接続して以前のインシデント チケット データを抽出およびマイニングし、現在診断されている問題に対する最善の対応策についてタイムリーで適切な推奨事項を提供します。現在のイベント機能を使用すると、インデックス付けされたチケット データを照会して、最も重要な関連する以前のイベント レコードを検索して取得できるだけでなく、関連する各レコードから重要なエンティティとアクション (名詞と動詞) のフレーズを抽出して、SRE が推奨されるアクションを簡単かつ迅速に理解できるようにすることもできます。ルールベースのシステムを含むさまざまな自然言語処理技術を適用して、エンティティとアクションフレーズを抽出します。

洞察と行動を提供する

Watson AIOps では、上記のすべての洞察が ChatOps とダッシュボードを通じて提供されます。リアルタイムの洞察は、ChatOps を介して SRE が作業する場所に直接配信されます。 ChatOps は、洞察の証拠を探索するだけでなく、他の共同作業者とのやり取りや、厳選されたインシデント解決の提案の共有もサポートします。 ChatOps を使用すると、SRE はログ、メトリック、チケット監視ツールを起動して、より詳細な情報を取得できます。同様に、SRE はインタラクティブなダッシュボードを起動して、イベント、イベント グループ、メトリックの異常、トポロジを詳細に調査できます。該当するアクション/ランブックは、ランブック実行によって自動的に実行されます。

AIモデルのライフサイクル管理に関する注意事項

Watson AIOps は、代表的なメトリック、ログ、チケット データのセットを使用して、教師なしモデルをトレーニングおよび構築します。これらのモデルは、環境内の最新のデータを使用して継続的に学習し、ユーザーからのフィードバックに基づいて改善するように設定されています。信頼を得るには、すべての AI モデルが透明性と説明可能性を備えている必要があります。AI 予測とモデルに信頼性と透明性を提供することは、世界中の企業にとって依然として最大の関心事です。

Watson AIOps の AI パイプライン。

Watson AIOps の今後の展開は?

次世代の Watson AIOps ソリューションでは、完全に機能し、監視可能で、自己認識できるだけでなく、自動化され、自律的な IT 運用環境を構想しています。 AIOps ソリューションは、リアクティブ モードで問題を解決するだけでなく、「開発、セキュリティ、運用 (DevSecOps)」ライフサイクル アクティビティを最初から設計することで、効率的な運用を可能にし、問題が発生する前に回避します。たとえば、インテリジェントなチェックとゲートにより、リスクの高いデプロイメントが実稼働環境に入るのを防ぎ、十分にテストされていないコード モジュールや危険なセキュリティ脆弱性を持つコードがデプロイメント段階に到達するのをブロックできます。私たちは未来を形作るのを心待ちにしており、この旅にぜひご参加ください。

IBM の詳細については、 http://cloud..com/act/ibm2021q3/cloud#p2 をご覧ください。

<<:  Google が新たなブラック テクノロジー プロジェクトを立ち上げました。産業用ロボットへの賭け

>>:  人工知能、機械学習、ディープラーニングの違いと関連性

ブログ    

推薦する

Nvidia が企業秘密を盗んだと非難される!ビデオ会議で証拠が明らかになり、関与した従業員は有罪を認めた

Nvidia はビデオ会議を開催しただけで訴えられたのですか? ? ?はい、きっかけはほんの数枚のコ...

ロボットが人間に取って代わるのは時間の問題です。まずこれらの仕事がなくなるでしょう。

インテリジェント時代の到来とともに、テクノロジー生活は家庭システム全体を席巻しています。さまざまなス...

...

...

...

AIは人間社会のさまざまなビジネスモデルをどのように変えるのでしょうか?

過去20年間、一部の懐疑論者は、人工知能(AI)の発展が企業構造を混乱させ、大量の失業と富の格差の拡...

...

人工知能プロジェクトのための 10 のヒント - ガイド

昨日の人工知能プロジェクトに関する 10 の提案 - 理論に続き、今日は人工知能プロジェクトの 10...

スマートテクノロジーは小売業界にどのような影響を与えるでしょうか?

過去数年間、小売業界はテクノロジーによって革命を起こしてきました。店舗の日々の運営方法から、消費者の...

日常生活における人工知能の応用トップ 10

[51CTO.com クイック翻訳]経済社会の発展に伴い、テクノロジーはますます複雑になっています...

...

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?最近、北京大学の公式Weiboアカウントは、北京大学と清...

エンタープライズ電気システムにおける機械学習の 5 つのメリット

機械学習技術は企業の電気システムの作業と保守において重要な役割を果たしており、人々は機械学習を採用す...

悪いことを学ぶのは簡単ですが、良いことを学ぶのは難しいです!人工知能は人間の人種や性別の偏見を継承する

編集者注: サンスティーンは『インターネット共和国』でアルゴリズムが私たちの認知世界に影響を与えると...

AIは脳スキャンだけであなたの政治的思想を予測できる

人工知能は、脳内の機能的接続のスキャンを分析するだけで、人の政治的イデオロギーを予測することができま...