WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするために IT システムに依存しているほとんどの組織にとって頭痛の種です。

エンジニアの善意、巧みな設計、堅実な開発手法にもかかわらず、重要なビジネス アプリケーションを実行するために企業に導入されているソフトウェア システムとハードウェア システムは停止しやすく、毎年何百万ドルもの労働力、収益、顧客の不満の損失が生じています。

IT ダウンタイムをより正確に予測して対応するために、IT チームはトポロジ、ログ、チケット、アラートなどのソースから取得したデータを精査し始めます。しかし、これらの異なるデータ ソースとさまざまなツールがあっても、チームは単一の共有された視点から停止のトラブルシューティングを行うのに苦労していました。幸いなことに、IBM Cloud Pak for Watson AIOps を使用すると、これらすべてが可能になります。

ログ異常予測

Watson AIOps の最新の特許出願中のログ異常検出テクノロジーは、Splunk、Humio、LogDNA、Logstash などのログ集約ツールからの IT アプリケーションおよびインフラストラクチャ ログを自動的に解析し、リアルタイムで異常を自動的に検出します。これは、しきい値や誤った文字列一致タイプに基づく従来のアラート技術よりもはるかに高速であり、インシデントを診断する平均時間を大幅に短縮します。ログ解析中にログから特徴を抽出し、異常予測を実行するためにディープラーニングアルゴリズムを使用します。ユーザーは、異常を検出するために静的なしきい値や手動のルールを設定する必要はありません。 IT 運用スタッフが積極的に関与して異常を診断し、インシデントを解決します。さらに、選択した IT ツールセットを通じて明らかにされた洞察を解釈し、IT 運用スタッフが将来同じタイプのインシデントを自動的に解決できるようにします。

指標異常予測

Watson AIOps のメトリックベースの異常検出テクノロジーは、New Relic、AppDynamics、SolarWinds などのさまざまなシステムからのメトリック データを分析し、企業内のメトリックの正常な動作を自動的に学習して、その中で異常を検出します。実証済みの時系列アルゴリズムスイートを使用して、季節性や重要な傾向を捉え、予測を実行します。

イベントのグループ化

イベントは、IT 運用環境で発生した注目すべき出来事を表します。たとえば、アプリケーションが利用できない、またはディスクがいっぱい/十分な容量がないなどです。イベントのグループ化と分類の目的は、IT 運用管理者が気を散らすものを減らし、すぐに対応する必要がある重要なイベントの解決に集中できるようにすることです。 Watson AIOps は、時間、空間、関連ルール マイニングなどの複数のアルゴリズムを使用して、メトリック、ログ、チケットから検出された異常をグループ化することで、インシデントのグループ化を可能にします。

静的および動的トポロジ管理

アプリケーションおよびネットワーク トポロジとは、企業内のさまざまなミッション クリティカルなアプリケーション間の接続を示すマップまたは図を指します。静的トポロジとは、アプリケーションとインフラストラクチャ コンポーネントの情報が展開され、上記の上に構築されたマップを指します。対照的に、動的トポロジとは、実行時に環境が変化するにつれてリソースとその関係をキャプチャし、ほぼリアルタイムで同じ可視性を提供する動的マップを指します。

Watson AIOps の Topology Manager を使用すると、現在のトポロジーと履歴トポロジーを比較して、「何が起こったのか?」や「何が起きているのか?」などの質問に答えることができます。これは、インシデントに至るまでの詳細を調査し、時間の経過に伴ってトポロジ (および状態) がどのように変化するかを確認するのに役立ちます。さらに、断層の位置を位相的に特定することもできます。

断層の位置と爆発半径

エンティティ メンションは、例外ログ、アラート、チケット、イベントで参照されるリソース名 (サービスまたはアプリケーション コンポーネント名、サーバー名、サーバー IP アドレス、ポッド ID、ノード ID など) です。イベントがグループ化された後、イベント内の異常ログ、メトリック、アラート、およびエンティティの言及が抽出されます。これらのエンティティは、質問を見つけ、識別されたエンティティを、エンティティの言及が見つかった時刻と一致する対応する動的トポロジ インスタンスに配置するために、トポロジ リソースを使用して解決できます。アプリケーション、インフラストラクチャ、ネットワーク層のトポロジ グラフを走査することで、影響を受けるコンポーネント (爆発半径) を特定できます。

インシデント解決

Watson AIOps は、ServiceNow などのツールに接続して以前のインシデント チケット データを抽出およびマイニングし、現在診断されている問題に対する最善の対応策についてタイムリーで適切な推奨事項を提供します。現在のイベント機能を使用すると、インデックス付けされたチケット データを照会して、最も重要な関連する以前のイベント レコードを検索して取得できるだけでなく、関連する各レコードから重要なエンティティとアクション (名詞と動詞) のフレーズを抽出して、SRE が推奨されるアクションを簡単かつ迅速に理解できるようにすることもできます。ルールベースのシステムを含むさまざまな自然言語処理技術を適用して、エンティティとアクションフレーズを抽出します。

洞察と行動を提供する

Watson AIOps では、上記のすべての洞察が ChatOps とダッシュボードを通じて提供されます。リアルタイムの洞察は、ChatOps を介して SRE が作業する場所に直接配信されます。 ChatOps は、洞察の証拠を探索するだけでなく、他の共同作業者とのやり取りや、厳選されたインシデント解決の提案の共有もサポートします。 ChatOps を使用すると、SRE はログ、メトリック、チケット監視ツールを起動して、より詳細な情報を取得できます。同様に、SRE はインタラクティブなダッシュボードを起動して、イベント、イベント グループ、メトリックの異常、トポロジを詳細に調査できます。該当するアクション/ランブックは、ランブック実行によって自動的に実行されます。

AIモデルのライフサイクル管理に関する注意事項

Watson AIOps は、代表的なメトリック、ログ、チケット データのセットを使用して、教師なしモデルをトレーニングおよび構築します。これらのモデルは、環境内の最新のデータを使用して継続的に学習し、ユーザーからのフィードバックに基づいて改善するように設定されています。信頼を得るには、すべての AI モデルが透明性と説明可能性を備えている必要があります。AI 予測とモデルに信頼性と透明性を提供することは、世界中の企業にとって依然として最大の関心事です。

Watson AIOps の AI パイプライン。

Watson AIOps の今後の展開は?

次世代の Watson AIOps ソリューションでは、完全に機能し、監視可能で、自己認識できるだけでなく、自動化され、自律的な IT 運用環境を構想しています。 AIOps ソリューションは、リアクティブ モードで問題を解決するだけでなく、「開発、セキュリティ、運用 (DevSecOps)」ライフサイクル アクティビティを最初から設計することで、効率的な運用を可能にし、問題が発生する前に回避します。たとえば、インテリジェントなチェックとゲートにより、リスクの高いデプロイメントが実稼働環境に入るのを防ぎ、十分にテストされていないコード モジュールや危険なセキュリティ脆弱性を持つコードがデプロイメント段階に到達するのをブロックできます。私たちは未来を形作るのを心待ちにしており、この旅にぜひご参加ください。

IBM の詳細については、 http://cloud..com/act/ibm2021q3/cloud#p2 をご覧ください。

<<:  Google が新たなブラック テクノロジー プロジェクトを立ち上げました。産業用ロボットへの賭け

>>:  人工知能、機械学習、ディープラーニングの違いと関連性

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人工知能のアプリケーションアーキテクチャを考える

[[408914]] 1. パドルライトとパドルスリム現在、ディープラーニングの分野には 2 つの派...

AI脳を搭載したドローン:群衆の中の暴力的な人々を正確に識別できる

[[233174]]もしある日私を殴りたくなったら、ただ殴って終わりにできると思いますか?今はそんな...

調査によると、ChatGPTが提供するアドバイスは専門家が提供するアドバイスよりも包括的で役立つことがわかっています。

12月26日、専門家が実施した最近の調査では、ChatGPTが提供する提案は、人間の専門家が提供す...

...

避けられないアルゴリズムを完全に理解するにはどうすればよいでしょうか?

検索エンジン(Google Chrome、Mozilla Firefox など)を使用するとき、バッ...

2020年のIoTイベントトップ10を振り返る。アプリケーションの加速

今日では、それはもはや高尚な概念ではありません。スマートカーやスマートホームから、企業の資産管理機器...

ビジネスアナリストにとってAIが意味するもの

[[275322]]今日では、人工知能はもはや流行語ではなく、多くの環境ビジネスアナリストやその他の...

ChatGPT を使用して Web アプリケーションを構築する方法は?

翻訳者 |ブガッティレビュー | Chonglou ChatGPTの最大のセールスポイントの 1 つ...

顔認識の3つの主要技術と4つの主要機能

2016年百度世界大会が開幕し、百度創始者の李承燁氏は大会で「人工知能」をテーマに講演し、最新製品「...

人間と機械のコラボレーションが顧客に力を与え、インテリジェントな顧客サービスが企業のマーケティング環境を一変させています。

「ロボットはアフターサービスにしか適していません。」 「ロボットはどのようにして人手によるマーケテ...

人工知能が人間に取って代わり、多くの人が失業することになるのでしょうか?

人工知能とは何ですか? AI と呼ばれる人工知能は、コンピュータ サイエンスの一分野です。このテクノ...

ChatGPT Enterprise Editionがリリースされ、OpenAIはこれをこれまでで最も強力なバージョンと呼んでいる

執筆者:Qianshan過去 1 か月間、OpenAI に関する物議を醸す報道が多くありました。一方...

2022 年の優れたインテリジェント オートメーションのトレンドと予測

調査によると、2022年までにインテリジェントオートメーションのトレンドが拡大し、デジタル変革が急速...

...