AIOps に関する 6 つの誤解とその説明

AIOps に関する 6 つの誤解とその説明

[[387871]]

AIOps とは何でしょうか? IT リーダーは、AIOps に関する一般的な誤解、特に AIOps アプローチが目的に適合するかどうかの説明を理解する必要があります。

DevOps は理解するのが難しいと思いますか? まずは AIOps について学んでください。調査会社ガートナーが 5 年前に初めてこの用語を作り、AIOps の意味は現在では「アルゴリズムによる IT 運用」から「AI 運用」へと進化しています。汎用アルゴリズムを使用して IT 運用チームを支援するという考えは、それほど新しいものではありません。 AIOps は AI の誇大宣伝の波に乗ろうとする試みであり、一部の運用および監視ツールのメーカーは AI を追加しようとしていると主張する人もいるかもしれません。 10 人に AIOps の定義を尋ねると、おそらく 10 通りの定義が返ってくるでしょう。これは、クラウド コンピューティングの定義に同意する人がほとんどいないのと同じです。

DevOps Institute の研究ディレクターである Eveline Oehrlich 氏は、次のように説明しています。「AIOps ソリューションは、IT 運用チームやその他のチームが、受信するデータ量と種類をより適切に分析することで、主要なプロセス、タスク、意思決定を改善できるようにします。これらのツールは、大量のデータの迅速な取り込みを自動化します。機械学習を使用してデータを分析し、発見された問題を予測または警告できる洞察を提供します。この新たに得られた知識は、自動化や意思決定に使用できます。」

IT リーダーは、組織のリーダー、同僚、パートナー、顧客から生じる可能性のある AIOps に関する一般的な誤解を理解し、説明できる必要があります。次のセクションでは、さまざまな AIOps アプローチがビジネス目標と一致する場合と一致しない場合がある理由について説明します。

AIOps の真実: AIOps とは何か、何ができるのか

それでは、現在の AIOps の勢いを牽引している要因と、IT チームが享受しているメリットについて詳しく見ていきましょう。たとえば、組織ですでにコンテナと Kubernetes を使用している場合は、クラスターを自動的に駆動するというアイデアが気に入るかもしれません。そのため、今すぐ AIOps の実装を開始できます。

1. AIOpsは製品ではない

組織に AIOps を導入したい場合、AIOps 製品を購入して展開し、1 年かけて完了させる計画を立てるかもしれません。運用スタックに別の製品を追加すると、複雑さが増します。複雑さが増した場合、どのように対処しますか?

まず、現在の AIOps 製品が提供する一般的な機能を考慮し、現在のツールセットを詳しく調べて、ギャップが存在する場所を評価します。

  • ベースライン: メトリックやその他の時系列ベースのデータ用。
  • 根本原因分析: 複数の情報ソースを接続してドリルダウンします。
  • 異常検出: 将来を予測し、逸脱を警告します。
  • 相関関係: たとえば、メトリックとチケット間の相関関係。
  • シミュレーション: 仮想のシナリオ。

人々は AIOps をスタンドアロン製品ではなく機能として認識するようになります。一部の機能では、専用のツールだけでは不十分です。すべてのツールが相互接続された場合にのみ「魔法」が発生する可能性があるためです。ちょうど、単一のニューロンだけでは脳を構成できないのと同じです。

2. AIを使う前にオペレーションが必要

「走る前に歩くことを学ばなければならない」ということわざにもあるように、既存の監視手段に問題はありませんが、システム環境にメトリック、ログ、および観測性を追加するだけで済みます。したがって、操作を簡単にすることが最優先事項です。アラートが多すぎる場合は、最も重要なアラートを特定する必要があります。重要なアプリケーションからメトリックを取得していない場合は、メトリックの実装を開始してください。組織が満たす必要のあるサービス レベル指標 (SLI) といくつかのサービス レベル目標 (SLO) の定義を開始します。

そうすることで、監視設定の盲点が明らかになり、可視性と運用能力が向上します。障害に遭遇し、アラートしきい値を手動で設定できなくなったら、新しいツールを使用する必要があります。

制限を理解することは常に改善への第一歩であるため、AIOps の取り組みはデータの収集とそれを理解することから始まります。 AI 研究者が新しい分野に進出する場合、最初に行うべきことの 1 つは探索的データ分析 (EDA) を実行することです。これには、列名とは何か、値とは何か、セマンティック コンテキストとは何かなどのデータ特性を理解することが含まれます。

同様に、AIOps の取り組みの最初のステップは、組織がすべての運用データを簡単に収集してアクセスし、視覚化できるようにすることです。これは、現在のデータだけでなく、履歴データも意味します。

それを行った後でのみ、次のステップを開始し、新しいシグナルと洞察を見つけて、それらを自動化されたアクションに組み込むことができます。

3. AIOpsは文化的な変化である

DevOps 運動が関連する文化的変化で知られているように、AIOps を運用における文化的変化と捉える人もいます。 DevOps は、開発チームと運用チームの 2 つの文化的哲学を組み合わせて、スピードと実験を特徴とする新しい文化を生み出します。今日では、DevOps プロフェッショナルが開発者ツールセットと運用ツールセットの両方のツールを使用することは当然のことと考えられています。統合インフラストラクチャや、コード実行のためのサービス レベル インジケーター (SLI) を提供するアプリケーション開発チームなどが見られるようになります。

これで、データ サイエンティストの役割を追加して、AIOps を実現できます。言い換えれば、探索的データ分析 (EDA) などの方法や Jupyter Notebook などのツールを使用して組織の運用効率を向上させることで、より多くの IT プロフェッショナルが AIOps 分野に参入することになります。

実際、モデルの導入の運用面から切り離されたままの AI/ML コミュニティにも同じことが当てはまります。データ サイエンティストが AI エンジニアのように DevOps の利点と課題を受け入れて理解するようになったらどうなるでしょうか。そうなると、時間の経過とともに、IT 分野の問題に注目が移ります。興味深いことに、AI は猫の写真の識別では人間よりも優れているかもしれませんが、故障したハード ドライブの識別は AI にとって依然として課題です。

4. 統合が優先される

では、AIOps が製品でないなら、どこから来るのでしょうか? データ セット間に何らかの相関関係があることや、停止が複数回発生したことが判明したら、AIOps で一部の操作を自動化したり、停止を解決する方法に関するガイダンスを提供したりする必要があります。

そして、ツール間の構造の中で「魔法」が起こります。これは、関連システムへのリンクをユーザーに提供し、メトリクス ダッシュボードからデバッグ コンソールに簡単にジャンプできるようにするチャットボットなど、より小規模な小売価格の接続レイヤーで実現できます。

しかし、相関関係が因果関係ではない場合は、AIOps ツールを使用して 2 つのメトリック セット間の相関関係を見つけたとしても、それを検証し、将来それに基づいて行動するかどうかを決定する必要があります。あるいは、相関関係は停止の原因を特定するのに役立ちます。

重要なのは、セットアップの複雑さをよりよく理解して管理し、自動化されたヘルパーとアクションを統合することです。

5. オープンソースソフトウェアを使用する

ここでオープンソースソフトウェアが重要な役割を果たします。オープンソース製品では、組織はあらゆるレベルのコードを読み取って、何が行われているかを理解できます。これを運用領域に置き換えると、ユーザーはソフトウェア スタックのすべてのレイヤーでメトリックを公開し、データを追跡して、その意味を理解できるようになります。新世代のデータセンターは、マイクロサービスと API 駆動型のソフトウェア展開プロセスを広範に活用する Kubernetes 上に構築されています。最近では、API 呼び出しの監視は非常に簡単です。本質的に、可観測性とは、景観をいつでも、どのような詳細レベルでも検査できることを意味します。いくつかのデータ サイエンス ツールを使用してデータを視覚化し、探索をガイドすると、根本原因の分析とトラブルシューティングに役立ちます。

現在、組織は同じパラダイムを使用して独自のアプリケーションを展開および管理し、コンテナ化し、監視スタックを再利用してアプリケーション スタックを検査および監視しています。

同じツールが使用されるため、プラットフォームやアプリケーション間でメトリックを相関させることが容易になります。 Prometheus は、この分野における事実上の監視標準となっており、それ自体が API 駆動型です。 Loki や Jaeger などの同様のプロジェクトは、ログ記録と追跡に役立ちます。

組織は、Open Data Hub や Kubeflow などの Kubernetes ネイティブのデータ サイエンス プラットフォームを使用して、すべてのデータを収集および分析できます。

IT チームにとってのメリットは、オープンソース ツールを通じて標準が強制されるため、摩擦が減り、緊密に統合されることです。

6. データは重要

おそらく、組織は十分なデータを持っていないのでしょう。しかし、前述のように、このデータはクリーンで理解しやすいものでなければなりません。そのため、組織は独自のデータプールを収集し、独自の AI モデルをトレーニングできます。これは、事前にトレーニングされたインテリジェンスが組み込まれていないため、事実上すべての商用 AIOps ツールで必要なことです。

しかし、公開データで一般的なモデルをトレーニングし、それをベースラインとして独自のモデルをトレーニングできるとしたらどうでしょうか? 誰もゼロから始めたくはなく、むしろより多くの支援を求めています。データベース アプリケーションは、一般的なワークロードとスキーマに対して独自のモデルを提供する可能性が高くなります。その後、学習コンテンツは組織固有のニーズに基づいて特定の設定に転送されます。これは始まりに過ぎず、ニーズに応じて差別化を図ってください。

たとえば、パブリック クラウド プロジェクトでは、プラットフォームとワークロードはコミュニティ内で実行され、運用データ (メトリック、ログ、チケットなど) はオープン ソース ライセンスに基づいて公開されます。これは、データ サイエンティストがオープンで無料のモデルを作成できるようにするためです。

AIOps を始める方法

DevOps の働き方を採用した IT リーダーなら誰でも、習慣を変えるには継続的な実践が必要であることを知っています。 AIOps の考え方を採用している IT チームにも同じことが当てはまります。わかりやすい問題から始めて、AIOps 機能の開発という進化のサイクルを経て、AI 支援、AI 拡張、そして最終的には AI 自動化の IT 運用へと進んでいくことができます。

文化を変えるには、組織内に擁護者、スポンサー、ロールモデルが必要です。 AI を取り巻く誇大宣伝に巻き込まれるのではなく、AI を導入し、基礎を理解し、問題を解決する時が来ています。あらゆる革命的なイノベーションは小さなことから始まります。将来、オープンマインドなエンジニア、運用の専門家、高度なプラットフォームと運用スタックがあれば、何を達成できるかに人々は驚くかもしれません。

<<:  今のところ人工知能があなたの仕事を奪うことはないが、すでにあなたの履歴書に載っている

>>:  世界初の人工知能地震監視システムが始動:1秒以内に正確な推定

ブログ    
ブログ    

推薦する

...

人工知能の根幹技術を徹底的に分析

AIチップ・AIフレームワークの代表的企業コンピューティングアルゴリズムの重要な基盤として、人工知能...

...

K近傍教師あり学習マシンアルゴリズムの詳細な分析

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟K 近傍法 (KNN) は、機械学習アルゴリズムにおける回...

...

GoogleとHuawei、AI市場獲得に向け音声アシスタントの導入を急ぐ

Google が携帯電話向けの初の音声人工知能製品を発表してから 5 か月後、同社は Apple の...

...

...

5G+AI:将来的には1+1>2の効果は得られるのか?

情報産業革命以来、人々の生活は大きく変化しました。それぞれの新しいテクノロジーの出現は、さまざまなレ...

ビッグデータとアルゴリズムについて言えば、これらを知っておくことはあなたにとって大きな利益となるでしょう

この記事では、ビッグデータ アルゴリズムを理解するプロセスをまとめます。本文は、アルゴリズムに関する...

米国商務省は、生成型人工知能の潜在的なリスクに対処するために、公開AIワーキンググループを設立した。

6月25日、ジーナ・ライモンド米国商務長官は、国立標準技術研究所(NIST)が人工知能(AI)に関...

古典的なアルゴリズム: 順序付けられていない配列の K 番目に大きい値を見つける

[[409182]] 1. K番目に大きいものを見つけるタイトル順序付けられていない整数配列がありま...

...

01 コーヒーとsocket.ioで実装されたナップサックアルゴリズム

まず、なぜこれを書くのかお話しします。プログラマーになるのは本当に大変です。長い年月を経ても、レンガ...

機械学習論文を再現する際に注意すべき5つの問題

私が初めて機械学習に興味を持ったとき、論文を読んだり、それを実装したりすることに多くの時間を費やしま...