ソゴウ・チャン・ボー:インテリジェントな運用とメンテナンスは代替ではなくアップグレードです

ソゴウ・チャン・ボー:インテリジェントな運用とメンテナンスは代替ではなくアップグレードです

[51CTO.com オリジナル記事] 「初夏、あなたはついに貴重な年次休暇を楽しむ機会を得ました。海風は穏やかで、太陽は暖かく、サングラスをかけ、波が上下するのをゆっくりと見ています。この瞬間、あなたは初めてオペレーションとメンテナンス業界に入った頃を思い出しています。当時は、失敗が容赦なく、休暇が尽きることがありませんでした...ちょうどいいタイミングであなたの電話が鳴りました - 「アラーム」。あなたは急いでいなかったので、電話の声に「巻き戻して」と言いました。そして、あなたは電話を置き、海を眺め続け、海風に髪をなびかせ、あなたの心は遠くの海のように穏やかでした。」

これは、2017 年 4 月 15 日に開催された「WOTA グローバル アーキテクチャおよび運用サミット」で Sogou の運用ディレクターである張波氏が説明した将来の運用の理想的な状態です。同日の講演では、Sogouが現在理想的な運用と保守(「インテリジェント運用と保守」)を実現するために研究している方向性について詳細に紹介された。会議後、張波氏と詳細な意見交換とインタビューを行う機会がありました。

[[189052]]

張波、Sogou オペレーションディレクター

運用と保守における3つの大きな問題点

張波氏の意見では、運用保守担当者が安全な休暇を切望する理由は、まさに現在の運用保守の問題点が顕著に表れているためだ。現在、運用とメンテナンスには、心配コスト、煩わしいコスト、IQ不足という3つの共通の問題点があります。これら3つの問題点は、張波氏がスピーチの中で繰り返し言及していたことでもありました。

いわゆる心配のコストは、クロストーク「長靴を投げる」で表現されたテーマに似ています。つまり、「2 足目の長靴がいつ投げられるか」はわかりませんが、運用とメンテナンスでも同じことが言えます。障害がいつ発生するかわからないため、常に心配し、不安になります。また、多くの場合、警報は鳴っても実際の状況を反映しておらず、運用や保守にかかるコストが懸念されます。

面倒なコストは、オンラインの信頼性を確保するために発生します。問題が発生すると、大小を問わず、最初に相談されるのは運用保守担当者であるため、運用保守担当者が最も邪魔される可能性が高くなります。その結果、運用保守担当者は運用保守開発を行う時間があまりなく(Sogou では、運用保守担当者は開発を行わない場合は昇進できないと規定されています)、開発効率が低すぎます。

3 番目の問題点: IQ の不足。これは非常に単純で、文字通り理解できます。障害が発生したとき、特に複雑な障害が発生した場合、必ずしもすぐに障害箇所を特定できるとは限りません。どのようにして障害箇所を見つけるかは非常に頭の痛い問題です。

Sogou は、運用と保守における現在の問題点を解決するために何を行っていますか?張波氏は、Sogou のインテリジェントな運用および保守システムを構成する 3 つの進行中のプロジェクトについて私たちと共有しました。

スマートヒューズの実装原理

まず、インテリジェントヒューズシステムがあります。これは、Sogou が現在、運用と保守のコストを削減するために開発しているプロジェクトです。主なアイデアは、運用と保守の問題が発生するタイミングに基づいてインテリジェントな監視を実行することです。問題が発生すると、運用と保守の担当者がリモートで操作し、回路ブレーカーのロールバック対策を講じることができます。これは新しい技術ではありません。株式や医療の分野では、タイムラインベースのデータモニタリングが古くから広く利用されてきました。株式市場ではデータ監視によって株価の上昇や下落を予測したり、医療ではデータ監視によって病気の発症を予測したりしますが、これらの特徴は運用と保守に非常に似ています。これはまさに現在の運用保守分野の課題であり、最先端の人材の多くは金融や医療の分野に集中しており、IT分野には非常に少ないのです。

インテリジェントな質疑応答システム——ヴィクトリアズ・シークレット

2 つ目は、インテリジェントな質問応答システムである Victoria's Secret です。この質疑応答システムはすでにSogou内で内部テストを開始しており、運用と保守の2番目の問題点である煩わしいコストを解決することも目的としています。運用・保守担当者は毎日さまざまな質問に答える必要があります。この作業には膨大な時間がかかりますが、この作業はインテリジェントロボットによって完全に解決できます。

インテリジェントロボット

このロボットには3つの機能があります。1つはインテリジェントな注文確認機能です。Sogouの内部運用保守システムには多くの作業指示書があります。作業指示書番号を調べると、作業指示書がどの段階に達しているかがわかります。これは、エクスプレス番号を入力してエクスプレスステータスを表示するSogou検索に似ています。 2 つ目は、人に対するインテリジェントな検索です。コンサルタントが質問した後、ナレッジ ベース (ナレッジ ベースは、運用保守担当者によって事前に編集および整理されます) にヒットせず、ロボットが回答できない場合がありますが、ロボットは質問がどの分野に属するかを判断し、その分野の専門家を推奨できます。たとえば、質問がハードディスクに関するものであれば、ハードウェアの専門家が質問への回答者として推奨されます。コンサルタントと専門家の間の会話は保存され、さらなる機械学習のためのデータとして使用されます。 3 つ目は、最も一般的なインテリジェントな質問と回答です。コンサルタントが質問し、ロボットが知識ベースに基づいて直接回答します。

3つ目は、正確な障害位置特定システムです。これはSogouがこれまでに完了したプロジェクトです。 Sogou ビジネスにアクセスしているユーザーからアラームを受信した場合、それは Sogou の Web サイトの信頼性に問題があることを意味します。これまで、問題解決は経験と手作業による場所の特定に基づいて行われることが多かった。張波氏は、Sogou の現在のアプローチは、問題をルール テンプレートに抽出し、それを一連のルールに抽出し、特定のビジネス アーキテクチャ ダイアグラムに基づいて分析して、最終的に障害の具体的な原因を特定することだと述べました。

一般的なアルゴリズムでは、各プローブ要求に ID が付与され、この ID がすべてのモジュールで使用されます。 Sogou の運用保守担当者は、各モジュールのリクエスト ID のパフォーマンスを分析し、これらのルール テンプレートに基づいて、設定されたルール テンプレートにヒットするかどうかを確認します。次に、位置決めシステムは、これらのルール テンプレートのヒットに基づいて判断を行い、障害の位置を特定します。障害がどのモジュールとノードに属しているかを特定することもできるため、障害を迅速に処理できます。

これら 3 つのシステムは、張波氏と Sogou の運用保守担当者が、将来の運用保守の理想的な状態、つまり海に面していればすべて OK を実現するために行った努力の結果です。しかし、よく議論される問題に戻る必要があります。理想が実現した後はどうなるのでしょうか。運用と保守は、自ら作成した人工知能に置き換えられるのでしょうか?

この質問をすると、張波は笑みを浮かべた。彼がすでに意見を持っていることは明らかだった。張波は断固としてこう言った。「保守作業員の仕事が置き換えられることは絶対にありません!しかし、保守作業員の仕事の内容は質的に変化します。人工知能の出現前は、保守作業員の仕事は依然として手作業でした。しかし、インテリジェント保守作業員の出現後は、保守作業員はインテリジェント保守作業員エンジンの研究開発に責任を負い、エンジンをよりスマートで安定したものにします。したがって、人工知能の出現は保守作業員を失業させるだけでなく、保守作業のレベルアップにもつながります。結局のところ、強力なのは人工知能ではなく、これらの人工知能を開発する人々なのです。」

この見解は、リカレントニューラルネットワークの父であるドイツのコンピュータ科学者、ユルゲン・シュミットフーバーの見解と非常によく似ています。「人間は、これまで存在しなかった仕事を生み出すのが得意です。どの仕事がなくなるかを予測するのは難しくありませんが、将来どのような新しい仕事が生まれるかを予測するのは簡単ではありません。1980年代に、30年後にプロのビデオゲームプレイヤーやYouTubeスターとして何百万ドルも稼ぐ人がいると誰が想像したでしょうか。」

人工知能の概念がますます普及するにつれて、あらゆる分野の人々が人工知能を通じて人的資源を解放することを望んでおり、「機械が人間に取って代わる」ことに関する議論は終わりがありません。現在、人工知能の開発は、もともと機械的な反復的かつ大規模な計算タスクを解決することを目的としており、運用と保守はそのような高強度の作業領域です。これが、人工知能が最初に運用と保守の分野に適用される理由です。張波氏が述べたように、人工知能の登場は保守運用担当者に取って代わるためではなく、保守運用業務をアップグレードするためのものであり、保守運用担当者には自己アップグレードして時代の変化に対応するというより高い要求が課せられます。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  デルと中国科学院が共同で「人工知能と先端コンピューティングの共同研究室」を建設

>>:  Python 学習パス - Python スライス シミュレーション LRU アルゴリズム

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大型模型のレイアウトは何度も変わります!

ChatGPT の Android バージョンが登場します。 OpenAI は今年 5 月に早くも...

世界初の「自己複製」する生体ロボットが誕生。科学者たちの次なる目標とは?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Raspberry Pi を搭載した MIT のヤドカリ型ロボットは「何でもできる」

[[392157]]ロボットは通常、設計された特定のタスクを非常にうまく実行する特殊なツールですが、...

...

言語モデルの氷山の一角: 微調整は不要、AI21 Labs は凍結モデルの未開発の可能性を探る

現在、特定の NLP タスクのパフォーマンスを最適化するための最善のアプローチは、事前トレーニング済...

シュナイダーエレクトリックの革新力は、デジタル化と低炭素化の二重の変革を加速させる上でどのような役割を果たすのでしょうか。

デジタル変革の後半期に入る中、デジタルとリアルの融合をいかに加速し、グリーン・低炭素の発展へと向かう...

...

強化学習と世界モデルにおける因果推論

1. 世界モデル「世界モデル」という用語は認知科学に由来しており、認知科学ではメンタルモデルと呼ばれ...

C#アルゴリズムで解決した面接の質問

C# アルゴリズムはプログラマーの面接でよく出題されますが、C# アルゴリズムを使用してそれをどのよ...

安全な生産を守り、ロボット、IoTなどの技術サポートを提供します。

近年、世界的な工業化の加速を背景に、製造業、建設業、化学業などの産業を中心に労働災害や死亡者数が増加...

文字の組み合わせをソートするJavaアルゴリズム

Java の文字の組み合わせソートは、特に難しい問題ではありません。ブルートフォースとグラフ理論 (...

人工知能と機械学習が進化する10の方法

[[411678]]人工知能は現在、多くの CEO にとって最重要課題となっています。この話題は目新...

最新のMLPerfランキング:アリババのAIコンピューティングパワーが多くの分野で1位を獲得

4月7日、権威あるAIベンチマーク評価組織MLPerfが最新の推論パフォーマンスリストを公開した。 ...