いくつかのシンプルな負荷分散アルゴリズム

いくつかのシンプルな負荷分散アルゴリズム

負荷分散とは

負荷分散(英語名は Load Balance)とは、複数のサーバーを対称的に構成したサーバーセットを指します。各サーバーは同等のステータスを持ち、他のサーバーの支援なしに独立して外部にサービスを提供できます。何らかの負荷分散技術により、外部から送信されたリクエストは対称構造のサーバーに均等に分散され、リクエストを受信したサーバーはクライアントのリクエストに独立して応答します。ロード バランシングにより、クライアント要求をサーバー アレイに均等に分散できるため、重要なデータへの高速アクセスが可能になり、大量の同時アクセス サービスの問題が解決されます。このクラスター テクノロジにより、最小限の投資でメインフレームに近いパフォーマンスを実現できます。

負荷分散はソフトウェア負荷分散とハードウェア負荷分散に分かれます。前者はAlibabaの張文松博士が開発したLVSに代表され、後者はF5などのバランシングサーバーです。もちろん、これは言及しただけで、本質ではありません。

[[225437]]

この記事では、「外部から送られてきたリクエストを対称構造で均等にサーバーに分配する」ためのさまざまなアルゴリズムについて説明し、各アルゴリズムの具体的な実装を Java コードで示します。では、本題に入りましょう。本題に入る前に、IP リストをシミュレートするクラスを記述してみましょう。

ラウンドロビン

ポーリング方式はラウンドロビン方式で、そのコード実装はおおよそ次のようになります。

serverWeightMap のアドレス リストは動的であるため、マシンはいつでもオンラインになったり、オフラインになったり、クラッシュしたりする可能性があります。したがって、同時実行の問題を回避するために、メソッド内にローカル変数 serverMap が作成されます。serverMap の内容は、複数のスレッドによって変更されないように、スレッドにローカルにコピーされるようになりました。これにより、新たな問題が発生する可能性があります。レプリケーション後、serverWeightMap への変更は serverMap に反映されません。つまり、このサーバー選択ラウンドでは、負荷分散アルゴリズムは新しいサーバーまたはオフライン サーバーを認識しません。新しいアドレスを追加しても問題ありません。サーバーがオフラインまたはクラッシュしている場合は、存在しないアドレスにアクセスする可能性があります。したがって、サービス呼び出し元は、サーバーの選択と呼び出しの再開など、対応するフォールト トレラント処理を備えている必要があります。

現在のポーリング位置変数 pos については、サーバーの選択順序を保証するために、操作中にロックして、同時に 1 つのスレッドだけが pos の値を変更できるようにする必要があります。そうしないと、pos 変数が同時に変更された場合、サーバーの選択順序が保証されず、keyList 配列が境界を越える可能性もあります。

ラウンドロビン方式の利点は、リクエスト転送の絶対的なバランスを実現しようとすることです。

ポーリング方式の欠点は、リクエスト転送の絶対的なバランスを実現するために、かなりの代償を払わなければならないことです。POS 変数の変更の相互排他性を保証するために、重い悲観的ロック同期を導入する必要があり、これにより、このポーリング コードの同時スループットが大幅に低下します。

ランダム法

システムのランダム機能により、バックエンド サーバー リストのサイズに基づいて、バックエンド サーバーの 1 つがアクセス用にランダムに選択されます。確率統計の理論から、呼び出し回数が増えるにつれて、実際の効果は各バックエンド サーバーにトラフィックを均等に分散することにどんどん近づいていること、つまりポーリングの効果であることがわかります。

ランダム メソッドのコード実装は次のとおりです。

全体的なコードのアイデアはポーリング メソッドと一致しています。まず serverMap を再構築し、次にサーバー リストを取得します。サーバーを選択する際は、Random の nextInt メソッドを使用して 0 ~ keyList.size() の範囲でランダムな値を取得し、サーバーリストからサーバーアドレスをランダムに取得して返します。確率統計の理論に基づくと、スループットが大きいほど、ランダム アルゴリズムの効果がポーリング アルゴリズムの効果に近くなります。

送信元アドレスハッシュ方式

ソースアドレスハッシュの考え方は、クライアントがアクセスした IP アドレス値を取得し、ハッシュ関数を通じて値を計算し、この値を使用してサーバーリストのサイズに対してモジュロ演算を実行することです。結果は、アクセスされるサーバーのシリアル番号です。送信元アドレス ハッシュ アルゴリズムのコード実装は次のとおりです。

最初の2つの部分はポーリング方式とランダム方式と同じなので、詳細は説明しません。違いはルーティングの選択部分にあります。クライアントの IP、つまり remoteIp を通じて、そのハッシュ値を取得し、サーバー リストのサイズを法として計算します。その結果が、サーバー リスト内の選択されたサーバーのインデックス値になります。

ソース アドレス ハッシュ方式の利点は、バックエンド サーバー リストが変更されるまで、同じクライアント IP アドレスが同じバックエンド サーバーにハッシュされることが保証されることです。この機能に基づいて、サービス コンシューマーとサービス プロバイダーの間でステートフル セッションを確立できます。

ソース アドレス ハッシュ アルゴリズムの欠点は、クラスター内のサーバーが非常に安定していて、基本的にオンラインまたはオフラインにならない限り、サーバーがオンラインまたはオフラインになると、ソース アドレス ハッシュ アルゴリズムによってルーティングされたサーバーが、サーバーがオンラインまたはオフラインになる前にルーティングされたサーバーである確率が非常に低くなることです。セッションの場合はセッションが取得できず、キャッシュの場合は「雪崩」が発生する可能性があります。この説明が適切でない場合は、MemCache の非常に詳細な解釈である、一貫性ハッシュ アルゴリズムに関する部分を書いた私の以前の記事を読んでください。

加重ラウンドロビン

サーバーによってマシン構成や現在のシステム負荷が異なる場合があり、ストレス耐性も異なります。構成が高く負荷が低いマシンには、より多くのリクエストを処理できるように高い重みが割り当てられ、構成が低く負荷が高いマシンには、システム負荷を軽減するために低い重みが割り当てられます。加重ラウンドロビン方式はこの問題を適切に処理し、重みに応じてリクエストの順序をバックエンドに分散します。加重ラウンドロビン方式のコード実装は次のとおりです。

ポーリング方式と似ていますが、サーバー アドレスを取得する前に重み計算コードが追加されます。重みに応じて、アドレスはサーバー アドレス リストに繰り返し追加されます。重みが大きいほど、サーバーが各ラウンドで受信するリクエストが多くなります。

加重ランダム法

加重ラウンドロビン方式と同様に、加重ランダム方式でも、バックエンド サーバーのさまざまな構成と負荷条件に基づいて異なる重みが構成されます。違いは、順序ではなく重みに基づいてサーバーをランダムに選択することです。重み付けランダム法のコード実装は次のとおりです。

このコードはランダム方式と重み付けポーリング方式を組み合わせたものと同じです。わかりやすいので説明は省きます。

最小接続法

これまでの方法では、サービス コンシューマーのリクエスト時間をバランスよく分散させるために最善を尽くしてきました。もちろん、これは正しいです。複数のバックエンド サーバーのワークロードを均等に分散し、サーバーの使用率を最大化できます。しかし、これは本当にそうでしょうか?実際の状況では、リクエスト時間のバランスは本当に負荷のバランスを表すことができるのでしょうか?これは考える価値のある質問です。

上記の問題を別の観点から見ると、リクエストの開始者ではなく、バックエンド サーバーの観点からシステム負荷を観察することを意味します。最小接続数方式はこのカテゴリに属します。

最小接続数アルゴリズムは、より柔軟でインテリジェントです。バックエンド サーバーの構成が異なるため、リクエストの処理速度は速くなったり遅くなったりする場合があります。バックエンド サーバーの現在の接続状態に基づいて、現在のリクエストを処理するために接続バックログが最も少ないサーバーを動的に選択し、バックエンド サーバーの利用効率を最大化し、各マシンに負荷を合理的に分散します。最小接続数は、サーバー接続数の集計と認識を伴うため、設計と実装がかなり面倒です。そのため、ここでは実装については説明しません。

<<:  未来を検知する: 顔、指紋、虹彩、その他の生体認証技術、あなたはどれを支持しますか?

>>:  2018年世界大学AIランキングが発表、中国の大学が好成績!

ブログ    
ブログ    
ブログ    

推薦する

AIは「メイおばさん」を見つけられるのか?

[[283120]]インターネット全体が「メイおばさん」を探しているが、彼女が誰なのかは謎のままだ...

研究者:AIは将来「感情」を持つことが期待されており、関連する医療ハードウェア産業の発展に役立つ可能性がある

著名なAI研究者のジェフリー・ヒントン氏は、Googleを退職後、人工知能関連産業の研究に専念してい...

...

ハッカーはAIの顔を変える技術を使って就職活動を行っている。人工知能のセキュリティ問題は無視できない

米国での流行後、多くの企業が「在宅勤務」(WFH)モデルを採用しました。 FBIの刑事告訴センターは...

人工知能が新素材の研究開発を支援

現在、海外では人工知能が新素材の開発に役立っている事例が報告されています。英国リバプール大学の研究者...

企業がチャットボットの自然言語処理について学ぶべき理由は何ですか?

自然言語処理 (NLP) により、チャットボットは会話のメッセージを理解してそれに応じて応答できるよ...

AI、IoT、5Gの先進技術の背後にあるもの

代償なくして勝利はない。しかし、私たちはしばしばこのことを忘れ、即座の勝利を要求します。これは、世界...

李開復氏、ペントランド氏と会談:AIはワンマンショーではない、AI冷戦は避けるべき

最近、Sinovation Venturesの会長兼CEOであるKai-Fu Lee博士とAlex ...

今後 10 年間で人工知能が私たちの生活を支配するようになるとき、携帯電話はどのようなものになるでしょうか?

テクノロジー業界のほとんどの人は、今後 10 年以内にユビキタス テクノロジーが 1 日のあらゆる瞬...

AIは人間の編集者に代わる最初の試みに失敗した。WikipediaはCNET Mediaを信頼できる情報源とみなさなくなった

3月2日のニュースによると、数秒以内にニュース記事を生成することは、メディア業界にとって確かに非常に...

企業の75%が現在ChatGPTを無効化しているか、永久に無効化する予定である。

BlackBerry が発表した新しい調査によると、世界中の組織の 75% が現在、職場での Ch...

初心者のためのホームオートメーション完全ガイド

スマートホームはテクノロジーを活用して、居住者にさらなる利便性、節約、快適性、セキュリティを提供しま...

日本の警察は、AIを使って不審者の動きや表情を分析し、「一匹狼」犯罪に対処する予定

7月10日、日経中国版ウェブサイトの報道によると、日本の警察庁は早ければ年内にもAIによる捜査活動を...