図解 Raft コンセンサス アルゴリズム: リーダーを選出する方法

図解 Raft コンセンサス アルゴリズム: リーダーを選出する方法

[[393927]]

Raft は、リーダーを基準としてノード間のログの一貫性を実現するコンセンサス アルゴリズムです。Etcd、Consul など、ますます多くの分散システム フレームワークで使用されています。Seata も将来的に Raft を使用する予定です。今後の Kafka 2.8 でも Raft が導入され、Raft に基づいていくつかの改訂が行われます。Kafka 2.8 では KRaft と呼ばれています。

この観点から見ると、Raft はほとんどの分散システムに適したコンセンサス アルゴリズムです。Raft を学習すると、分散分野で成功するのに役立ちます。

この記事の主な内容は、Raft リーダー選出についての私の理解の要約です。

メンバー

私の理解する限り、Raft は強力なリーダー モデルです。つまり、すべてがリーダーに基づいており、各ノードの一連のコンセンサスとログの一貫性を実現するコンセンサス アルゴリズムです。

Raft には、リーダー、フォロワー、候補者の 3 つのメンバーシップ ID があります。

フォロワー: Raft では、リーダーのみがクライアントと対話します。したがって、選出が行われない場合、フォロワーはリーダーから送信されたメッセージを黙って処理し、データの冗長性として機能します。リーダーのハートビートがタイムアウトすると、フォロワーは自分自身を候補者として積極的に推奨します。

候補者: 候補者になると、他のノードに投票要求メッセージを送信し、他のノードからの投票を取得します。過半数の投票を獲得すると、リーダーとして選出されます。

リーダー: すべてのデータはリーダーの管轄下にあります。リーダーは、クライアントと対話し、リクエストを処理し、ログのレプリケーションを管理し、フォロワーにハートビート情報を継続的に送信し、フォロワー ノードのタイムアウトを常に更新してフォロワーが新しい選出を開始できないようにする唯一の役割でもあります。

選挙プロセス

以下に、新しく初期化された Raft クラスターを例に挙げます。

1. 初期状態

初期化後の各 Raft ノードのハートビート タイムアウトはランダムです。上記のように、ノード C はタイムアウトが最も短く (120 ミリ秒)、ターム番号は 0、役割はフォロワーです。

2. 投票をリクエストする

この時点では、どのノードもリーダーではありません。ノードはハートビートのタイムアウトを待った後、自分自身を候補として推薦し、クラスター内の他のノードに投票情報を要求します。この時点で、ターム番号は +1 であり、自己推薦は独自の投票を取得します。

3. フォロワーの投票

投票依頼情報を受け取った後、候補者が投票要件を満たしていれば、フォロワーはその候補者に貴重な一票を投じ(各任期においてフォロワーは最初の候補者にしか投票できず、後の候補者は投票できないため)、同時に任期番号を更新します。

4. 選出されたリーダー

ノード C が過半数の票を獲得すると、そのノードがこの任期のリーダーになります。

5. リーダーとフォロワーは心を通わせる

リーダーは定期的にハートビート メッセージを他のノードに送信して、自分がリーダーであることを通知し、フォロワーが新しいリーダーの選出を開始するのを防ぐためにフォロワーのタイムアウトを更新します。

用語について

上記の選挙プロセスから、Raft の選挙には任期メカニズムがあることがわかります。名前が示すように、各リーダーには独自の任期があります。リーダーが交代すると、任期も長くなります。Raft の任期では、次の詳細に注意する必要があります。

ノードは、自身のターム番号が他のノードのターム番号よりも小さいことがわかった場合、自身のターム番号を自身のターム番号よりも大きい値に更新します。

上記の選挙プロセスから、自分自身を候補者として指名するたびに、自分自身の投票が得られることがわかります。

候補者またはリーダーは、自分のターム数が他のノードよりも小さいことに気付いた場合、すぐにフォロワーに更新されます。これは非常に重要です。私が理解している限り、このメカニズムは、複数のリーダーが同時に存在する状況を解決できます。たとえば、リーダー A がハングアップした後、クラスター内の他のノードは新しいリーダー B を選出します。ノード B が回復すると、新しいリーダーからハートビート メッセージを受信し、ノード A はすぐにフォロワー状態に戻ります。

ノードが自身のターム番号よりも小さいターム番号のリクエストを受信した場合、そのリクエストは拒否されます。

ランダムタイムアウトについて

フォロワーが一定時間内にリーダーからハートビートを受信しない場合、新しいリーダー選挙ラウンドが開始されます。すべてのフォロワーが同時にリーダー選挙を開始した場合を想像してください。これはどのようなシナリオでしょうか? 同時に選挙が混乱するでしょうか? 選挙が同時に開始された場合、票が分散して選挙は失敗しますか?

Raft の選択プロセスを自分でデバッグして観察したい場合は、次の Web サイトにアクセスしてください。

ラフト

この記事はWeChatの公開アカウント「Backend Advanced」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Backend Advanced Public Account にお問い合わせください。

<<:  ElasticSearch はどのようにして TDigest アルゴリズムを使用して数十億のデータのパーセンタイルを計算するのでしょうか?

>>:  ドローンが田舎に飛来、その価値は想像もできない

ブログ    

推薦する

...

...

世界ロボット会議は、未来がここにあることを伝えます。

「リラックスして、直立不動で、右を向いてください!」司会者の指示に従い、一列に並んだロボットが一斉...

ビッグデータとリアルタイム分析のためのアルゴリズム分類

今日、ビッグデータ技術の発展と進歩により、大量のデータを収集および送信するための新しい、より効率的な...

...

AI Factory がコンセプトから産業化まで迅速かつ安全に移行する方法

[[374390]]人工知能 (AI) は、組織によって競争上の優位性を獲得するための重要なテクノロ...

機械学習プロジェクトが失敗する9つの理由

この記事では、データ サイエンス プロジェクトが失敗する最も一般的な理由をまとめ、落とし穴を回避する...

人工知能がブルーカラーの仕事に取って代わると、どのような影響があるでしょうか?

AI と ML をより多くのタスクに統合すると、短期的には多くのメリットが得られますが、長期的には...

...

人間と人工知能がどのように関係を築くか

人間関係を構築するのに優れているのは人間か人工知能か?実際、この革新的な技術は長い間存在していました...

...

...

機械学習の参入障壁が下がり、機械学習エンジニアのポジションがなくなる可能性も

機械学習エンジニアチームの責任者であり、Looker の最高製品責任者でもある彼は、10 年を超える...

...