図解 Raft コンセンサス アルゴリズム: リーダーを選出する方法

図解 Raft コンセンサス アルゴリズム: リーダーを選出する方法

[[393927]]

Raft は、リーダーを基準としてノード間のログの一貫性を実現するコンセンサス アルゴリズムです。Etcd、Consul など、ますます多くの分散システム フレームワークで使用されています。Seata も将来的に Raft を使用する予定です。今後の Kafka 2.8 でも Raft が導入され、Raft に基づいていくつかの改訂が行われます。Kafka 2.8 では KRaft と呼ばれています。

この観点から見ると、Raft はほとんどの分散システムに適したコンセンサス アルゴリズムです。Raft を学習すると、分散分野で成功するのに役立ちます。

この記事の主な内容は、Raft リーダー選出についての私の理解の要約です。

メンバー

私の理解する限り、Raft は強力なリーダー モデルです。つまり、すべてがリーダーに基づいており、各ノードの一連のコンセンサスとログの一貫性を実現するコンセンサス アルゴリズムです。

Raft には、リーダー、フォロワー、候補者の 3 つのメンバーシップ ID があります。

フォロワー: Raft では、リーダーのみがクライアントと対話します。したがって、選出が行われない場合、フォロワーはリーダーから送信されたメッセージを黙って処理し、データの冗長性として機能します。リーダーのハートビートがタイムアウトすると、フォロワーは自分自身を候補者として積極的に推奨します。

候補者: 候補者になると、他のノードに投票要求メッセージを送信し、他のノードからの投票を取得します。過半数の投票を獲得すると、リーダーとして選出されます。

リーダー: すべてのデータはリーダーの管轄下にあります。リーダーは、クライアントと対話し、リクエストを処理し、ログのレプリケーションを管理し、フォロワーにハートビート情報を継続的に送信し、フォロワー ノードのタイムアウトを常に更新してフォロワーが新しい選出を開始できないようにする唯一の役割でもあります。

選挙プロセス

以下に、新しく初期化された Raft クラスターを例に挙げます。

1. 初期状態

初期化後の各 Raft ノードのハートビート タイムアウトはランダムです。上記のように、ノード C はタイムアウトが最も短く (120 ミリ秒)、ターム番号は 0、役割はフォロワーです。

2. 投票をリクエストする

この時点では、どのノードもリーダーではありません。ノードはハートビートのタイムアウトを待った後、自分自身を候補として推薦し、クラスター内の他のノードに投票情報を要求します。この時点で、ターム番号は +1 であり、自己推薦は独自の投票を取得します。

3. フォロワーの投票

投票依頼情報を受け取った後、候補者が投票要件を満たしていれば、フォロワーはその候補者に貴重な一票を投じ(各任期においてフォロワーは最初の候補者にしか投票できず、後の候補者は投票できないため)、同時に任期番号を更新します。

4. 選出されたリーダー

ノード C が過半数の票を獲得すると、そのノードがこの任期のリーダーになります。

5. リーダーとフォロワーは心を通わせる

リーダーは定期的にハートビート メッセージを他のノードに送信して、自分がリーダーであることを通知し、フォロワーが新しいリーダーの選出を開始するのを防ぐためにフォロワーのタイムアウトを更新します。

用語について

上記の選挙プロセスから、Raft の選挙には任期メカニズムがあることがわかります。名前が示すように、各リーダーには独自の任期があります。リーダーが交代すると、任期も長くなります。Raft の任期では、次の詳細に注意する必要があります。

ノードは、自身のターム番号が他のノードのターム番号よりも小さいことがわかった場合、自身のターム番号を自身のターム番号よりも大きい値に更新します。

上記の選挙プロセスから、自分自身を候補者として指名するたびに、自分自身の投票が得られることがわかります。

候補者またはリーダーは、自分のターム数が他のノードよりも小さいことに気付いた場合、すぐにフォロワーに更新されます。これは非常に重要です。私が理解している限り、このメカニズムは、複数のリーダーが同時に存在する状況を解決できます。たとえば、リーダー A がハングアップした後、クラスター内の他のノードは新しいリーダー B を選出します。ノード B が回復すると、新しいリーダーからハートビート メッセージを受信し、ノード A はすぐにフォロワー状態に戻ります。

ノードが自身のターム番号よりも小さいターム番号のリクエストを受信した場合、そのリクエストは拒否されます。

ランダムタイムアウトについて

フォロワーが一定時間内にリーダーからハートビートを受信しない場合、新しいリーダー選挙ラウンドが開始されます。すべてのフォロワーが同時にリーダー選挙を開始した場合を想像してください。これはどのようなシナリオでしょうか? 同時に選挙が混乱するでしょうか? 選挙が同時に開始された場合、票が分散して選挙は失敗しますか?

Raft の選択プロセスを自分でデバッグして観察したい場合は、次の Web サイトにアクセスしてください。

ラフト

この記事はWeChatの公開アカウント「Backend Advanced」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Backend Advanced Public Account にお問い合わせください。

<<:  ElasticSearch はどのようにして TDigest アルゴリズムを使用して数十億のデータのパーセンタイルを計算するのでしょうか?

>>:  ドローンが田舎に飛来、その価値は想像もできない

ブログ    

推薦する

...

...

マイクロソフトが人工知能の小規模スタートアップBonsaiを買収

海外メディアの報道によると、マイクロソフトは水曜日、小規模な人工知能スタートアップ企業であるボンサイ...

米国はドローンに「ナンバープレート」を発行する

[[373346]]米国連邦航空局(FAA)は月曜日、小型ドローンの夜間飛行を許可すると発表した。新...

...

DAMOアカデミーが音声AIの新たな進歩を発表:モバイル端末でも実際の人間に近い音声対話体験を実現可能

DAMOアカデミーは9月18日、2020年雲奇大会において、音声AI技術の最新のブレークスルーを発表...

Nature の最新表紙: 2 つの主要な数学の問題が AI によって解決されました!ディープマインドYYDS

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

保存しておくべき機械学習チートシート 27 選

機械学習にはさまざまな側面があり、調査を始めたときに、特定のトピックの要点を簡潔にリストしたさまざま...

GoはPythonよりはるかに進んでおり、機械学習の人材は非常に不足しています。世界中の16,655人のプログラマーが真実を語ります

Go は開発者の間でますます人気が高まっています。数年前、Didiのエンジニアから、DidiではGo...

...

人工知能の分野は大きな需要があり、金融​​人材の将来性は有望である

[[408300]]重慶ビジネスデイリー・商油新聞記者が本について語る大学入試願書を記入中です。専攻...

健康コードがないと旅行するのは難しいですか?顔認識により健康コードのバリアフリー利用が可能に

「公共交通機関では健康コードの提示が求められますが、提示できない場合はどうすればよいですか?」予防と...