分散型 Kv-2 ラフトリーダー選出の実装

分散型 Kv-2 ラフトリーダー選出の実装

[[441163]]

この記事から、raft をベースに分散 KV を構築していきます。

Raft は、分散システム内の各ノードのデータの一貫性を主に保証する分散一貫性アルゴリズムです。ラフト アルゴリズムは、それが解決する分散一貫性問題が本質的に難しい問題であるため、比較的複雑です。ラフト アルゴリズムの実装は、次の 3 つの部分に分けられます。

  • リーダー選挙
  • ログのレプリケーション
  • 安全

ラフト アルゴリズムに詳しくない場合は、次の Web サイトでアニメーションを視聴できます。

http://thesecretlivesofdata.com/raft

ラフト アルゴリズムが直面する問題と、ラフト アルゴリズムが問題を解決する基本的なプロセスを鮮明に示します。

もちろん、ラフトアルゴリズムに関する論文も参照する価値があります。

https://github.com/maemual/raft-zh_cn

また、インターネット上でラフト アルゴリズムに関する優れた一連の記事も見つけました。

https://www.codedump.info/post/20180921-raft

https://blog.betacat.io/post/raft-implementation-in-etcd

これらの資料を読んだ後、ラフト アルゴリズムの概要を理解し、それを具体的に実装する方法がわかるようになります。

この記事では、TinyKV のプロジェクト 2aa に対応する最初のリーダー選出問題のみを紹介します。

ラフト クラスターでは、ノードはフォロワー、候補、リーダーの 3 つの状態に分かれています。ノードの初期状態はフォロワーです。

フォロワー ノードは、自身のステータスを維持するために、リーダーのハートビート情報を定期的に取得する必要があります。 Follower ノードにはタイムアウト (ElectionTimeout) があります。この期間中にリーダーからハートビート メッセージを受信しない場合、クラスター内にリーダーが存在しないものと見なし、選出を開始します。

選挙の具体的な手順:

上図に示すように、ノード A の選挙タイムアウトが最初に到来するため、ノード A はステータスを候補に変更し、任期数を 1 増やします (図の初期任期数は 0 で、追加後は 1 になります)。その後、ノード A 自身に投票し、ノード B と C に投票要求メッセージを送信します。

ノード B と C は、自分の用語数が A より小さいことに気付くため、A に承認票を投じます。応答を受信した後、ノード A は投票数がノード数の半分を超えているかどうかを計算します。そうであれば、それがリーダーになります。

上記はリーダー選挙の最も理想的な状況を説明しています。厳密に言えば、候補ノードが選挙を開始した後、次のいずれかの状況が発生するまでステータスを維持する必要があります。

  • 選挙自体に勝利した
  • 他のノードが選挙に勝利した
  • 選挙のタイムアウトが到来し、どのノードもリーダーになれない

最初のケースは、上で説明した選挙プロセスです。自ら選挙を開始し、半数以上のノードの投票を獲得すると、リーダーになります。

2 番目のケースでは、選挙プロセス中に別のノードが候補になり選挙に勝利した場合、そのノードは新しいリーダーから AppendEntry RPC メッセージを受信し、新しいリーダーの任期数が自身の任期数より大きい場合、そのリーダーを有効と見なし、自身をフォロワーに変更します。

3 番目のケースは、選挙で負けることも勝つこともないノードに対応します。これは、クラスター ノードの数が偶数で、2 つのノードが同時に選出を開始した場合に発生する可能性があり、その場合、選出は無効になります。選挙のタイムアウトが再び到来し、まだ新しいリーダーがいない場合は、候補者が新たな選挙ラウンドを開始します。

具体的なコード実装については、まず、初期ロジックは外側のレイヤーによって呼び出される tick 関数にあります。ノードの選挙タイムアウトが到来したかどうかを判断する必要があります。もしそうなら、選挙を開始する必要があります。

  1. // tick は内部論理クロック1 ティック進めます。
  2. func (r *Raft) tick() {
  3. // ここにコードを記述します (2A)。
  4. スイッチr.State{
  5. ケースStateLeader:
  6. // ...
  7. StateFollower、StateCandidateの場合:
  8. r.electionElapsed++ 選挙経過日数
  9. r.electionElapsed >= r.electionTimeout の場合 {
  10. // 新しい選挙を開始する
  11. r.startElection()
  12. }
  13. }
  14. }

選挙を開始し、自分自身を候補者(任期番号 + 1)に変更し、自分自身に投票します。次に、他のノードに MsgRequestVote メッセージを送信する必要があります。

MsgRequestVote メッセージには、現在のノードの最後のログのインデックスと用語を含める必要があります。これにより、フォロワーはノードのログが最新であるかどうかを判断できます。

MsgRequestVote メッセージを受信すると、他の Follower ノードが処理を開始します。処理時に注意すべき点がいくつかあります。

  • メッセージの期間数が自身の期間より小さい場合は、メッセージを直接拒否します。
  • メッセージの期間が自分の期間よりも長い場合は、フォロワーに変更して(フォロワーでない場合)、期間を更新する必要があります。
  • メッセージの用語番号とインデックス番号をチェックする必要があります。メッセージのログが最新でない場合は、メッセージを拒否します。

すべてのチェックに合格すると、フォロワー ノードは賛成票を投じ、候補ノードに MsgRequestVoteResponse メッセージを送信します。

MsgRequestVoteResponse メッセージを受信した後、候補者ノードは投票結果を記録し、投票が次の条件を満たすかどうかを計算する必要があります。

  • 拒否票の数がノード数の 1/2 を超えると、選出は失敗し、候補ノードはフォロワー状態に変わります。
  • 賛成票数がノード数の半分を超えると、選挙は成功します。

選出が成功した場合、自身のステータスをリーダーに変更し、他のノードが引き続き選出を開始するのを防ぐために、空のデータ エントリを含む MsgAppend メッセージを他のノードに送信する必要があります。

追伸具体的なコード実装については、etcd の raft を参照し、それに基づいて TinyKV に手動でコードを実装してください。

<<:  「チャイナクラウド」は世界一?もっと深く掘り下げてください!

>>:  クラウドコスト管理だけではクラウド支出の問題を解決できない理由

推薦する

ウェブサイトの降格の理由と解決策

ウェブサイトを構築しているときに、ランキングが 40 位から 80 位に上がったのに、突然ランキング...

ウェブサイト構築会社が低価格の競合他社に勝つ方法

ウェブサイト構築市場には、多数の低価格ウェブサイトが溢れています。これらの低価格の競合企業は同業他社...

Inspur Cloudは、政府機関や企業の顧客がデジタル変革を実現できるよう、分散型クラウドの構築を目指しています。

企業のデジタル変革が加速するにつれ、デジタルベースのビジネスアプリケーションシナリオはますます複雑に...

新しい状況下で、ウェブマスターはどのようにして現場構築をマスターするのでしょうか?

「外部リンクが王様、コンテンツが王様」という最適化の時代に別れを告げ、多くのウェブマスターは百度の相...

中国のクラウドコンピューティング戦争:外国のクラウドの衰退の簡単な歴史

現在、Amazon AWSやMicrosoft Cloudなど、国際市場で猛威を振るうクラウドベンダ...

2020年のトレンド予測: SaaSモデルが企業のデジタル化の第一選択肢に

2019 年が終わりに近づき、2020 年は新たな旅の始まりです。振り返ってみると、エンタープライズ...

クラウド コンピューティングと DevOps の組み合わせがソフトウェア配信の成功を促進する方法

[[203636]]世界経済とあらゆる業界で、企業は顧客が次に何を求めているかをより正確に察知し、競...

ウェブマスターネットワークからの毎日のレポート:電子商取引税は世界的な問題です。FirefoxがiOSプラットフォームから撤退

1. 「電子商取引税」をめぐる議論:存続と公平性のどちらが重要か?オンラインストアへの課税は新しい話...

テンセントクラウドAIとそのパートナーは、5つの主要なアップグレードで産業用インターネットの構築に協力しています。

5月22日、テンセントデジタルエコシステムカンファレンスのAIセッションで、テンセントクラウドはビッ...

stockservers: 月額 3.98 ドル、32 TB の高トラフィック VPS、KVM 仮想化/2 GB メモリ/2 コア/30 GB NVMe

2011年4月に設立されたホスティング会社であるstockserversは、現在、ドイツ(Hetzn...

有名なインターネット内部告発者、周露波が恐喝容疑で起訴された

22日、ネット上で有名な内部告発者、周露波氏が江蘇省昆山市人民検察院に起訴された。検察は、彼が他人か...

Nutanix が Minmetals Securities の金融ハイブリッド クラウド 2.0 への移行を支援

Nutanixは本日、中国で最も急成長している証券会社の1つであるMinmetals Securit...

プログラマーは年老いていますが、まだコードを書くことができますか?経験はコードが良いかどうかを判断する最も重要な要素です

IT業界は低年齢層向けの業界だと多くの人が考えています。白髪の老人は「プログラマー」という言葉に縁が...

企業ブランドと上司の個人ブランド、どちらが重要ですか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業として...