フレームワーク: 分散理論 CAP、BASE

フレームワーク: 分散理論 CAP、BASE

[[403371]]

この記事はWeChatの公開アカウント「Sneak Forward」から転載したもので、著者はcscwです。この記事を転載する場合は、Qianxingqianxing の公開アカウントにご連絡ください。

序文

事業が拡大するにつれて、どんどん機能が追加されていきます。すべての機能を同じサービス下に置くと、コードが混在し、メンテナンスが困難になります。小さなバグが原因でサービス全体が利用できなくなることもよくあります。そこで、業務機能に応じて複数の異なるサービスに分割します(マイクロサービス化)。複数のサービスから構成されるシステムは、「分散システム」という別名を持っています。システム内でサービスステータスをどのように管理するのでしょうか?関連する理論は何ですか?

  • 分散型とクラスター型
  • データベーストランザクション
  • 分散トランザクション
  • 分散データの一貫性
  • CAP理論
  • ベース理論

分散型とクラスター型

分散とは、ネットワークを介して接続され、情報を交換することで連携する複数のサービスまたはコンポーネントによって形成されるシステムを指します。

クラスターは、同じサービス コンポーネントの複数のインスタンスの集合です。

これら 2 つの概念は完全に矛盾するものではなく、分散システムはクラスターになることもできます。 Zookeeper クラスターも分散システムであり、そのサービスは相互に通信して連携します。

クラスターは分散システムではありません。たとえば、複数の負荷分散された HTTP サーバーは相互に通信しません。負荷分散されていない場合は、分散システムとは言えません。

データベーストランザクション

  • トランザクションはデータ操作に基づいており、通常はトランザクション データがデータベースに保存されるようにする必要があります。したがって、トランザクションを導入するときは、データベース トランザクションの ACID 特性を導入する必要があります。
  • 原子性: トランザクション全体のすべての操作は完了するか、まったく完了しないかのいずれかであり、途中のリンクで操作が停止することは不可能です。
  • 一貫性: トランザクションの開始前と終了前、および終了後にデータベース データの一貫性制約に違反しません。
  • 分離: 分離により、複数のトランザクションが同時に実行されるときに、相互実行によって発生するデータの不整合を防ぐことができます。
  • 耐久性: トランザクションが完了すると、データへの変更は永続的になり、システムに障害が発生しても失われません。

分散トランザクション

分散システムは一般に複数の独立したサブシステムで構成され、ネットワーク通信を通じて相互に連携してさまざまな機能を実行します。このコラボレーション プロセスでは、各システムのデータの一貫性を確保する必要があります。このシステム間トランザクションを分散トランザクションと呼びます。

上記のシナリオには複数のケースがあります。在庫サービスと注文サービスの両方が成功します。あるいは、在庫サービスと注文サービスは部分的に成功しているが、従来の単一マシントランザクション理論はもはや適用されない。

分散トランザクションの難しさ

原子性: トランザクション操作は異なるノードにまたがります。複数のノードのうちの 1 つでの操作が失敗した場合、複数のノードでの操作が何も実行されないか、すべて実行されるようにする必要があります。

一貫性: ネットワーク伝送障害またはノード障害が発生すると、ノード間のデータ複製チャネルが中断され、トランザクション操作中にデータの一貫性を確保する必要があります。

分離: 分散トランザクション制御では、非同期送信が発生し、「部分的に送信された」トランザクションが表示される場合があります。

分散データの一貫性

ACID は分散トランザクションには適していません。分散トランザクションの難しさには、最終的にデータの不整合につながる問題が伴います。したがって、分散システムでは、システムの一貫性を確保することに重点が置かれます。

CAP理論

  • 上で述べた分散トランザクションの難しさには、最終的にデータの不整合につながる問題が伴います。以下では、分散システムの一貫性の問題を理論的に分析し、これらの理論に基づいて分散ソリューションを紹介します(可用性と一貫性の対立:CAP理論)
  • 一貫性: すべてのノードが最新かつ同一のデータコピーにアクセスする
  • 可用性: 障害のないノードは、妥当な時間内に妥当な応答を返します (エラーやタイムアウトではありません)
  • パーティション耐性: 分散システムがパーティション化された場合でも、外部にサービスを提供し続けることができます。

ネットワークパーティションが発生した場合、サービスの提供を継続するには、強力な一貫性と可用性のどちらかを選択するしかありません。つまり、ネットワーク分割後は P が前提条件となり、P が決定された後にのみ C と A を選択できます。つまり、パーティション耐性を実現する必要があります。

なぜ同時に CA を保証できないのでしょうか?

システムが「パーティション分割」されている場合、システム内のノードが書き込み操作を実行しています。一貫性 C を確保するには、他のノードの読み取りおよび書き込み操作を禁止する必要がありますが、これは A と競合します。 A を保証するために他のノードの読み取りおよび書き込み操作が正常である場合、データの一貫性は保証できず、C と矛盾します。

CAP実践事例

ZooKeeper は CP を保証します。 ZooKeeper への読み取り要求はいつでも一貫した結果を得ることができますが、ZooKeeper は各要求の可用性を保証するものではありません。たとえば、リーダー選出プロセス中や、マシンの半分以上が使用できない場合は、サービスを利用できません。

EurekaはAPを保証します。 Eureka は A (可用性) を優先するように設計されています。 Eureka にはリーダー ノードはありません。すべてのノードは同じであり、平等です。したがって、Eureka は、選出プロセス中にサービスが利用できなくなったり、マシンの半分以上が利用できなくなったりする ZooKeeper のような状態になりません。 Eureka は、ほとんどのノードに障害が発生した場合でも、1 つのノードが利用可能である限り、サービスの通常の提供に影響が及ばないことを保証します。ただし、このノード上のデータは最新ではない可能性があります。

ベース理論

BASE は、Basically Available (基本的に利用可能)、Soft-state (ソフトステート)、Eventually Consistent (最終的に一貫性がある) の略です。 BASE 理論は、CAP における一貫性 (C) と可用性 (A) のトレードオフの結果です。

結果的一貫性は、弱い一貫性の特殊なケースです。システムは、一定期間内にデータの一貫性状態が達成されることを保証します。

基本的な使いやすさ

基本的な可用性とは、分散システムで予期しない障害が発生した場合に、ある程度の可用性が失われることが許容されることを意味します。では、可用性をいくらか失うことを許可するということはどういう意味でしょうか?

応答時間の損失: 通常、ユーザー要求を処理して結果を返すのに0.5秒かかりますが、システム障害により、ユーザー要求の処理時間は3秒になります。

システム機能の損失: 通常の状況では、ユーザーはすべてのシステム機能を使用できますが、システムトラフィックの急増により、システムの一部のコア以外の機能が使用できなくなります。

ソフトステート

ソフト状態とは、システム内のデータが中間状態(CAP 理論におけるデータの不整合)を持つことが許可され、この中間状態の存在がシステム全体の可用性に影響を与えないと考えられる状態、つまり、異なるノード上のデータ コピー間でデータを同期するプロセスで遅延が発生することがシステムで許可されている状態を意味します。

最終的な一貫性

最終的な一貫性は、システム内のすべてのデータ コピーが、同期期間の後に最終的に一貫した状態に到達できることを強調します。したがって、最終的な一貫性の本質は、システム データの強力な一貫性をリアルタイムで保証する必要はなく、最終的なデータの一貫性をシステムが保証する必要があることです。

参考文献

CAP理論とBASE理論をご存知ですか?実際の例を挙げて説明していただけますか?

ディストリビューションとクラスターの違いは何ですか?[1]

データの一貫性の問題[2]

<<:  アリババは、脆弱なネットワークの「ラストマイル」を埋めるために独自の次世代ネットワークプロトコルXLINKを開発しました。

>>:  Redis に基づく分散ロックと Redlock アルゴリズム

推薦する

エッジコンピューティングとその進化

エッジ コンピューティングは、ネットワーク化された世界に大きな変化をもたらしている新たなパラダイムで...

クモとうまく付き合う方法

これら 3 つの領域で私たちができることのリストは次のとおりです。最初のステップは、検索エンジンのス...

クラウドネイティブセキュリティは必須ですか?

ビジネスの継続性を確保するために、クラウドの導入においてベスト プラクティスに従う必要がある理由につ...

SEOトラフィックを現金に変える方法についての簡単な説明

ウェブサイト SEO の最終的な目標は収益を上げることであり、ウェブサイトのランキングを向上させるこ...

マヤ人は信頼できるでしょうか? 信頼できる場合は、キーワードランキングがホームページに表示されます。

これから過ぎ去ろうとしている年は、残酷で寒い年だと思っています。6月、8月、11月の数字は、すべての...

クラウドネイティブの進歩は開発者にさらなる可能性をもたらす

[[406118]]背景クラウド ネイティブは、クラウド コンピューティングの発展の必然的な産物であ...

フレンドリーリンクを作成する際の注意点

フレンドリーリンクは、外部リンクの中でも比較的重み付けの高いインバウンドリンクであり、ランキングの向...

ウェブサイトの掲載に影響する要因

なぜ私のサイトは掲載されないのでしょうか? Baidu が私のサイトを掲載するのはなぜこんなに難しい...

2018年の陰謀論? Docker Inc とマイクロサービスの終焉!

今月初め、「Docker, Inc. は死んだ」という記事で、Docker, Inc. は 2018...

Alibaba Cloud International Editionは実名登録が不要で、USDTやその他の外貨をサポートし、購入時に価格割引を受けることができます。

市場シェア1位のAlibaba Cloudは、クラウドサーバー、データベース、ネットワークCDN、ネ...

Ghost の脆弱性を修正しましょう!

Qualys は最近、Linux の脆弱性「CVE--0235」を発見し、発表しました。ほとんどの人...

ウェブサイトのキーワードランキングをできるだけ安定させる方法

みなさんこんにちは。ハルビンバーチャルアンドリアルウェブサイトデザインです。最近、百度6.22と6....

スナップショットの更新が遅い問題を解決する方法

多くのウェブサイト最適化担当者は、ウェブサイトのスナップショットが更新されない状況に遭遇したことがあ...

Xiaoshengのウェブサイト最適化プロセス

毎日ウェブサイトでニュースを更新し、外部リンクを公開し、数百のリンクを公開していると常に考えている企...