多くのパブリック クラウド プロバイダーは、日常業務で壊滅的な停止を頻繁に経験しており、IT マネージャーはクラウド プラットフォームの障害と教訓から学び、それを社内のインフラストラクチャに適用する必要があります。 クラウド プラットフォーム、特に大規模なパブリック プラットフォームには複数レベルの冗長性が備わっていますが、予期しないダウンタイムの影響を受けないプラットフォームはありません。データ センターなどのクラウド コンピューティング プラットフォームでは、ダウンタイムの原因となる問題が発生する可能性があります。
オンプレミスのハードウェア障害やソフトウェア エラーは避けられませんが、パブリック クラウドは IT 管理者にこれらの問題に対処する方法を提供します。パブリック クラウドには、可用性クラスター、冗長データ センター、可用性ゾーン、クラウド リージョンが備わっており、管理者は中断が発生した場合でもビジネス オペレーションをより適切に計画できます。これらの戦略は重要ですが、管理者はパブリック クラウドの冗長性機能を活用するために信頼性の高いアプリケーションを設計する必要があります。 組織の IT 資産の回復力はインフラストラクチャよりもアプリケーションに依存するという考え方は、従来の考え方とは異なります。過去 20 年間、管理者はバックアップ、レプリケーション、その他のインフラストラクチャ中心のテクノロジーを通じて回復力を維持してきました。しかし、ほとんどのパブリック クラウド プラットフォームでは、この戦略はもはや機能しません。 近年、クラウド コンピューティング プロバイダーは耐えられないほどの損失を被っています。クラウド プロバイダーとユーザーの両方が、障害発生時にローカル クラウドの冗長性を設計する方法を学んでいるようで、管理者はそれらの教訓を従来の仮想化データ センターの冗長性に適用したいと考えています。 データセンターの冗長性の再考 ほとんどの従来の組織では、いくつかの基本的なサービスはダウンタイムを防ぐために設計されています。ネットワーク タイム プロトコルやネットワーク ルーティングなどのサービスは、多くの場合、高度な冗長性を備えるように設計されます。ただし、システムが冗長性を備えているからといって、その構成が自然な冗長性を十分に活用できるようになっているわけではありません。 一部のコア サービスには高可用性オプションがありません。 IT 部門は、ほとんどの場合、対処しなければならない技術的負債に直面しており、理想的に動作していないレガシー システムのサポートが必要になります。たとえば、一部のレガシー アプリケーション認証システムはサーバー上にのみ存在できるため、データ センターの冗長性が制限されます。 経営者はすべての卵を一つのカゴに入れるべきではありません。ほとんどの従来の展開では、データセンター内で冗長ハードウェアを使用するのが最適です。管理者は、複数の可用性ゾーンを提供できるクラウド コンピューティング プロバイダーと同様に、システムを共有しない冗長仮想化クラスターを使用することで、この戦略をさらに進めることができます。これにより、アプリケーションはデータ センター内のより高いレベルの冗長性に依存するようになりますが、ビジネス ニーズがそのレベルの冗長保護を正当化する場合にのみ価値があります。 これらの戦略をクラウドとデータセンター全体で並行して実装することで、可用性ゾーンなどのパブリック クラウド プロバイダーの概念を使用すると、同様の従来のインフラストラクチャを採用するときに役立ちます。この用語を使用すると、開発者は同様のクラウドの概念に精通している可能性があるため、インフラストラクチャの概念を理解しやすくなります。 クラウドコンピューティングの冗長性は完璧ではなく、ダウンタイムから教訓が得られる 高度に冗長化されたシステムでも、パフォーマンスの低下は避けられません。最近のパブリック クラウドの障害により、カタログ サービスが 1 つのリージョンから別のリージョンへのサービスの実行を継続できなくなりました。リダイレクトされたトラフィックが他のエリアの容量を超え、サービスが需要を満たすことができなくなります。 管理者がデータ センターの冗長性を設計する場合、停止が発生した場合の負荷を計画する必要があります。管理者はデータ センターの冗長性をサポートするために 2 台のサーバーを所有しているかもしれませんが、そのうちの 1 台のサーバーでは負荷全体を処理できない可能性があります。重要なのは、通常時と異常時のビジネスニーズを満たすシステムを設計することです。 多くの組織は、正しく構成されていれば、停止中に何か他のものを発見できたはずだと考えています。 Netflix の Chaos Monkey システムは、障害のシミュレーションでよく知られていますが、そこから得られる教訓は、管理者が実際の障害への対処を練習しなければ、IT システムがどのように反応するかを知ることはできないということです。また、システムは孤立したものではなく、各アプリケーションとサービスには依存関係があり、テストがさらに複雑になります。 プライベート データ センターやパブリック クラウドでは停止は珍しくありませんが、データ センター内では、管理者がシステムの内部の仕組みを把握し、理解している必要があることがよくあります。クラウド プロバイダーが停止を経験すると、ダウンタイムから何も学べなかったように感じるかもしれませんが、それは事実ではありません。パブリック クラウド プロバイダーは従来のデータ センターとは異なるツールと方法論を使用しますが、冗長性の構築と調整に関して得られる教訓は普遍的です。 |
<<: すべてのクラウドプラットフォームが同じように作られているわけではない
>>: AWS、Google Cloudに勝ち、クラウド災害復旧会社CloudEndureを2億5000万ドルで買収
[51CTO.com クイック翻訳] 多くの組織はワークロードをクラウドに配置することでメリットを得...
11月4日に開催された2021年テンセントデジタルエコシステムカンファレンスのテンセントクラウドイン...
ポッド コントローラーを使用して作成されたポッドの IP アドレスと名前は、ポッドに障害が発生すると...
[51CTO.comからのオリジナル記事] 最近、「エッジインテリジェンス、エッジクラウドコラボレー...
unesty.net は特別なクリスマス プロモーションを開始しました。すべての VPS が 50%...
[51CTO.comより引用] 近年、SDNの急速な発展により、データセンターの構築はユーザーサービ...
【意見では、情報公開のプラットフォームとしての政府ウェブサイトの役割を十分に活用し、政府ウェブサイト...
最近、中国教育チャンネルの就職番組「知来知望」を見ました。その中で、インターネット業界のオペレーショ...
2014年10月12日午後7時、北京耀来ジャッキー・チェン映画館は人でいっぱいだった。 5階のエレベ...
多くの個人ウェブマスターは、記事を書くときに無駄なテキストリンクをたくさん追加して、内部リンクの重み...
みなさんこんにちは。Hua Zaiです。またお会いできて嬉しいです。監視は常に Kafka にとって...
dedipath は専用サーバーのプロモーションを頻繁に開催しており、安価な米国専用サーバーは最低で...
【はじめに】垂直電子商取引は100メートル短距離走というよりマラソンのようなもので、規模を追求するゲ...
信じられないかもしれないが、Sinaの草の根Weiboは今や独自のプラットフォームとなっている。蔡文...
誰もがオンラインマーケティングにおけるソフト記事の重要性を知っています。私がダイエット薬を販売してい...