クラウド コンピューティングではなぜ運用と保守が重要なのでしょうか?

クラウド コンピューティングではなぜ運用と保守が重要なのでしょうか?

今日では、クラウド コンピューティングの産業実装は難しくありません。現在、基本的に仮想化を処理するオープンソース ソフトウェア KVM と Xen があります。 OpenStack は管理および制御システムを扱い、非常に成熟しています。 PaaS には OpenShift などの対応するオープンソースもあり、Java のミドルウェア フレームワークやテクノロジーも数多く存在します。さらに、分散ファイルシステムのGFS/TFS、分散コンピューティングシステムのHadoop/Hbaseなど、分散化されたものはもはや不思議なものではありません。過去にはテクノロジーの導入が問題になったかもしれませんが、今はそうではありません。

クラウド コンピューティング エンジニアリングに関して、現在最も難しいのは運用と保守です。管理するマシンが 100 台、10,000 台、または 100 万台かどうかによって、状況はまったく異なります。機械が少なければ人力で管理できますが、機械が多ければ人に頼るのは不可能です。運用・保守体制は機能的なものではなく、ユーザーからは見えない部分なので、非常に過小評価されやすいものです。規模が大きくなれば、必然的に運用・保守体制にも取り組まなければならなくなります。データセンター/クラウド コンピューティングはすべて、運用と保守の能力に依存します。

[[255874]]

運用と保守が複雑になる理由はいくつかあります。

一方、クラウド コンピューティングは、高価なソリューションを安価な機器に置き換えることを目指しています。インターネットは、安価なものを使って高品質のものを構築することです。ハードウェアとリソースは、EMC、IBM ミニコンピュータ、SGI スーパーコンピュータなどのハイエンドのものではありません。これらを使用してクラウド コンピューティングを構築すると、コストが高すぎます。高価なソリューションを安価なソリューションに置き換えることは、コンピューターの歴史全体を通じて唯一不変のことです。したがって、Xiali 車をメルセデス・ベンツのように走らせたい場合、多くのことを自分で行い、インテリジェントなシステムを構築する必要があります。安価なもので高品質な製品を作り、安価な機器を運用・保守することが、実はクラウド コンピューティング エンジニアリングにおける最大の課題です。

一方、マシンの数が増え、使用されるハードウェアが高価ではないため、ハードドライブ、マザーボード、ネットワークが毎日のように故障するなど、障害が当たり前になっています。したがって、何も考える必要はなく、運用とメンテナンスを継続する必要があります。クラウド コンピューティングの目標は、障害が当たり前になったときに高い可用性を確保することです。つまり、3 9、4 9、5 9 のサービス可用性のことです。

***、非常に多くの機械や設備が集まっているため、セキュリティが課題となっています。一方ではセキュリティであり、他方では安全性です。数十、数百のデバイスの安全性を確保するのは簡単ですが、数万、数十万のデバイスを設計するのはそれほど簡単ではありません。

このような困難な問題に直面すると、人間はそれを解決することはできず、プラットフォーム全体を管理および運用するためにテクノロジーに頼るしかありません。たとえば、監視システムが必要です。これはオペレーティング システムと同じです。リソース、ネットワーク トラフィック、CPU 使用率、プロセス、メモリなどの管理をすべて収集する必要があります。クラスター全体のさまざまなノードのステータスを収集することは、すべてのクラウド コンピューティングで必須であり、すべて似ています。

次に、可用性の高いノードを見つける必要がありますが、これには何らかの障害自己検出機能が必要です。たとえば、Alibaba Cloud では、一定期間使用するとディスクが不可解に不安定になり、一部のディスクの I/O が遅くなるという状況に遭遇しました。速度低下の原因は、ハードディスクが故障しているため、CRC チェック エラーのためにハードディスク コントローラが複数回読み取る必要があることにある可能性があります。これは、TCP パケットが送信されるときに、データが間違っていて再送信する必要があるようなものです。ハードディスクが半分死んだ状態になった場合、このような状態を監視するための自動検出または自動検出プログラムが必ず必要になります。ディスクが動作しない可能性がある場合は、それを不良ディスクとしてマークし、使用せずに、別のディスクからコピーを読み取ります。障害を自動的に検出して予測し、受動的に対応するのではなく障害を促進できる対策が必要であり、そうして初めてユーザー エクスペリエンスは向上します。つまり、自動化されたプロアクティブな運用が必要なのです。

データの可用性を高めるには、データの冗長性のみを使用して、異なるノードに複数のコピーを書き込むことができます。業界標準では、安全のために 3 つのコピーを書き込むことになっています。ただし、冗長性を持たせると、データの一貫性に問題が生じます。冗長性によって生じる一貫性の問題を解決するために、Paxos には投票方式があります。これを変更できるかどうかは全員が投票するため、これらを制御するには強力な制御システムが必要です。

さらに、パブリック クラウドには人が出入りし、その中のリソースとサービスは明日ではなく今日使用されます。割り当てられているものもあれば、解放されているものもあり、凍結されているものもあります。これらのリソースのライフ ステータスを管理するためのリソース管理システムも必要です。 AWS の IAM と同様に、権限管理もあります。 AWS の IAM のような権限管理システムがなければ、AWS は現在ほど多くの大企業で使用されていなかったかもしれません。エンタープライズ レベルのクラウド プラットフォームには、エンタープライズ レベルの運用、保守、管理機能が必要です。

クラウド コンピューティングにはオープン ソースのものがたくさんあるのに、誰もがそれを実行できるわけではないのはなぜでしょうか?

一方で、それは建物を建てるようなものです。建物を建てる技術は難しくありません(もちろん、高層ビルを建てるのは難しいですが)が、土地がなければどうやって建てるのでしょうか?クラウドコンピューティングでも同様です。帯域幅の価格は土地の価格と同じくらい高価です。実際、クラウド コンピューティングは不動産のようなものです。土地、コンピューター室、帯域幅を占有します。中国のすべてのコンピューター室、キャビネット、帯域幅リソースを購入できれば、クラウド コンピューティングを行う必要はありません。土地を売るだけで十分でしょう。なぜなら、土地は限られているからです。最も単純な例は、IP アドレスが制限されていることです。帯域幅とコンピューター ルームがあっても、IP がなければ面白くありません。これは、CDN サービスを提供する場合に特に当てはまります。物理ノードの数が CDN サービスの品質を直接決定するためです。

一方で、先ほども述べたように運用やメンテナンスは難しい作業であり、一般の人が行えるものではありません。十分なシナリオ、経験、時間がなければ、この能力が現れる可能性は低くなります。ユーザーの観点から見ると、クラウド コンピューティングはサービスです。優れたサービスを提供するには、ユーザーの企業内のソリューションを十分に理解する必要があります。 「良いサービス」を提供できる企業は、たいてい、自らを真にユーザー企業とみなしています。

車を売ることはサービスを売ることでもあります。車を作るということは、その仕事をマスターしたということではない。道路もガソリンスタンドも4Sストアも交通管理もルールもなければ、使えないか混乱するでしょう。ユーザーに車のカッコよさを見せても、使い方を知らせないわけにはいきません。したがって、クラウド コンピューティングは、最終的には一連のサービス ファシリティによってサポートされる必要がありますが、この一連のサービス ファシリティも今日では過小評価されています。

クラウド コンピューティングにおいて、私が個人的に過小評価されていると思うことが 2 つあります。1 つは運用と保守、もう 1 つはサービスです。サービスを提供するには、生態学的環境とそれを支援してくれる人が必要です。したがって、クラウドコンピューティングを実装するのは簡単ではありません。繰り返しますが、クラウドはサービスです。良いサービスが提供されていれば、それが公的であろうと私的であろうと価値あるものとなるでしょう。

<<:  オラクル——高い壁を築き、食料を蓄え、大きな穴を掘る?

>>:  Redis 分散ロックの進化の解釈 + 欠陥分析

推薦する

百度の検索結果2ページ目上部に表示される関連検索についての考察

ウェブマスターとして、百度の変化に注目することは、すべてのウェブマスターが毎日行うべきことです。今夜...

重量移動とリンクレイアウト

昨日の記事「ブログの外部リンクについて言わなければならないこと」では、個人ブログに適した優れたウェブ...

Bocai Network: ウェブサイト構築の後期段階で予算が不足することが多いのはなぜでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますウェブサイ...

エンタープライズハイブリッドマルチクラウド戦略の鍵

[[351688]] 10年以上の開発を経て、クラウドコンピューティングは徐々に成熟してきました。こ...

すべてのクラウド アーキテクトが自動化すべき 5 つのこと

クラウド コンピューティングを定義する特性、またはクラウド コンピューティングを従来のデータ センタ...

複数製品を扱う企業ウェブサイトの SEO の核心: キーワードレイアウト

キーワードレイアウトはSEOを始めるための第一歩であり、将来のウェブサイトプロモーション効果の核心で...

2021年CCF科学技術賞発表:アリババクラウドネットワークと液体冷却データセンターが2つの賞を受賞

中国コンピューター学会は10月14日、基本ソフトウェア、半導体、データセンターなどのコア技術分野を網...

ケーススタディ |製造業におけるクラウドコンピューティングへの道

[[254473]]近年、インターネット+、クラウドコンピューティング、ビッグデータの急速な発展に伴...

name.com イベント: .com/.net ドメイン名を 8 ドルで移管 (ドメイン名の 1 年間の更新に相当)

name.com ドメイン名の価格はほとんど変化しておらず、プロモーション活動もほとんど行われていま...

VPS 初心者向けチュートリアル - Linux システムの再起動 (centos/debian/ubuntu)

HostCat によるこの VPS 初心者向けチュートリアルでは、Linux システムの再起動につい...

高品質なコンテンツを編集するためのウェブサイトの黄金律

ウェブサイトのコンテンツは、ウェブサイトの最も重要な構成要素です。検索エンジンであれ、ユーザーであれ...

トレンド |仮想化は負け、クラウド、SDN、SD-WAN が C の位置を獲得しました。

企業のネットワーク管理者にとって、IT の最大の焦点はクラウド コンピューティングとソフトウェア定義...

クラウドとソフトウェア、世界を食い尽くしているのは誰か?

[[324139]] 9 年前、シリコンバレーのベンチャー キャピタル会社 A16Z のパートナーで...

正しいウェブサイト構造はすべてのページのランク付けを左右する

正しいウェブサイト アーキテクチャはウェブサイトのキーワード ランキングの基礎となりますが、現在では...

Weibo でフォロワーを増やす楽しみは無限大。Weibo のトップユーザーによる体験談 - A5 Webmaster Network

みなさんこんにちは!私はテンセント微博の福州精神公社(アカウント番号fzmj5i)の担当者です。最近...