分散ストレージに関する5つの嘘

分散ストレージに関する5つの嘘

近年のストレージの世界で最も人気のあるものといえば、分散ストレージです。

分散ストレージは誕生以来、ストレージの未来として注目され、大きな期待を集めています。しかし、分散ストレージは、最初は小さなものから始まり、インターネット ログ、エンタープライズ バックアップとアーカイブ、開発とテストなどのシナリオで使用されました。極端なコストを追求しましたが、その性能と信頼性は満足できるものではありませんでした。しかし、まだ順調に進んでいます。長年のモンスターとの戦いとレベルアップを経て、自動運転の研究開発、超高精細編集、オペレーター5Gネットワ​​ーククラウドなどの企業の主要業務をますます遂行し始め、背が高く、お金持ちで、ハンサムになり、美しくて裕福な女性のハートをつかむ道を歩んでいます。

諺にあるように、有名になると噂話が広まりやすくなります。ストレージ分野でも同様です。分散ストレージに関するさまざまな噂が市場に出回っています。今日、好奇心旺盛な著者は嘘の背後にある真実を探り、明らかにします。

[[360653]]

嘘1: 分散ストレージはソフトウェア+サーバーである

分散ストレージの分野には、SDS(ソフトウェア定義ストレージ)とハードウェアとソフトウェアの統合という2つの派閥があるようです。前者はvSANやCephに代表され、主にソフトウェアメーカーが推進しています。分散ストレージソフトウェア+汎用サーバーの組み合わせは、ストレージ市場の再定義を掲げ、「異なる種族から生まれた王、王子、将軍、大臣はいるか?」という勢いを持っています。もう一方の派閥は、Isilon、HCP など、主にハードウェアとソフトウェアを統合する旧来のストレージ プレーヤーの製品です。

楚と漢の境界が形成されましたが、将来の覇者は誰になるのでしょうか?

誰が台頭し、誰が衰退するかを判断するのは難しいが、業界の動向からそれを垣間見ることもできるだろう。分散ストレージ ソフトウェア + サーバーのアプローチは、それを使用した顧客から、さまざまな互換性、信頼性、保守性の問題で批判されていますが、著者は、バックアップやアーカイブ、開発やテスト環境などの従来のローエンド分野では特に、SDS モデルが長く存在し続けると考えています。レベルが上がるほど、ハードウェアとソフトウェアの統合が主流になります。業界の主流メーカーも、ハードウェアとソフトウェアを統合した製品を継続的に発売しています。

  • 海外では、DELL&EMC社のPowerScale(Isilon)やDDN社のEXAScalerなどの製品。
  • XSKYやInspurなどの国内Cephベースのオープンソースベンダーも、XScaler Expressなどの統合ハードウェア・ソフトウェア製品を発売している。特に興味深いのは、国産Cephベースのソフトウェア定義ストレージの主力製品であるXSKYだ。よく考えてください。

一方、筆者は近年、事業者がファイルストレージやブロックストレージを含む大規模な分散ストレージ調達を行っていることにも注目している。中国移動の2019~2020年の分散ブロックストレージ集中調達を例にとると、3つの入札部門のうち2つはハードウェアとソフトウェアの統合調達であり、90%以上を占めています。テレコムグループの2020年の集中調達では、分散ストレージの純粋なソフトウェア調達を放棄し、初めてハードウェアとソフトウェアの統合に目を向けました。このような観点から、さまざまな購入モデルを試した後、特に大規模なユーザーは、徐々にハードウェアとソフトウェアの統合の道に移行し始めました。

#真実#:分散ストレージの初期の頃は、主に純粋なソフトウェア形式でした。過去 10 年間で、分散ストレージが徐々にエンタープライズ市場に参入するにつれて、ソフトウェアとハ​​ードウェアの統合が主流になりました。

嘘2: 分散ストレージは価値の低いストレージである

記事の冒頭で述べたように、分散ストレージは初期の頃は主にインターネット ログ、エンタープライズ バックアップとアーカイブ、開発とテストなどのシナリオで使用されていました。これらのシナリオは間違いなく価値の低いシナリオであり、コストが最初の、あるいは唯一の要求です。

しかし、時代は変わり、3日間も家を空けていない男性は新たな目で見るべきです。

まず第一に、分散ストレージ製品の機能は以前ほど良くありません。ミリ秒レベルのレイテンシ、テラバイト/秒レベルの帯域幅、アクティブ-アクティブ/3DCビジネスレベルの災害復旧、エンドツーエンドのDIFなど、高価値エンタープライズビジネスを運ぶための重要な機能を徐々に獲得してきました。構造化データか非構造化データのどちらを運ぶかに関係なく、機能の完全性における最大の欠点は長い間補われてきました。

第二に、分散ストレージは、オペレーターBOM事業、金融チャネル事業、スーパーコンピューティングや貯留層探査HPCなどの高価値事業など、多くの高価値重点事業に参入しており、その品質は大規模なアプリケーションの実践を通じてテストされています。 (噂によると、一部の高価値シナリオのフルフラッシュ価格は 1,000 ドル/TB を超えているとのこと)

現在を見た後、将来も見なければなりません。著者は、将来的に価値の高い非構造化データのシナリオでは、分散ストレージの領域が拡大し続けると考えています。自動運転トレーニング、4K/8K 超高解像度、5G ログ保持などのシナリオでは、マルチプロトコル アクセス、極限の帯域幅、スケーラビリティに対する強い需要があります。分散ストレージは、将来のビジネスに適したアーキテクチャになっています。

#真実#:分散ストレージは、初期の頃は主にバックアップやアーカイブなど、価値が低くコストのかかるシナリオで使用されていました。現在、エンタープライズ レベルの機能の向上により、分散ストレージは徐々にエンタープライズ生産システムのキャリア プラットフォームになり、特に大規模な非構造化データのシナリオでは、ファイル リソース プールや HPC などの高価値シナリオを完全にサポートしています。

嘘3: オープンソースアーキテクチャは分散ストレージの未来である

著者はオープンソースに対して常にオープンかつ協力的な姿勢を保ってきました。オープンソースの存在があったからこそ、IT 業界は今日のような多彩な彩りを放つことができたのです。ストレージという高級製品が一般家庭にも普及したのも、オープンソースのおかげです。

しかし、ストレージの将来はオープンソースにあると言うのであれば、私はそうは思いません。

オープンソースの分散ストレージ ソフトウェアの登場により、ストレージの敷居はある程度下がりました。中小企業はストレージ製品を迅速にパッケージ化し、サーバーの販売を促進できます。しかし、製品の同質性の問題は、すべてのオープンソース開発者が直面しなければならない問題です。アーキテクチャ上の制限により、アーキテクチャを変更せずに真に差別化された競争力を生み出すことは困難です。インターネット企業、一部の科学研究機関、テクノロジーに対する情熱と十分な資金投資を持つ顧客は、オープンソースを選択する可能性があります。しかし、信頼性、パフォーマンス、セキュリティ、コンプライアンスの要件を持つ金融、通信事業者、大規模エンタープライズ商用 HPC、政府などの企業にとって、データは非常に重要であるため、オープンソースは決して第一の選択肢にはなりません。 (国内の有名銀行がオープンソースソフトウェアをベースにした分散ストレージの構築に500人を投入したことがあるそうです。投資額が莫大で、銀行業務の性能、信頼性、運用・保守の容易さなどの要件を満たせず、結局2年で断念したそうです。)

オープンソースはより自律的で制御可能であると考える人もいます。著者は、オープンソースはユーザーに一定の自律性を与えると考えていますが、それは自律制御とは異なります。 SNYK の 2019 年オープンソース セキュリティ ステータス レポートによると、オープンソース ソフトウェアの脆弱性は 2 年間で 88% 増加しました。オープンソースのリスクの解決はコミュニティバージョンのリリースに大きく依存しており、タイムリーに回避することはできません。一方で、過去2年間の国際情勢の大きな変化は、オープン性で知られるオープンソースに暗い影を落としています。

さらに、PowerScale (Isilon)、Spectrum Scale、Nutanix、OceanStor Pacific、VSAN、HCP など、業界トップの主流分散ストレージ製品はすべてクローズドソース アーキテクチャです。 3 か月前に発表された IDC の市場シェア レポートを見ると、分散ストレージ ベンダー TOP5 のうち、オープン ソース二次開発をベースとするベンダーのシェアはわずか 18% です。

#真実#:オープンソースは、一部のメーカーにとってのビジネス上の選択肢にすぎません。分散ストレージ業界の主流は依然として非オープンソースであり、オープンソースはより高い自律性と制御性を意味するものではありません。

嘘4: 分散ストレージは企業の外部ストレージを完全に置き換えることができる

これはストレージ分野で最も議論されている問題の 1 つです。

諺にあるように、後ろの波は前の波を押しのけます。大手メーカーの業績レポートやアナリストレポートからもわかるように、分散ストレージの急速な成長は否定できません。しかし、エンタープライズ外部ストレージの波を浜辺で打ち負かそうとするのは、あまりにも大きな一歩であり、非現実的です。

エンタープライズ外部ストレージは、今後もしばらくの間、主流であり続けるでしょう。これは主に、データ量が少ないものの、信頼性とパフォーマンスに対する要件が極めて厳しい ERP/CRM/HIS などの従来のエンタープライズ アプリケーションを対象としています。たとえば、コアバンキングの場合、信頼性とエコロジーの観点から、分散ストレージは最適な選択ではありません。分散ストレージは主に、HPC/EDA やビッグ データなどの大量データや新たなビジネス シナリオを対象としています。これらのシナリオは主にバイナリ ファイル、ビデオ、画像などの非構造化データに基づいており、データ量は非常に大きくなります。したがって、シナリオの観点から見ると、2 つのシナリオは明確に区別されており、シナリオに応じて共存することが最善の選択肢となります。


技術的な観点から見ると、分散ストレージの焦点は大規模なスケーラビリティにあり、それに基づいてパフォーマンスと信頼性が徐々に最適化され、大量のデータを手頃な価格で保存して使用できるようになります。エンタープライズ外部ストレージの技術的な方向性は、安定性を維持しながら、より高速なメディアと低遅延のネットワークを使用してコアビジネスを加速し、ビジネスの安定性と効率性を高めることです。したがって、技術的な観点から見ると、両者はそれぞれ独自の焦点を持っています。

#真実#:分散ストレージとエンタープライズ外部ストレージは、置き換えの関係にはありません。両者は互いに補完し合います。エンタープライズ外部ストレージは主に構造化データ市場を対象としており、分散ストレージは主に大規模な非構造化データ市場(高価値の分散ファイル、分散オブジェクト)を対象としています。

嘘5: 分散ストレージは「クラウド」である

IT のトレンドは常に進化しており、数年ごとに常に新しいコンセプトが必要になります。

クラウドや分散ストレージと同様に、近年非常に人気が高まっています。クラウド ファースト、オールイン クラウド、クラウド ネイティブなどの概念が業界で大流行しており、CIO はクラウドについて言及せずに挨拶するのは恥ずかしいようです。昔は分散ストレージを「クラウド ストレージ」と呼ぶこともありましたが、分散ストレージとクラウドの関係は何でしょうか?

著者は、分散ストレージは技術的なアーキテクチャであり、クラウドはビジネス モデルであると考えています。分散ストレージは、さまざまなクラウドのデータベースとして使用することも、それ自体がデータベースとして使用することもできます。それは、置き換えや包含の関係ではなく、協力関係です。

実際、業界のパブリック クラウド ベンダーとのコミュニケーションから、パブリック クラウドは近年、従来の IT 市場の変革を強化しているものの、パブリック クラウド データの増加は依然として新たなシナリオから生じていることがわかりました。米国市場を例にとると、AWSは近年急成長を続けていますが、Dell & EMCの非構造化データシナリオ向け主力製品であるPowerScale(Isilon)は、売上収益の約60%が北米市場から得られており、依然として年間約20%の安定した成長率を維持しています。


シナリオの観点から見ると、顧客データのセキュリティ、エコロジー、入札モデルなどの理由により、大規模なストレージ シナリオのほとんどは主にオフラインで購入され、パブリック クラウドは補助的なものとして使用されます。 HPC を例にとると、クラウドベースの HPC は、パブリック クラウドがもたらす利便性をより多くのユーザーが享受できるようにする新しい方法を業界に提供します。しかし実際には、HPC は主に革新的な研究に使用され、データ セキュリティに対する要件が高いため、クラウドへの移行には懸念があります。 Hyperion Research のレポートによると、2024 年までにクラウド HPC の収益シェアはわずか 17.7% となり、非常に低い割合になります。


#真実#:分散ストレージは製品であり、クラウドはビジネス モデルであり、サービスの形態です。両者は衝突せず、長期的に共存していくことが未来です。

<<:  クラウド コンピューティングはなぜそれほど重要なのでしょうか。また、今後の動向はどうなるのでしょうか。

>>:  Dockerってすごいですよね? K8s を使用する理由

推薦する

WeChatはテンセントの電子商取引ゲームに勝てない

テンセントがJD.com、Meituan、Beike、Didi、Pinduoduoなどの大手インター...

bgp.toシンガポール3ネットワークcn2 giaラインの独立サーバーの簡単な評価

bgp.to ではこれまで、日本のソフトバンクデータセンターのサーバーをテストしてきました。今回は、...

草の根ウェブマスターがBaiduの最適化体験をあなたと一緒に分析します

2013 年が SEO 担当者にとって激動の年であったとすれば、2014 年は SEO 担当者にとっ...

virmach-シンプルなレビュー:フェニックスデータセンター、2Gメモリ特別価格VPS

昨日の virmach の VPS の特別価格 [virmach-$2/Win/1g メモリ/15g...

調査によると、3月には共同購入サイトが2時間ごとに消えている

3月には、共同購入サイトが2時間ごとに倒産したり、他の事業者に切り替えたりした。最近、共同購入ナビゲ...

Vue2.x の仮想 DOM 差分原理の詳細な理解

1. はじめにVue の核となるのは双方向バインディングと仮想 DOM (以下、vdom と呼びます...

情報漏洩事件の容疑者2人が拘束される:昼はエンジニア、夜はハッカー

実際、法的意識の弱さと遊び心により、インターネット企業のセキュリティに携わる技術スタッフやセキュリテ...

月額9.9ドル、1Gbpsの帯域幅、KVM仮想化を備えた香港VPS

Bandwagonhostの謎が明らかになりました。Bandwagonhostの香港VPSがついにオ...

Buyvm SJ 512MメモリKVMの簡単な評価

月額 10 ドルの KVM は、午前 2 時 30 分に起動し始めました。全体的に、あまり理想的では...

検索エンジン: リンク先のウェブサイトへのリンクの関連性を判断する方法

ウェブサイトがどのような業界のものであっても、市場を独占している類似または関連ウェブサイトが常に存在...

Diggの創設者:私たちは会社の製品DNAに反することをたくさんやりました

Digg の創設者、ケビン・ローズ氏 (写真提供: Tencent Technology)テンセント...

Fenfuは「Huabei」のWeChatバージョンではありません!

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス3月26日、ネット上の一...

「アスリートも審判員だ」ジュメイは上場前夜に質問を受けた

【Ebrun Power Network News】5月14日のニュース:アスリートであり審判員でも...

WeChatブティックモールの変貌:新たな発見がJD.comマイクロストアへの道を開く

【Ebrun Power Networkニュース】Ebrun Power Networkは、今朝9時...

初心者SEO担当者のオンサイト最適化プランの初公開

検索エンジン最適化は、オンサイト最適化とオフサイト最適化の 2 つの部分に分かれており、SEO 担当...