Google、Amazon、Tencent などの大手インターネット企業では、事業が広範囲にわたるため、保存する必要があるユーザーデータが大量にあるため、分散ストレージ システムがこのような企業のインフラストラクチャになることがよくあります。分散ストレージには、単一マシンのストレージ エンジンや分散システム プロトコルなど、多くの領域が関係します。この記事は、分散ストレージ システムの基本概念の紹介となります。 分散ストレージが満たすべき基本条件
WeChat Moments の写真を例にとると、WeChat の動作時間が長くなるにつれて、保存する必要がある Moments の写真の数も必然的に増加するため、これらの写真を保存する分散ストレージ システムは拡張可能でなければなりません。
大規模なインターネット企業の場合、保存するデータの量が非常に多いため、ストレージシステムをオンラインで運用できるかどうかを検討する上で、コストは非常に重要な指標となります。
分散ストレージ クラスター全体であっても、単一マシンのストレージ エンジンであっても、高いパフォーマンスを保証する必要があります。そうでなければ、低コストは問題外です。
分散ストレージ システムは、インフラストラクチャとして、さまざまなビジネスにさらに貢献できるように使いやすくなければなりません。たとえば、Amazon の S3 はインターフェースが統一されており、アクセスが容易です。 分散ストレージシステムが直面する主な技術的課題
ストレージ システム全体がクラスターです。データが複数のサーバーに均等に分散されるようにするにはどうすればよいでしょうか?特定のデータが複数のサーバーに分割されて保存されていると仮定した場合、サーバー間の読み取りと書き込みをどのように実現できるでしょうか?
データの信頼性を確保するために、同じデータを複数のコピーで保存する必要があります。これらの複数のデータコピーの一貫性を確保するにはどうすればよいでしょうか?
クラスターの場合、マシンの障害は避けられません。障害をタイムリーに検出し、障害が発生したマシン上のデータとサービスを障害のないマシンに自動的に移行するにはどうすればよいでしょうか?
どのクラスター システムにも負荷分散戦略の問題があり、分散ストレージ システムも例外ではありません。
分散ストレージ システムがトランザクションと同時実行制御機能をサポートする必要がある場合、どのように実現できますか?
使いやすさについてはすでに述べたので、ここでは繰り返しません。
圧縮によって節約されるスペースと消費される CPU コンピューティング リソースのバランスをとるために、データの特性に基づいて適切な圧縮/解凍アルゴリズムを設計および選択する方法。 分散ストレージシステムにおけるデータ分類 インターネット ビジネスに関係するデータは、一般的に次の 3 つのカテゴリに分類できます。 1. 非構造化データ 代表的な例としては、画像、音声、ビデオファイルなどが挙げられます。 2. 構造化データ リレーショナル データベースに保存される従来の 2 次元テーブル構造データ。 3. 半構造化データ 構造化データと非構造化データの違いの典型的な例としては、HTML ドキュメントが挙げられます。 分散ストレージシステムの分類 上記のデータ タイプを保存する実際のニーズに基づいて、分散ストレージ システムは徐々に次の 4 つのタイプに進化してきました。 1. 分散ファイルシステム 通常、非構造化データを保存するために使用されます。たとえば、HDFS、TFS (Taobao File System)、FastDFS などです。 2. 分散型キーバリューシステム これは一般的に、Taobao の Tair、Redis、memcached などの半構造化データを格納するために使用されるハッシュ テーブルとして理解できます。 3. 分散テーブルシステム 非構造化データの保存にも使用されます。分散キーバリューシステムと比較すると、主キーに基づいた読み取りと書き込みを提供するだけでなく、Google の Big Table などの特定の主キー範囲のスキャンもサポートします。 4. 分散データベース スタンドアロン データベースから開発され、構造化データを保存するために使用されます。典型的な例は、MySQL Sharding クラスターです。 |
>>: WAN 変革: クラウド コンピューティングからユビキタスなエラスティック ネットワークへ
デジタル化の波が全国に広がり、伝統的な生産や生活様式を覆しつつある。結果として生じる新しい経済と新し...
namecheap の最新のドメイン移転割引コード: NCMYDD .COM、.NET、.ORG、....
これは今年最後のプロモーションになるのでしょうか? Cloudcone はクリスマス プロモーション...
[[423604]] [51CTO.com クイック翻訳]今日、クラウド コンピューティング アプリ...
ウェブサイトの直帰率に関係する要因は何でしょうか? 現在、多くのウェブマスターは統計ツールのデータに...
電子メール マーケティングは誰もがよく知っていると思います。広告やソフトテキスト マーケティングと比...
クラウドに移行する企業は、パブリック クラウドとプライベート クラウドのどちらを選択するかというジレ...
新しい10年を迎えるにあたり、社会経済的要因によりアジアはさらに世界の注目を集めるようになるだろう。...
ウェブ検索は、ユーザーに基づいて顧客に最高のサービスを提供する重要な方法の 1 つです。より良い結果...
本日、Sina が Lakala と O2O 分野およびモバイル決済で提携した場合、両社が提携する可...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています今は新鮮な...
ウェブサイト最適化の真の意味ウェブサイトの最適化とは、ウェブサイトの機能、ウェブサイトの構造、ウェブ...
少し前に、QQグループで友人とチャットをしていました。彼はインターネットマーケティングのトレーニング...
1. タオバオと天猫の売上高は9年間で1兆元を超え、成長の鈍化は避けられないこれまでオンラインショッ...
Hosthatch で最も期待されているのは、毎年恒例のスーパー ブラック フライデー プロモーショ...