史上最も包括的な分散データベースの概要

史上最も包括的な分散データベースの概要

[[331009]]

1. はじめに

従来のデータベース技術の成熟度が高まり、コンピュータ ネットワーク技術が急速に発展し、その適用範囲が拡大するにつれて、データベース アプリケーションは一般的にコンピュータ ネットワーク上に構築されるようになりました。現時点では、集中型データベース システムには欠点があります。データは実際のニーズに応じてネットワーク上に分散されて保存されており、集中処理では必然的に通信オーバーヘッドが大きくなってしまいます。アプリケーションプログラムが 1 台のコンピュータに集中しており、そのコンピュータに障害が発生するとシステム全体に影響が及び、信頼性が高くありません。集中処理では、システムの規模と構成に柔軟性がなくなり、システムのスケーラビリティが低下します。このような状況下で、集中型 DB の「集中コンピューティング」という概念は、「分散コンピューティング」という概念へと発展しました。分散コンピューティングは、主にクライアント/サーバー モデルと分散データベース アーキテクチャという 2 つの側面に反映されます。

2. 分散データベースシステムの概要

伝統的なデータベース技術が成熟するにつれて、コンピュータネットワーク技術が急速に発展し、その適用範囲が拡大し、分散を主な特徴とするデータベースシステムの研究開発が注目を集めています。分散データベースは、データベース技術とネットワーク技術の組み合わせの産物であり、データベース分野の一分野を形成しています。分散データベースの研究は 1970 年代半ばに始まりました。世界初の分散データベース システム SDD-1 は、1979 年に Computer Corporation of America (CCA) によって DEC コンピュータに実装されました。1990 年代以降、分散データベース システムは商用アプリケーションの段階に入りました。従来のリレーショナル データベース製品は、コンピュータ ネットワークとマルチタスク オペレーティング システムを中核とする分散データベース製品へと発展しました。同時に、分散データベースは徐々にクライアント/サーバー モデルへと進化してきました。

3. DDBS(分散データベースシステム)の分類

(1)同種DDBS:すべてのサイトで同じタイプのデータモデル(たとえば、すべてがリレーショナル)と同じタイプのDBMSを使用します。

(2)同種DDBS:各サイトは同じタイプのデータモデルを使用しますが、DBMSモデルはDB2、ORACLE、SYBASE、SQL Serverなど異なります。

(3)異種DDBS:異なるサイトのデータモデルは、モデルもタイプも異なります。コンピュータ ネットワーク技術の発展により、異機種マシンのネットワーク化の問題は十分に解決されました。このとき、異種 DDBS を使用して、ネットワーク全体のさまざまな異種ローカル ライブラリにデータを保存およびアクセスできます。

4. DDBSの特徴、利点、欠点

DDBS の基本機能:

(1)物理的な分散:データは1か所に保存されるのではなく、コンピュータネットワーク上の複数の場所に保存されます。

(2)論理的整合性:データは物理的には複数のサイトに分散されているが、論理的には一体となっている。すべてのユーザー(グローバル ユーザー)で共有され、DDBMS によって一元的に管理されます。

(3)サイトの自律性:各サイトのデータは、サイトのアプリケーション(ローカルアプリケーション)を完了するための自律的な処理機能を備えたローカルDBMSによって管理されます。

(4)会場間の連携:各会場は高い自治権を持ちながらも、互いに連携し全体を形成している。

DDBSのその他の機能

(1)データの独立性

(2)中央集権と自律性を組み合わせた制御機構

(3)データの冗長性を適切に高める

(4)取引管理の分散

DDBSの利点

(1)柔軟なアーキテクチャ

(2)分散型管理統制組織への適応

(3)優れた経済パフォーマンス

(4)高いシステム信頼性と優れた可用性

(5)ローカルアプリケーションの応答速度が速い

(5)優れた拡張性と既存システムとの容易な統合

DDBSの欠点

(1)システムオーバーヘッドは、主に通信部分で比較的大きい。

(2)複雑なアクセス構造(補助索引やファイルリンク技術など)は、集中型DBSにおける効率的なデータアクセスのための重要な技術であるが、分散型システムでは効果的でない可能性がある。

(3)データのセキュリティと機密性の取り扱いが難しい。

[[331010]]

5. データシャーディング

タイプ:

(1)水平シャーディング:特定の条件に従って、グローバルリレーションのすべてのタプルを複数の重複しないサブセットに分割し、各サブセットはリレーションのフラグメントです。

(2)垂直シャーディング:グローバルリレーションの属性セットを複数のサブセットに分割し、これらのサブセットに対して射影演算を実行する。各突起は垂直シャードと呼ばれます。

(3)エクスポートシャーディング:エクスポート水平シャーディングとも呼ばれ、水平シャーディングの条件はこの関係の属性の条件ではなく、他の関係属性の条件です。

(4)ハイブリッドシャーディング:上記3つの方法を組み合わせたもの。最初に水平にシャーディングしてから垂直にシャーディングすることも、最初に垂直にシャーディングしてから水平にシャーディングすることも、その他の方法でシャーディングすることもできますが、結果は異なります。

状態:

(1)完全性条件:グローバルリレーションのすべてのデータはフラグメントにマッピングされなければならず、グローバルリレーションに属しているがそのフラグメントのいずれにも属さないデータを持つことは許可されない。

(2)再構築条件:同一のグローバル関係の断片からグローバル関係を再構築できることが保証されなければならない。水平シャーディングの場合、結合操作を使用してグローバル関係を再構築できます。垂直シャーディングの場合、結合操作を使用してグローバル関係を再構築できます。

(3)非交差条件:グローバルリレーションシップを分割した後に得られるデータフラグメントが互いに重複しないことを要求する(垂直シャーディングの主キーを除く)。

6. データ配信方法

(1)集中化:すべてのデータ断片が同じ場所に配置されます。

(2)パーティション化:すべてのデータのコピーは1つだけ存在し、複数の論理フラグメントに分割され、各論理フラグメントは特定の場所に割り当てられます。

(4)完全複製:データは各場所に繰り返し保存されます。つまり、各サイトにはデータの完全なコピーが存在します。

(5)ハイブリッド:分割型と完全複製型の中間の分散方式です。

7. 建築

  • データ シャーディングとデータ分散の概念を分離することで、「独立したデータ分散」という概念が形成されます。
  • データの冗長性の明示的な制御。分散モードでは各サイトのデータの分散が明確に表示されるため、システム管理が容易になります。
  • ローカル DBMS の独立性。この機能は「ローカル マッピングの透明性」とも呼ばれます。この機能により、ローカル DBMS 固有のデータ モデルを考慮せずに、DDB 管理に関連する問題を調査できます。

8. 分散データベース管理システム

  • ユーザー要求を受け入れ、その要求をどこに送信するか、または要求を満たすためにどのコンピューターにアクセスする必要があるかを決定します。
  • ネットワーク データ ディクショナリにアクセスして、そこに含まれる情報を要求および使用する方法を学習します。
  • 対象データがシステム内の複数のコンピュータに保存されている場合は、分散処理を行う必要があります。
  • 通信インターフェース機能。ユーザー、ローカル DBMS、および他のコンピュータ上の DBMS 間の調整。
  • 異機種分散処理環境では、データとプロセスの移行のサポートも必要です。ここでの異質性とは、各サイトのハードウェアとソフトウェアの違いを指します。

IX.まとめ

(1)「分散コンピューティング」という概念は、集中型DBSの枠組みを打ち破ります。データ分散によりシステムは分散 DB へと移行し、機能分散によりシステムは C/S へと移行します。これらは DBS の 2 つの開発です。

(2)C/Sシステムは、通常、ローカルエリアネットワークによって接続されたコンピュータネットワークで構成される。ほとんどの場合、クライアントはマイクロコンピュータです。サーバーはミニコンピュータやメインフレームである場合もありますが、ほとんどの場合、マイクロコンピュータやハイエンドのマイクロコンピュータも使用されます。アプリケーションはクライアント上で処理され、DBMS と OS のデータ管理はサーバー上に置かれます。

(3)C/S構造は2層、3層から多層へと進化した。一般的な傾向としては、クライアントをより薄くし、ブラウザに似たものにすることです。サーバーの種類も増え、システムの構築も容易になりました。

(4)C/Sシステムはアプリケーションをユーザーに近づけ、より優れたパフォーマンスとより複雑なインターフェースをユーザーに提供します。

(5)集中型システムをベースに開発された分散型システム。 DDB は、データベース テクノロジとネットワーク テクノロジを組み合わせた製品です。コンピュータネットワーク技術の急速な発展に伴い、DDBS はデータベース分野の主流になりつつあります。

(6)DDBはデータ分散と論理整合性の特性を持つ。 DDBS は、複数のサイトを含むグローバル アプリケーションをサポートできます。 DDB には、データ シャーディングとデータ分散という 2 つのデータ ストレージ戦略があります。

(7)DDBスキーマ構造はDDBSを理解するための共通の概念構造を提供します。流通の透明性は DDBS が追求する目標です。 DDBMS は、分散環境における論理的に統合されたデータのアクセス、一貫性、有効性、完全性を管理するソフトウェア システムです。

(8)DDBSでは、データはさまざまなサイトに分散されており、システムの最も重要なパフォーマンス目標は、ネットワーク内で情報が送信される回数と送信されるデータの量を最小限に抑えることです。セミ結合ベースの最適化戦略は、分散クエリでよく使用される手法です。

(9)同時実行制御と回復に関しては、集中型DBMS環境では発生しない多くの問題がDDBMS環境で発生します。分散同時実行制御には、プライマリ サイト方式とプライマリ コピー方式が含まれ、バックアップ サイト テクノロジによって補完されます。

<<:  仮想デスクトップ GPU カード: AMD と Nvidia の比較

>>:  NutanixとKylin Softwareが協力し、中国企業のクラウド化を支援

推薦する

#Black5# mxroute: 郵便サービス、年間 15 ドル、1 時間あたり 1 メールボックスあたり 300 通のメール

に設立された企業である mxroute は、有料の郵便局サービスを主に提供しており、独自の AS39...

ブランドマーケティングの根底にあるロジック

ポストトラフィック時代では、モバイルインターネットと消費者インターネットの配当は消え、コンテンツ電子...

読み込み速度が再び向上しました:ウェブサイト構築プログラムを詳細に記述します

この冬、人々に最も深い印象を残した2つのウェブサイトは、12306列車のチケット購入ウェブサイトとX...

Bilibiliでは、1億人の中国のティーンエイジャーが成長しました!

ビリビリの若々しい場所では、10代の若者たちが成長し、父親や妻になるなど、社会の主流に入り、役割を果...

SEOリーダーは幅広さを求め、技術者は深さを求める

私が今日この話題について皆さんと話している理由は、グループ内の初心者の中には、SEO のキャリア プ...

これらのマーケティングチャネルをご存知ですか?

現代のインターネットは、ポータル時代、検索時代、ソーシャル時代を経て、現在はコンテンツ時代となってい...

WeChat Momentsでスクリーンスイープマーケティングを行うにはどうすればいいですか?

誰かが私と同じように感じているかどうかはわかりませんが、 WeChat Moments はますます退...

ソーシャル マーケティングは SEO に取って代わることはできません。どちらのモデルにも独自の長所があります。

最近、アメリカの有名な経済雑誌「フォーブス」が「SEOは死に絶え、ソーシャルリアルタイムコンテンツが...

新世代クラウドネイティブデータウェアハウスAnalyticDBの「SQLインテリジェント診断」機能の詳細解説

SQL はビジネス ロジックを表現するためのシンプルで使いやすい言語ですが、スキャンされるデータの量...

SosoはSogouの検索結果を公式に使用

今日、著者は偶然ウェブマスターの統計にログインし、トラフィックが5,000以上のIPアドレスで急増し...

ウェブサイトのメリットに関する質問への回答

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています最近、Ma...

KrakenServers-2.5 USD/Windows/1 GB RAM/20 GB HDD/1 TB Flow/ダラス

Krakenservers は 2009 年に設立され、主にゲーム コンソール会社としてスタートした...

年齢の異なるウェブサイトはどのようなプロモーションプランを採用すべきでしょうか?

ウェブサイトのプロモーションは長期的な作業です。通常の方法で継続的にプロモーションすることによっての...