私たちの仕事は、たくさんの情報を読まなければなりませんが、この業界には細分化された分野がたくさんあります。私たちの時間は限られており、現代人は読書に割ける時間がさらに少なくなっています。一つの疑問は、深く読むべきか、それとも広く読むべきかということです。 私は最近、Shopify[1]の元開発チーム責任者であるサイモン・エスキルセン氏のインタビューを読みました。サイモン・エスキルセンは高校生でしたが、Shopify の創業年に入社し、会社とともに技術マネージャーに成長しました。彼は学位を持っていないが、多読を通じてコンピューターと経営の知識を学んだという。サイモン・エスキルセン氏はインタビューの中で、T 型人間、つまり 1 つの分野に深く精通しながらも、複数の分野に幅広い知識を持つ人間になることを目指していると述べています。 以前の記事では、分散コンピューティング、ストレージ、調整などのトピックについて説明しましたが、ネットワークの側面については説明していませんでした。 「SRE: Demystifying Google Operations」の中で、私に深い印象を残した一文があります。「UNIX システムの内部詳細と 1~3 層のネットワーク知識は、Google が最も重視する 2 つの追加技術力です。」 私のネットワークに関する知識は比較的乏しく、最近たまたま仕事でネットワーク アーキテクチャ関連の知識を設計していたので、10 月に中断して、最新のデータ センター ネットワーク アーキテクチャに関する知識を読み始めました。読者の皆さんも私と一緒に考えてみてください。新しいデータセンター ネットワーク アーキテクチャを設計するように依頼されたら、どうしますか? この答えは、O'REILLY の新しい本「Cloud Native Data Center Networking」にあります。私はもともと原書を読みましたが、本に出てくる英語のインターネット用語の一部が理解できませんでした。最近中国語版が出版されたので、読んでメモを取ってみました。 新しいネットワークアーキテクチャが必要な理由アプリケーション層が変更されなければ、それについて議論する必要はありません。クラウド ネイティブ データ センター ネットワークについて言えば、このアーキテクチャは最新のクラウド ネイティブ アプリケーション向けに設計されています。では、最新のクラウドネイティブ アプリケーションの特徴は何でしょうか? この本では、「アプリケーション ネットワーク」アーキテクチャの進化は、次の図に示すように 4 つの段階を経てきたと述べられています。 1. モノリシックアプリケーション
2. クライアントサーバー(C/S)アーキテクチャ
3. Webアプリケーション
4. マイクロサービス
分散アプリケーションの大きな変化によってネットワークが不意を突かれたことがわかります。従来のネットワークはなぜ「ペースを維持」できないのでしょうか? 上の図は従来のネットワークを示しています。このタイプのネットワーク設計は、「アクセス集約コア」アーキテクチャと呼ばれます。コンピュータはアクセス スイッチに接続され、その上にはコア ネットワークに接続された 1 組の分散集約スイッチがあり、アクセス層を外部ネットワークに接続します。 アクセス集約コア ネットワークは、次の 3 つの理由からブリッジング テクノロジに大きく依存しています。
ルーティングとブリッジングの違い: ブリッジングは、OSI ネットワーク モデルの第 2 層であるリンク層で機能します。スイッチまたはブリッジは MAC アドレスに基づいてデータを交換し、リンク層はデータ フレームを交換します。ルーティングは、OSI の第 3 層であるネットワーク層で機能します。ルータは IP アドレスに基づいてターゲット アドレスを見つけ、ネットワーク層はデータ パケットを交換します。 従来のネットワークは成功していますが、ブリッジ ネットワークには依然として次の制限があります。
転送ネットワークでは、各パケットは送信元アドレスと宛先アドレスの 2 つの MAC アドレスを伝送します。ブリッジは、自身の MAC アドレス テーブルで宛先 MAC アドレスを検索します。認識できない場合は、パケットを受信したインターフェイスを除く他のすべてのインターフェイスにパケットを送信します。ブリッジが自身の MAC アドレス テーブルで転送するデータ パケットの宛先 MAC アドレスを見つけられない場合に、データ パケットをすべてのポートに送信する動作をフラッディングと呼びます。 アクセス集約コア モデルは、南北トラフィックが中心となるクライアント サーバー アプリケーション アーキテクチャに非常に適しています。最近では、サーバー間アーキテクチャが増え、アプリケーションの規模も大幅に拡大しています。アクセス集約コア モデルには次の問題があります。 1. スケーラビリティがない
2. 複雑さ。ブリッジングネットワークでは、STP、FHRP、リンク障害検出、ベンダー固有のプロトコル(VTPなど)など、多くのプロトコルのサポートが必要です。 3. 障害ドメイン 粗粒度の障害が発生しやすい。例えば、1つのリンクに障害が発生すると、帯域幅が半分になる。 4. 予測不可能性。コンポーネントが多すぎるとネットワークが予測不可能になり、障害箇所の特定が難しくなる可能性がある。 敏捷性の欠如。クラウド コンピューティングの分野では、テナントはリソースを継続的に使用または破壊しており、VLAN では、ネットワーク内の各ノードが適切に動作するために VLAN 情報を使用して正しく構成されている必要があります。 VLAN の追加または削除は、時間と労力を要するプロセスです。 ブリッジング技術の支持者は諦めず、これらの問題に対する多くの解決策を提案してきましたが、現代のエンタープライズ データ センターで使用されているものはほとんどありません。 クラウドネイティブ データセンター インフラストラクチャは、非常にスケーラブルなネットワーク アーキテクチャを構築することを目指しており、Clos はそのアーキテクチャです。 クロストポロジーClos トポロジは、下の図に示すように、発明者である Charles Clos にちなんで名付けられました。このトポロジは、リーフ スパイン トポロジ (またはスパイン リーフ アーキテクチャ) とも呼ばれます。 上の写真では:
Clos トポロジでは、任意の 2 つのサーバー間に 3 つ以上のパスが存在するため、東西トラフィックをサポートする大容量ネットワークが実現します。従来のネットワークと比較して、Clos アーキテクチャは優れた水平スケーラビリティも備えています。
「アクセス集約コア」は、垂直拡張のために、より強力な集約スイッチにのみ置き換えることができます。 Clos アーキテクチャの詳細1. Clos アーキテクチャには次の機能もあります。 2. リーフとスパインでは、同様の小型スイッチを使用してネットワークを構築できます。 基本的な相互接続モードとしてのルーティング Clos は STP を使用せず、単一ラック内での直接ブリッジングのみをサポートします。ラック間のブリッジングでは、より最新のネットワーク仮想化ソリューション (VXLAN など) が使用されます。 3. クローズ収束比 1:1 の収束比を持つネットワークは非ブロッキング ネットワークとも呼ばれ、アップリンク帯域幅がダウンリンク帯域幅と等しくなります。スパインスイッチとリーフスイッチの両方がnポートスイッチである場合、1:1の収束比でClosトポロジに接続できるサーバーの最大数はn^2/2です。 4. リンクレート スイッチ リンクがサーバー リンクよりも高いレートを使用する場合、同じコンバージェンス比をサポートするために使用できるスパイン スイッチの数が少なくなります。 5. 実用的な制限 冷蔵、キャビネット、放熱、サーバーの配置などの制限により、上記の理論をそのままデータセンターに実装することはできません。通常、1 つのキャビネットには 20 台または 40 台のサーバーを収容できます。その結果、スパイン ポートの数は多くなり、リーフ ポートの数は少なくなります。機器メーカーは通常、異なるスパイン スイッチとリーフ スイッチを提供します。 6. 細分化された障害ドメイン
Closアーキテクチャの拡張数万台または数十万台のサーバーをサポートする大規模なデータセンターを構築する場合は、次の図に示すように、3 層の Clos トポロジを拡張する必要があります。拡張方法は 2 つあります。
拡張された 3 層 Clos トポロジの最上位スイッチは、「スーパー スパイン スイッチ」と呼ばれます。 2 つのモデルの長所と短所の比較:
Clos トポロジの影響とベストプラクティスClos トポロジには次のような効果があります。
Clos トポロジのベストプラクティス:
この本には、LinkedIn と Dropbox が一貫性のないスイッチを使用したことを後悔していると書かれています。 この記事はWeChatの公開アカウント「Duo Ketang」から転載したものです。下のQRコードからフォローできます。この記事を転載する場合は、Duoketangの公式アカウントまでご連絡ください。 |
<<: VMware、マルチクラウド時代を乗り切る企業を支援する新たな戦略と製品を発表
>>: エッジコンピューティングと5Gがパンデミック後の経済回復を推進
テクノロジーの世界が進化し続ける中、エッジ コンピューティングと量子コンピューティングという 2 つ...
海外でプロモーションするアプリの場合、現在のプロモーションはアプリストアを含むトラフィックの購入が中...
ロシアのインターネット投資王ユーリ・ミルナー新浪科技報、北京時間9月24日、ロシアのインターネット投...
Edgevirt は現在、Equinix のマイアミ データ センターの VPS、ストレージ VPS...
昨年好評だったヴィンセントのテキストやヴィンセントの写真から、今年初めのヴィンセントのビデオまで、A...
多くの同僚が、Web サイトのコンバージョン率というトピックについて話しているのを耳にしました。これ...
パンデミックにより、わずか 2 年で医療のイノベーションのペースが 10 倍に加速し、医療機関は短期...
昨年、業界アナリストは「クラウド コンピューティングの減速」が懸念されると警告しました。これは、予算...
Raksmartは、ロサンゼルスのデータセンターにChina UnicomのハイエンドAネットワーク...
Kubernetes アーキテクチャのさまざまなコンポーネントがどのように組み合わされているかを理...
リバプールが最近シュツットガルトから日本人ミッドフィールダーの遠藤航を獲得したことで、日本での同サッ...
従来のネットワーク アプローチでは、ネットワーク トラフィックの構成、管理、および誘導にハードウェア...
今日は何もすることがないので、映画コレクションステーションの運用アイデアについてお話ししましょう。私...
edgenat は、韓国のネイティブ IP を使用する韓国の VPS を新たに開始しました。韓国のネ...
6 月 28 日、8 月 25 日、10 月 26 日、親愛なるウェブマスターの友人たち、この 3 ...