DPU: サーバー エコシステムの「ハイジャック」

DPU: サーバー エコシステムの「ハイジャック」

DPU はデータ処理ユニットの略です。 AWS の Nitro をはじめ、クラウド コンピューティング技術や製品で数年前から使用されています (Mellanox の CX-5 などに相当するスマート ネットワーク カード ENA ではないことに注意してください)。ただし、ほとんどのクラウド ベンダーは、独自のクラウド プラットフォームでこれを使用しています。最近、NVIDIA CEO の Jensen Huang 氏による DPU 製品 BlueField-X の紹介と製品発表ビデオが大きな話題を呼んでいます。

ブルーフィールド2 伝説

では、DPU とは何でしょうか?類似デバイスである DPU のいくつかの特性について、以下に説明します。

1) DPU は独自の CPU を備えた完全なボードです。組み込み機器ではMIPSのような低性能CPUではなく、ARMなどのサーバー用と同タイプのCPUが一般的です。さらに、このカードには独立したメモリ、ディスク、ネットワーク カード、構成可能な GPU およびその他の拡張デバイス、および独立した BMC と OS も搭載されています。つまり、物理的な形状を無視すれば小型サーバーです。

2) DPU デバイスが動作している場合、一般的なサーバーに接続された補助デバイスとして有効になり、PCI デバイスを介してホストと情報を交換します。ホスト OS の観点から見ると、DPU デバイスは透過的ですが、それが提供するネットワーク、ストレージ、セキュリティなどの機能は表示されます。

3) DPU デバイスの起動/再起動は、それが属するホストによって異なります。両者の OS は互いに独立していますが、制御情報の伝送とデータ情報のやり取り (PCI インターフェイス経由) が行われます。スマート ネットワーク カードと比較すると、それが属するホスト内で完全に可視および制御可能です。

4) 前述のように、 DPU はスマート NIC またはスマート NIC の拡張バージョンであると考える人が多くいます。個人的にはそうは思いません。一方、DPU はスマート NIC よりも包括的な機能 (ネットワーク機能、ストレージ機能、セキュリティ機能など) を備えています。一方、スマート NIC のドライバーは通常ホストにありますが、DPU にはドライバーはまったく必要ありません。最後に、DPU には独立した CPU と OS がありますが、スマート NIC はドライバー デバイスのみです。したがって、DPU は既存の NIC デバイスの拡張バージョンではなく、まったく新しいソフトウェア定義インフラストラクチャ デバイス (Software-Defined Infrastructure) です。

上記の点から、DPU が提供できる機能は次のようになります。

1) ホストにネットワーク処理機能、ストレージ処理機能、セキュリティ処理機能を提供します。これらの機能は、DPU OS ソフトウェア スタックを使用して実装することも、スマート ネットワーク カードやセキュリティ デバイスを通じてオフロードされたハードウェアを使用して実装し、処理パフォーマンスを向上させることもできます。たとえば、NVIDIA の BlueField-2 は ConnectX-6 を統合して 200G イーサネットまたは IB 処理機能を提供し、仮想スイッチ オフロードを実装します。

2) DPU型デバイスで使用されるCPUは、前述のARMになります。技術的には、X86 などの同等の機能を備えた他の CPU でも可能ですが、製品化の際には、パフォーマンス、消費電力、製品サイズ、ホスト スロットなどの影響を考慮する必要があります。

3) AWS Nitro カードなどの DPU タイプのデバイスもハイパーバイザー機能を提供できるため、BMS および EC2 インスタンスに一貫した製品アーキテクチャと機能が提供されます。これは、BMS 製品の実装にとって特に重要です。詳細については、Alibaba の Shenlong 関連の説明を参照してください。

4) DPU タイプのデバイスは、「異機種」のサーバー エコシステムを独立して構築する機能を提供します。たとえば、X86 サーバーでは、Mellanox (NVIDIA が買収) や NVIDIA の GPU などの多くのネットワーク カードは、X86 マザーボード CPU に直接関連付けることなく、標準の PCI 標準を通じて X86 上で対応する機能を簡単に提供できます。これにより、他のメーカーは、サーバーのホスト CPU 周辺機能を構築するためのチャネルをさらに提供できるようになり、ホスト CPU に縛られたり依存したりすることがなくなり、ホスト CPU メーカーによって設定された「しきい値」を「バイパス」することもできます。

それでは、上記の内容と組み合わせて、DPU の出現が業界に何をもたらすのかを見てみましょう。

1) 技術的には、DPU デバイスをホストに接続することで、ホスト リソースの使用率を最大化できます。 DPU が安価であるため、クラウド コンピューティング シナリオでより多くのホスト CPU を販売できるようになり、より大きな単一の EC2 インスタンスや BMS を提供するためのソリューションも提供されます。ホスト CPU の販売数が増えたということは、ホストの数が増えたのではなく、販売される製品の数が増えたということです。さらに、DPU のスマート ネットワーク カードなどのハードウェア オフロードを使用すると、ネットワーク機能とストレージ機能、および暗号化と復号化のセキュリティ機能が向上します。 DPU デバイスのホストに対する透過性により、侵入後のクラウド コンピューティング ホストの拡散分離機能が向上します。

2) 商業的な観点から、 NVIDIA の DPU を例にとると、NVIDIA 製品のネットワーク カードと GPU 周辺機器は、ホストのマザーボード/オンボードによって制約されなくなりました。これは、前述のように、DPU デバイスが PCI 標準を介して通信し、CPU のコンピューティング パワーを徐々に奪取するためです。つまり、顧客のデータ センター内の既存の X86 デバイスを維持しながら NVIDIA のデバイス機能を追加し、このコンピューティング パワー市場を徐々に侵食し、データ センターにおける NVIDIA の総合的な機能を構築し、最終的にデータ センターにおける「フル スタックのデバイス」という目標を達成できます。たとえば、Intel CPU オンボード ネットワーク カードはこのメーカーのものでなければならないなどの制限を打ち破る。

3) トレンドの観点から見ると、 DPU デバイスはホストをより「インテリジェント」にします。オリジナルのサーバーには通常、管理機能 (BMC) が搭載されていますが、インターフェースの標準化、インターフェースのパフォーマンス、機能の豊富さは常に不十分でした。 DPU デバイスは、データセンター ハードウェア機器の SDN (ネットワーク定義ソフトウェア) と SDS (ネットワーク定義ストレージ) に続く SDC (ネットワーク定義コンピューティング) の最終リンクを実現する方法を提供します。純粋な仮想化コンテンツを備えた元の SDC と比較して、最終的には機能と機器のインテリジェントな管理と制御、つまり前述の SDI 機能を実現します。

4) DPU 機器の登場により、特にクラウド シナリオにおいてデータ センター サーバー機器によって引き起こされるいくつかの問題が解決され、データ センターのインテリジェンスの重要な部分が実現されました。ただし、現時点では、X86 サーバーの CPU ホストが NVIDIA の DPU を使用する場合、CPU のオンボード ネットワーク カードは役に立たなくなり、全体的な機器調達コストと調達プロセスにも影響するため、DPU の選択では市場と顧客の要因を考慮する必要があります。

5) システム全体の運用の観点から、単一ホストの本来の許容障害範囲が、DPU デバイスと CPU ホストを含​​むように拡張されました。どちらかが故障すると、全体的に損害が発生し、信頼性と安定性が低下します。結局のところ、「ただのランチはない」のです。利益を得たいなら、お金を払わなければなりません。唯一の疑問は、この価格が顧客に受け入れられるかどうかだ。

6) DPU は結局のところハードウェア製品です。その研究開発にはCPUだけでなく、ネットワークカード、OSなども含まれるため、DPUをベースにしたいわゆる自主研究開発とサーバー機器そのものとの間に大きな違いはありません。設備のサイズ制限により、製造精度に対する要件がさらに厳しくなります。したがって、DPU の製造はサーバー統合として行うことができます。サーバーベンダーから学べる技術はまだまだたくさんあります。したがって、DPU 型デバイスがすべてスタートアップ企業によって自社開発されている場合、この自社開発という記述の信憑性は当然疑問視されます。

つまり、DPU デバイスはより実用的な機能を提供しており、NVIDIA などのメーカーも製品の位置付けや市場を考慮していますが、「データセンター インフラストラクチャ」という用語は、メーカー自身の目標のためのスローガンとしか見なされておらず、まだ必要ではありません。 DPU市場の観点から見ると、主にクラウドコンピューティングのシナリオで使用され、主要なクラウドコンピューティングメーカーは基本的に独自の設備を自社開発するか、設備の協力とカスタマイズを行っています。 DPU 製品の道のりは、本当に広くはないため、時間をかけて先の道を見極める必要があります。

<<:  マイクロソフト、クラウド環境向けセキュリティ評価アプリケーション「Cloud Katana」をオープンソース化

>>:  2021年上半期のクラウドコンピューティングの振り返り:利益、セキュリティ、政府対応が3つの新たな課題に

推薦する

ページ速度を利用してウェブサイトのパフォーマンスを最適化する方法(パート 1)

SEOウェブサイト最適化において、ウェブサイトのパフォーマンスは実は検索エンジンに大きな影響を与えま...

パブリッククラウド、プライベートクラウド、ハイブリッドクラウド: 企業はどのように選択すべきでしょうか?

この記事はWeChatの公開アカウント「Computer World」から転載したもので、著者はIs...

企業がWeiboマーケティングを行うためのいくつかの重要なポイント

インターネットの急速な発展に伴い、Weiboは人々の新たなお気に入りのオンラインソーシャルネットワー...

azzavps-1.5g メモリ/15g SSD/1T トラフィック/ニューヨーク/月額 5.5 ドル

ニュージーランドの VPS 業者である azzavps は、同社初の SSD ハード ドライブ VP...

DouMi創業者趙世勇:製品とサービスの革新を利用して、サービス産業の採用と管理のアップグレードと進化を実現する

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています5月25日...

ソフト記事マーケティングの実現可能性について

私たちが生きている時代は、情報が豊富で双方向のコミュニケーションが可能な時代です。さまざまな情報チャ...

企業サイト構築における採点項目とスコア向上の方法とは?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスウェブサイトの重み、PR...

ウェブページの信号対雑音比と SEO 最適化

ウェブマスターの友人は皆、SEO 最適化について知っているかもしれませんが、ウェブページの信号対雑音...

タオバオの信用詐欺に対するゼロトレランスにより、多くの個人が店舗を閉鎖することになった。

最近、多くのタオバオストアが閉鎖されました。10月28日、タオバオは初の公式発表を発表し、「信用詐欺...

プログラマーがジュースの販売に転向: ユーザーを維持した方法

昨年11月から、地下鉄近くの小さな倉庫と小さなカートから始めて、西二旗周辺のITエリアでザクロジュー...

OpenStack プロジェクト: VMware の貢献が最も大きかったのはどれですか?

VMware Integrated OpenStack は VMware のポートフォリオの中で最も...

海外戦略を勝ち取る:コスト管理の5大課題を一気に解決

経済のグローバル化は時代の不可逆的な流れとなっている。ますます多くの中国企業が積極的に海外市場を拡大...

ウェブサイトのランキングに影響を与える可能性のある4つの要素について簡単に説明します。

A5 フォーラムを頻繁に訪れる友人は、ウェブサイトのランキングを上げるのが難しい、または長い間上昇も...

中小規模のウェブサイトの危険性とチャンス: 即時検索から即時使用へ

5月中旬、百度は登録ユーザー向けに「百度ホームページに追加」機能を開始し、検索結果の下に「このウェブ...

クラウドコンピューティングの新たなトレンド

急速に進化するクラウド環境において、これらの新たなクラウド トレンドは、コストの最適化、回復力の確保...