クラウドネイティブ スーパーコンピューティングの登場: クラウドネイティブ スーパーコンピュータとは何ですか?

クラウドネイティブ スーパーコンピューティングの登場: クラウドネイティブ スーパーコンピュータとは何ですか?

NVIDIA によると、英国ではケンブリッジ大学がクラウドネイティブのスーパーコンピューターを構築している。米国では、2つの研究チームがクラウドネイティブ スーパーコンピューティング用の重要なソフトウェア コンポーネントを別々に開発しています。

ロスアラモス国立研究所は、Unified Communications Framework (UCF) コンソーシアムとの共同プロジェクトの一環として、データ アルゴリズムを高速化する機能の実装を支援しています。オハイオ州立大学は、科学的シミュレーションを強化するために、Message Passing Interface (MPI) ソフトウェアを更新しています。

NVIDIA は、最新の DGX SuperPOD により、クラウドネイティブ スーパーコンピューターを世界中のユーザーに提供しています。 DGX SuperPOD は現在生産中であり、NVIDIA BlueField-2 DPU (データ処理ユニット) などの主要コンポーネントが含まれています。

では、クラウドネイティブ スーパーコンピューティングとは何でしょうか?

リースのピーナッツバターチョコレートのように、クラウドネイティブ スーパーコンピューティングは、業界をリードする 2 つのテクノロジーの利点を組み合わせています。

クラウドネイティブ スーパーコンピューターは、高性能コンピューティングの強力なコンピューティング能力と、クラウド サービスのセキュリティおよび使いやすさを兼ね備えています。

別の観点から見ると、クラウドネイティブ スーパーコンピューティングは、TOP500 スーパーコンピューターと同等のパフォーマンスを備えた HPC クラウドを提供し、アプリケーションのパフォーマンスを犠牲にすることなく、複数のユーザーによる安全な共有を可能にします。

BlueField DPU は、セキュリティ、通信、管理タスクのオフロードを可能にすることで、効率的なクラウドネイティブ スーパーコンピューターを作成します。

クラウドネイティブ スーパーコンピューターの機能は何ですか?

クラウドネイティブ スーパーコンピュータには 2 つの重要な機能があります。

まず、各ユーザーのアプリケーションのセキュリティとプライバシーを確​​保しながら、複数のユーザーがスーパーコンピュータを共有できるようになります。この機能はマルチテナント分離と呼ばれ、今日の商用クラウド コンピューティング サービスでは一般的ですが、本来のパフォーマンスが最優先され、セキュリティ サービスによってシステム効率が低下する技術および科学アプリケーション向けの HPC システムでは一般的に使用されていません。

2 番目に、クラウド ネイティブ スーパーコンピューターは、DPU を使用して、ストレージ、テナント分離セキュリティ、システム管理などのタスクを処理します。これにより、CPU の負荷が軽減され、CPU がタスクの処理に集中できるようになり、システム全体のパフォーマンスが最大化されます。

このようにして、スーパーコンピュータはパフォーマンスを損なうことなくクラウドネイティブ サービスを提供できます。将来的には、DPU はより多くのオフロード タスクを処理するようになり、HPC および AI アプリケーションを実行するときにシステムが常に最高の動作効率を維持できるようになります。

クラウドネイティブスーパーコンピューターはどのように動作するのでしょうか?

現在、スーパーコンピュータには通常、CPU とアクセラレータ (通常は GPU) という 2 つの「頭脳」があります。

アクセラレータは、数千個の処理コアを組み合わせて、AI および HPC アプリケーションにおける最も重要な並列操作を高速化します。 CPU は高速なシリアル処理を必要とするアルゴリズム部分向けに設計されていますが、管理するシステムが大規模かつ複雑になるにつれて、通信層の数が増え続け、CPU にかかる負担が増大します。

クラウドネイティブ スーパーコンピューターは、より高速で効率的なシステムの構築を支援するために設計された第 3 の「頭脳」である DPU を導入します。 DPU は、セキュリティ、通信、ストレージなど、最新のシステムで管理する必要があるタスクをオフロードできます。

スーパーコンピュータ専用チャンネル

従来のスーパーコンピュータでは、実行中のコンピューティング タスクを一時停止し、CPU が通信タスクを処理するのを待つ必要がある場合があります。これは業界ではよく知られている問題であり、システム ノイズと呼ばれています。

クラウドネイティブ スーパーコンピュータでは、計算と通信が並行して処理されます。それは高速道路に3車線を追加して、すべての交通の流れをよりスムーズにするようなものです。

オハイオ州立大学 MVAPICH 研究所は、HPC 通信の分野における専門機関です。ラボでの初期テストでは、特定の HPC ジョブを従来のコンピューターよりもクラウドネイティブ スーパーコンピューターで 1.4 倍高速に実行できることが示されています。同研究所はまた、クラウドネイティブ スーパーコンピューターがコンピューティング機能と通信機能の 100% の重複を達成したことも実証しました。これは、既存の HPC システムよりも 99% 高い数値です。

クラウドネイティブ スーパーコンピューティング: 専門家の視点

これが、クラウドネイティブ スーパーコンピューティングが世界中で導入されている理由です。

ケンブリッジ大学のハイパフォーマンスコンピューティングディレクターのポール・カレハ氏は、次のように述べています。「私たちは、ベアメタルパフォーマンスとクラウドネイティブのInfiniBandサービスを提供する、ヨーロッパ初の研究用クラウドネイティブスーパーコンピュータを構築しています。」

「このシステムは、2020年11月のTOP500リストのトップ100にランクインします。これにより、研究者はスーパーコンピューティングアーキテクチャの最新の進歩を適用して、アプリケーションを完全に最適化できるようになります。」

HPC の専門家は、クラウドネイティブ スーパーコンピューターのさらなる開発への道を切り開いています。

「産業界と学界の主要メンバーで構成される UCF コンソーシアムは、将来のクラウドネイティブ スーパーコンピューティングを実現するために必要な、実稼働レベルの通信フレームワークとオープン スタンダードを作成しています」と、Arm、IBM、NVIDIA、米国国立研究所、米国の複数の大学の代表者で構成される統合コミュニケーション フレームワーク コンソーシアムのディレクター、スティーブ プール氏は述べています。

「当社のテストでは、クラウドネイティブ スーパーコンピューターのアーキテクチャ効率により、スーパーコンピューターの HPC パフォーマンスが新たな高みに引き上げられ、新たなセキュリティ機能が実現できることが示されています」と、オハイオ州立大学のコンピューターサイエンスおよびエンジニアリング教授であり、ネットワーク コンピューティング研究所所長の Dhabaleswar K. (DK) Panda 氏は述べています。

<<:  NVIDIA が世界初の TOP500 研究クラウドネイティブ スーパーコンピューターを運用し、ケンブリッジ大学の科学研究を支援

>>:  分散エッジコンピューティングの時代が到来

推薦する

virpus: 全アイテムが 60% オフ、Xen/Windows、512M シアトル VPS が年間 20 ドルから

virpus は新しい特別プロモーションを実施しており、すべての Xen PV および Xen HV...

同じウェブサイトを構築してもなぜ収益が上がらないのでしょうか?

現時点では、イチゴの卸売価格は1斤4元で、農産物直売所では1斤8元で販売できる。ジュースにすると、1...

対外貿易B2Bプラットフォームプロモーションサービスの選び方 B2Bウェブサイトプロモーション戦略共有

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますインターネ...

Aoyou Hosting: 香港クラウドデータセンターVPSレビュー、中国本土への100Mbps帯域幅直接接続、Windowsをサポート

2010年に設立された老舗ブランドであるaoyohostは、100Mbpsの帯域幅、中国本土への直接...

JVM における TLAB の謎を解明

[[413891]]この記事はWeChatの公開アカウント「プログラマーの成長」から転載したもので、...

Google のウェブサイト最適化ソリューション

昨夜9時頃、グループ内の友人からQQメッセージを受け取り、Googleの最適化について何か調査したこ...

Kubernetes はテクノロジー業界の競争条件を平等にする

新たなインフラ政策と突然の疫病の発生により、企業のデジタル変革が加速し、企業の関連人材に対する需要の...

VULTRはどうですか?カナダのクラウドサーバー(AMDプラットフォーム)の簡単なレビュー

Vultr は米国だけでなくカナダにも複数のデータセンターを持ち、カナダのトロントのデータセンターで...

2018年のローエンドVPS業界のトップ10業者が発表され、再び人々の目をくらませるかもしれない

LETは昨日、低価格VPS業界のトップ10業者の投票結果を発表しました。業者の多くは設立から2年未満...

ブログキャリアを長くするための6つの文章

独立系ブログは皆さんもよくご存知だと思います。Lu Songsong 氏や Mou Changqin...

コア基盤: JVM とは何かを理解しますか? Java仮想マシンの本質を理解する

[[258795]] Java 仮想マシンは、他のプログラムを実行することを目的としたプログラムです...

B2C 電子商取引 SEO に関する 6 つの考慮事項

Liu Yucheng 氏は長い間、自身の経験を共有してきませんでした。電子商取引サイトの全体的な ...

「有料投稿削除」の背後にあるオンライン権力の利権追求「投稿削除に金を払う」という利益連鎖には多くの人々が関わっている

ネット上のネガティブな情報の削除を専門とするPR会社のウェブページ。中には「削除できない投稿はない」...

詳細説明: Linuxネットワーク仮想化技術

Linux ネットワーク仮想化は、LXC プロジェクトのサブプロジェクトです。 LXC には、ファイ...