アリババクラウドの第8世代エンタープライズクラスインスタンスG8iがアップグレードされ、コンピューティング能力が向上しました。全体的なマシンパフォーマンスは85%向上し、AI推論速度は最大7倍に向上しました。

アリババクラウドの第8世代エンタープライズクラスインスタンスG8iがアップグレードされ、コンピューティング能力が向上しました。全体的なマシンパフォーマンスは85%向上し、AI推論速度は最大7倍に向上しました。

アリババクラウドは1月11日、第8世代エンタープライズレベル汎用コンピューティングインスタンスECS g8iのコンピューティング能力がさらにアップグレードされたと発表した。これは、コードネーム「Emerald Rapids」と呼ばれる第5世代Intel Xeonスケーラブル・プロセッサーの国内初発売となる。 Alibaba Cloud が独自に開発した「Feitian + CIPU」アーキテクチャ システムを採用することで、ECS g8i インスタンスの全体的なパフォーマンスが最大 85% 向上し、AI 推論パフォーマンスが最大 7 倍向上します。最大 72B のパラメータを持つ大規模な言語モデルをサポートできるため、小規模および中規模のモデルの構築コストを 50% 削減できます。同時に、新しいインスタンスはエンドツーエンドのセキュリティ保護も提供し、企業が信頼できる AI アプリケーションを構築するための強力なプライバシー強化コンピューティング パワー サポートを提供します。

Alibaba Cloudのエラスティックコンピューティング製品ラインのゼネラルマネージャーである張先涛氏は、「 Alibaba Cloud ECS g8iインスタンスの強力なパフォーマンスは、CPU中心のコンピューティングシステムにもAI推論を加速する大きな可能性があることを証明しています。パブリッククラウドは、超大規模なAIモデルを処理できるだけでなく、AIアプリケーションの実装を加速するための新しい道を切り開きます」と述べています。

インテルの中国データセンターおよび人工知能グループのXeonクライアントソリューション部門ゼネラルマネージャー、リー・ヤドン氏は次のように述べた。「最新の第5世代インテルXeon®スケーラブル・プロセッサーには、各コアにAIアクセラレーション機能が組み込まれており、要求の厳しいAIワークロードに十分対応できます。前世代と比較して、AIトレーニングのパフォーマンスは最大29%向上し、AI推論能力は最大42%向上しました。アリババクラウドの第8世代エンタープライズクラスインスタンス(ECS g8i)を通じて、開発者がテクノロジーの包摂を実現し、AIテクノロジーをユビキタスにすることを支援したいと考えています。」

一般的な計算能力がさらに向上し、全体的なパフォーマンスが85%向上しました

エンタープライズレベルの汎用コンピューティングインスタンスであるECS g8i インスタンスは、コンピューティング、ストレージ、ネットワーク、セキュリティ機能が総合的に向上しています主要なパラメータとしては、 ECS g8i インスタンスのL3 キャッシュ容量が 320 MB に増加し、メモリ速度は 5600 MT/s に達し、全体的なパフォーマンスは 85% 向上し、シングルコア パフォーマンスは 25% 向上しました。ストレージに関しては、ESSD クラウド ディスクは 100 万 IOPS を提供し、NVMe を完全装備し、ストレージ レイテンシは 100 マイクロ秒と低くなっています。ネットワーク面では、PPSが3,000万と高く、Alibaba Cloudが独自に開発したeRDMA大規模アクセラレーション機能を標準装備し、レイテンシは8マイクロ秒と低くなっています。セキュリティの面では、ECS g8i インスタンスは、信頼できるコンピューティングや暗号化コンピューティングなどの機能をサポートし、機密性の高い仮想マシン向けの TDX テクノロジーを世界で初めてサポートし、包括的なセキュリティ保護を構築します。

E2E シナリオでは、ECS g8i インスタンスはMySQL のパフォーマンスを最大 60%、Redis と Nginx のパフォーマンスをそれぞれ 40% と 24% 向上させ、ゲーム、ライブ ビデオ ストリーミング、e コマース、金融、ヘルスケア、エンタープライズ サービスなどの業界に強力なコンピューティング パワー サポートを提供し、データベース、ビッグ データ、AI 推論などのアプリケーション シナリオにおける厳しいパフォーマンス要件を満たします。

さらに、ECS g8i インスタンスは、QAT や IAA などのアクセラレータを含むさまざまなハードウェア ネイティブ アクセラレーション機能も提供します。 Alibaba Cloud は独自のテクノロジーを使用して、ハードウェア アクセラレーション機能をインスタンス仮想マシンにさらに細かく送信し、小規模な ECS g8i インスタンスにもアクセラレーション機能を持たせています。その中で、QATネイティブ暗号化および復号化アクセラレータであるECS g8i インスタンスのパフォーマンスは、圧縮/解凍シナリオで最大 70 倍向上し、暗号化および復号化のパフォーマンスは 4 倍以上向上します。

AIを高速化し、72Bパラメータの大規模言語モデルをサポート

生成 AI によってもたらされた技術革命は、コンピューティングのパラダイムに根本的な変化をもたらしています。現在、AI 大規模モデル推論は、計算能力に関して依然として多くの課題に直面しています。たとえば、最初のパケットの遅延は並列処理機能と浮動小数点計算機能によって制限され、スループット パフォーマンスはメモリ帯域幅とネットワーク遅延によって制限されます。

Alibaba Cloud ECS g8i インスタンスは、組み込み命令セットを AVX512 から Intel AMX アドバンスド マトリックス エクステンション アクセラレーション テクノロジーにアップグレードするなど、これらの課題に対処するために大幅に最適化されており、これにより生成 AI の実行速度が向上します。 AVX512 命令セットと比較すると、AMX AI アクセラレーションを有効にすると、ECS g8i インスタンスの int 8 行列計算のパフォーマンスが最大 7 倍向上します。

g8iはAMX AIアクセラレーション機能をベースに、小規模・中規模のパラメータモデルへの対応をより迅速に行うことができ、知識検索、質問応答システム、要約生成などのAIワークロードを実行する場合、 A10 GPUクラウドサーバーに比べて初期構築コストが50%削減されます。さらに、Alibaba Cloud プラットフォームのスポットプリエンプティブインスタンスにより、コストの優位性がさらに強調され、 AI 推論のコストがさらに削減されます。

同時に、自社開発のeRDMA超低遅延弾性ネットワークをベースにしたAlibaba Cloud g8iインスタンスクラスターは、超低遅延ネットワークと高い弾力性の利点を備えており、72Bパラメータの大規模言語モデルの分散推論を容易にサポートできます。推論パフォーマンスはクラスターのサイズに応じてほぼ直線的に加速され、32 バッチサイズを超える超大規模パラメータスケールの AI モデル負荷をサポートし、テキスト グラフィックス、AI コード生成、仮想アシスタント、クリエイティブ支援ツールなどの AI ワークロードを実行できます。

Alibaba Cloud Tongyi Qianwenがオープンソース化したQwen-72B 大型モデルを例にとると g8i インスタンスの eRDMA ネットワーク上に構築されたクラスターで効率的に運用できます。入力が 500 ワード未満の場合、最初のパケットの遅延は 3 秒未満で、 1 秒あたり 7 個のトークンを生成できます。

セキュリティを強化し、企業が信頼できるAIアプリケーションを構築できるよう支援します

セキュリティの面では、Alibaba Cloud は、データ保存、データ転送、データコンピューティングの全プロセスのセキュリティを確保するために、製品ライン全体にわたってエンドツーエンドのセキュリティ保護を構築しています。最下層では、CIPU ベースのセキュリティ アーキテクチャに、ハードウェアの信頼のルートとしてセキュリティ チップ TPM が装備されており、サーバーの信頼できる起動を実現し、改ざんがゼロであることを保証します。仮想化レベルでは、仮想信頼機能 vTPM をサポートし、インスタンス起動プロセスのコア コンポーネントの検証機能を提供します。インスタンスの信頼に基づいて、さまざまなプラットフォームの機密コンピューティング機能をサポートし、実行状態でのメモリデータの分離と暗号化保護を実現します。

アップグレードされた ECS g8i インスタンスは、 Trust Domain Extension TDX の技術的機能を完全にサポートしていることは注目に値します。ビジネス アプリケーションは変更なしで TEE に展開できるため、技術的なハードルが大幅に下がります。また、パフォーマンスの低下が極めて少ない大規模モデルなどの AI アプリケーションにプライバシーが強化されたコンピューティング能力を提供し、大規模モデルのクラウド データのセキュリティを保護します。

Qwen-Chat-7B モデルを例にとると、TDX を有効にすると、モデル推論のセキュリティと信頼性が確保されるだけでなく、データの機密性と整合性も保護されます。

「アリババクラウドは今後も技術の深化と製品革新を続け、企業にさらに安定的、強力、安全かつ柔軟なコンピューティングサービスを提供し、さまざまな業界でのAIアプリケーションの本格的な爆発的な普及を促進していきます」と張先涛は述べた。

<<:  Baidu Shendou: AIネイティブアプリケーションを作るには2つのステップが重要

>>:  AI 用に開発されたスーパーチップは、クラウド コンピューティングのパワーを地元企業に還元するのでしょうか?

推薦する

仮想化技術を使用してインフラストラクチャクラウドを構築することの利点と欠点の分析

サーバー仮想化テクノロジーを使用してインフラストラクチャ クラウドを構築することには、利点と欠点の両...

ウェブサイトの最適化: ウェブサイト構築の詳細

オンライン マーケティング モデルが普及している時代では、その市場シェアは拡大し続けており、Web ...

ウェブサイトの直帰率がウェブサイト全体に及ぼす一般的な影響についての簡単な分析

Baiduが統計ツールをリリースして以来、ウェブサイトの直帰率をより明確に把握できるようになりました...

SEOの10本の指を傷つけるよりは、1本の指を切断するほうがましだ

長い間記事を書いていませんでした。恥ずかしながら、最近、何度も考えた結果、SEOのいくつかの方法をま...

ネットユーザーの皆さん、端午の節句おめでとうございます!

端午節は3日間休みです。皆さんが楽しい休日を過ごせますように。たくさん食べて、たくさん飲んで、たくさ...

Baiduがすぐに組み入れられるようにウェブサイトのアイデアと実践を準備する

多くのウェブマスターの友人は、ウェブサイトを構築したらすぐに検索エンジンに登録されることを望んでいる...

2019年のクラウドコンピューティングのレビュー:5G+AI+クラウドがトレンドになり、クラウドゲームが次のホットスポットになる可能性

2019年へのカウントダウンが始まりました。クラウド コンピューティング市場を振り返ると、変化と課題...

JVM を知らない場合、どうやってアーキテクトになるのでしょうか?この記事ではJVMを理解する方法を説明します

Java 仮想マシンについて学ぶ必要があるのはなぜですか? 1. Java が下位レベルでどのように...

MLMウェブサイトが禁止されているにもかかわらず、依然として人気がある理由:報告、証拠収集、調査が難しい

Jinqiao.comホームページのスクリーンショット「毎月2人を雇えば、1年後には月収が少なくとも...

中国にIMDbがない理由:標準化された情報の必要性とUGCの難しさ

中国にIMDbがない理由:標準化された情報ニーズとUGCの難しさIMDb(インターネット映画データベ...

ショッピングモールのウェブサイトが自然ランキングを向上させる方法の詳細な分析

A5 Taoke 冬の特別テーマのため、私はこのウェブサイト Yilianwang に注目しました。...

グローバルエンタープライズKVMオープンソース貢献リストが発表、テンセントクラウドは5年連続でリスト入り

9月16日夜、世界トップの仮想化技術サミットKVMフォーラムで、2021年グローバルエンタープライズ...

Portainer を使用して Docker ネットワークを作成および管理するにはどうすればよいですか?

​翻訳者 |ブガッティ校正:孫淑娟Docker コンテナを初めて使用する場合は、私のお気に入りの D...

Baiduのセキュリティリスク警告を削除する方法

9月3日のアップデートで、百度はウェブサイトのセキュリティリスク警告機能を正式に追加しました。ハッカ...

分析例: ウェブサイトがそもそも存在しないという事実は、そのサイトの権威が低下することを意味しますか?

今朝目覚めると、北京SEOブログのホームページが1位ではなく、ランキングも下がっていました。私はこれ...