Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

9月12日、Alibaba Cloudは最新世代のGPUインスタンスGN5iを正式にリリースしました。この製品は主にディープラーニングのオンライン推論段階に適しています。 TensorFlow などの主流のディープラーニング フレームワークをワンクリックで導入でき、インテリジェントなスケジューリング、自動運用・保守、リアルタイムの容量拡張などのサービスも提供できます。人工知能業界のユーザーは、GN5i を使用してマイクロ秒単位の応答時間で AI サービスを構築し、オンライン サービスのコストを 50% 以上削減できます。

Alibaba Cloudの公式サイトによると、GN5iはNVIDIAのPascalアーキテクチャP4グラフィックプロセッサを採用しており、45TopsのINT8整数演算能力と11TFlopsのFP32単精度浮動小数点演算能力を提供するという。データ処理スループットを満たしながら、レイテンシをマイクロ秒単位まで短縮できます。時間単位の支払いだけでなく、月単位や年単位のサブスクリプションもサポートしています。

さらに、自作 GPU サーバーでよく発生する困難な拡張や適応の問題に対応するため、GN5i 仕様ファミリーは柔軟で弾力性のある一連の構成を提供します。ディープラーニングの計算能力の要件に応じて適切な仕様をオンデマンドで選択し、数分でインスタンスを作成できます。また、コンピューティング能力の要件に応じて、GPU インスタンスの水平方向の拡張を「スケールアウト」したり、垂直方向の構成を「スケールアップ」したりすることもできます。

Alibaba Cloud のシニア技術専門家である Long Xin 氏は、AI ディープラーニングのオンライン推論シナリオに関しては、GN5i インスタンスが顧客に次のような価値をもたらすことができると述べています。

ディープラーニング推論タスクの処理効率を保証する安定したエンタープライズレベルの GPU コンピューティング機能。

TensorFlow、Caffe、MXNet、CNTK などの主流のディープラーニング フレームワークと完全に互換性があります。

Alibaba Cloud の高性能 SSD クラウド ストレージを搭載し、データの読み取りパフォーマンスを高速化します。 Alibaba Cloud の OSS ストレージ サービスと組み合わせることで、最高のストレージ費用対効果を実現できます。

データ処理スループットの要件を満たす場合、レイテンシはマイクロ秒レベルに達する可能性があります。

· 推論ベースの専用 GPU により、AI オンライン サービスの構築コストが大幅に削減されます。

GN5i の発売により、Alibaba Cloud の異種コンピューティング ファミリーの製品ラインがさらに充実します。モデルのトレーニングと学習のために、Alibaba Cloud は今年 5 月に高性能 GPU インスタンス GN5 をリリースしました。 1 つのインスタンスで、最大 8 個の NVIDIA P100 GPU、20,000 個を超える並列処理コア、75 TFLOPS FP32 単精度浮動小数点、150 TFLOPS FP16 半精度浮動小数点、37 TFLOPS FP64 倍精度浮動小数点のコンピューティング機能を提供できます。各 P100 には 16GB HBM2 3D スタック メモリが搭載されており、最大 732GB/秒のデータ転送速度を実現します。 GN5iと組み合わせることで、ディープラーニングの処理効率を効果的に確保できます。

製品レベルに加えて、Alibaba Cloud は、インテリジェントな音声対話、画像/ビデオ認識、トラフィック予測、感情分析、その他の技術サービスを含む、人工知能業界の包括的なサービスも提供しています。これらの技術は Alibaba Cloud ET を通じて輸出されています。過去1年間、アリババクラウドは、工場や病院の利益増大や診断精度の向上を目的とした、ET City Brain、ET Industrial Brain、ET Medical Brainなどの業界垂直型人工知能システムを立ち上げました。

<<:  Alibaba Cloud、人工知能の実装を加速する新しいFPGAコンピューティングインスタンスF2をリリース

>>:  Alibaba Cloud がクラウドベースの「スーパーコンピューティング センター」E-HPC を開始

推薦する

事例分析:キーワード検索時にウェブサイトの説明が表示されない理由

みなさんこんにちは。私は湖南省出身のキネスです。今日、私はSouwaiフォーラムでウェブマスターから...

ウェブサイト上の検索システムと推奨システムにはどのような関係がありますか?

ポータルサイトを開くと、サイト内検索、つまりサイト内検索があり、ユーザーが必要な情報をすばやく見つけ...

李佳奇がWeChatで新ビジネスを開始

最近、李佳琦の公式WeChatミニプログラム「全少女会員サービスセンター」(以下、「全少女」)に新た...

virtury: パキスタン VPS、月額 10 ドルから、帯域幅 100Mbps、メモリ 1G/コア 1 個/SSD 25g/トラフィック 1T

パキスタンのホスティングプロバイダーであるVirturyは、主に仮想ホスティング、VPS/クラウドサ...

ブランドマーケティングイノベーション理論!

前回の記事「ブランド革新理論:群衆を折り畳む(1)-「市場細分化」と「ポジショニング」から「新コミュ...

ufovpsはどうですか?ロサンゼルスCN2ラインVPSの簡単なレビュー

HostCat はこれまで ufovps の米国 BGP 高防御 VPS をテストしてきました。今日...

クラウドストレージ分野における3つの大きな誤解

クラウド ストレージ分野には、クラウド ストレージは環境に優しくない、企業はセキュリティ上の理由から...

エッジコンピューティングを活用して 5G の世界でネットワークを変革する

グローバル ネットワークが進化し、分散化が進み、高速で低遅延のネットワーク サービスに対する顧客の需...

シャオ・ナンがSEOについて語る - SEOの経験と実践

私はいつも、ウェブサイトとその訪問者の関係は 1-1=0 ではなく、1-1=2 であると考えています...

ブランドプロモーションとマーケティング丨ユーザーにブランドを覚えてもらうにはどうすればよいでしょうか?

次の 2 つのことを覚えておいてください。ファン・シャオチンはジャック・マーに似ているため、辺鄙な地...

Kuaiboの王欣とMomoが地図ソーシャルネットワーキング市場に参入、新たなトレンドか?

MaToilet MTの失敗後も、王欣はソーシャルネットワーキングの探求をやめなかった。 Tech ...

launchvps: 米国東海岸の高性能 VPS プロモーション、年間 24 ドルから

launchvps はペンシルバニア州のデータセンターで VPS を宣伝しています。この VPS は...