UCloud AIオンラインサービスが低遅延シナリオに重点を置くGPUバージョンをリリース

序文

UCloud AIオンラインサービス「UAI-Inference」は、昨年5月の無料公開ベータ版と正式リリース以来、多くのスタートアップ企業や大手伝統企業がAI技術やコスト投資の敷居を下げ、人工知能のトレンドを掴む手助けをしてきました。 UAI-Inference は導入が簡単で、操作と保守も容易であり、複数の主流の AI フレームワークをサポートし、安全で信頼性があります。機械学習、ビデオ画像認識、自然言語処理など、さまざまな AI アプリケーションシナリオに適用できます。

人工知能技術が進化し、AI サブセクターが成熟するにつれて、クラウドサービスプロバイダーの AI 製品機能に対する要件が高まります。最近、UCloud AIオンラインサービスプラットフォームは、高性能AIオンライン推論サービスを提供するために専用のGPU推論ノードを立ち上げました。 GPU オンラインサービスノードは、主に、ディープラーニング AI オンライン推論サービスに対する低レイテンシ要件を持つアプリケーションシナリオを対象としています。

P40高性能GPUアクセラレータカードはコンピューティングパワーの保証を提供します

人工知能の爆発的な成長の第 3 波はコンピューティング能力の向上と切り離せないものであり、コンピューティング能力の向上は GPU の普及と切り離せないものです。 UAI-Inference の GPU ノードは、NVIDIA P40 高性能 GPU アクセラレータカードを使用して、安定した効率的なコンピューティング能力を提供します。

UAI-Inference GPU オンラインサービスプラットフォームは、UAI-Inference CPU プラットフォームと同様に、大規模なコンピューティングノード、自動負荷分散、ノードの災害復旧、サービス監視、サービスバージョンのグレースケール管理などの機能を提供できます。同時に、UAI-Inference GPU オンラインサービスは、ユーザーがオンラインサービス GPU ノードの規模をいつでも調整し、オンラインビジネス負荷の変化にリアルタイムで対応することをサポートします。

UAI-Inference GPU オンラインサービスプラットフォームは、Docker コンテナテクノロジーに基づいて実装されています。ユーザーは、オンライン推論用のコンテナ実装を提供するだけで済みます。オンラインサービスプラットフォームの GPU ノードには、NVIDIA GPU と Docker 実行環境が事前に装備されており、サービスクラスターの迅速な拡張を実現できます。さらに、UAI チームは、TensorFlow/Caffe/MXNet/Keras などの主流の AI フレームワーク用の基本的なコンテナイメージを提供しています。

3つの主要シーンの遅延削減効果は顕著

UAI-Inference GPU オンラインサービスは、P40 GPU の強力なパフォーマンスを活用して、オンライン推論の効率を 10 倍以上向上させます。

たとえば、画像分類のシナリオでは、UAI-Inference 専用の GPU オンラインサービスが使用されます。次の図に示すように、batchsize=1 の場合の 2 つのアルゴリズムモデル Inception-V3 と ResNet101 の推論遅延は、8C8G CPU クラウドホストのパフォーマンスと比較して大幅に改善され、リクエスト遅延は 50 ミリ秒未満に短縮されます。

テキスト検出シナリオでは、UAI-Inference の専用 GPU オンラインサービスを使用することで、batchsize=1 の場合の CTPN および EAST アルゴリズムモデルの推論遅延が 8C8G CPU クラウドホストのパフォーマンスと比較して大幅に改善され、次の図に示すように、要求遅延を数秒から 100 ミリ秒に最適化できます。

ターゲット検出シナリオでは、UAI-Inference 専用 GPU オンラインサービスを使用すると、batchsize=1 の場合の Fast RCNN アルゴリズムモデルの推論レイテンシが 8C8G CPU クラウドホストのパフォーマンスと比較して大幅に改善され、次の図に示すように、リクエストレイテンシを約 5 倍短縮できます。

柔軟な支払いコストが低い

現在、人工知能の応用シナリオを実装する主な方法の 1 つはクラウド AI に基づいています。つまり、ユーザーはネットワークを介して処理するデータをクラウドプラットフォームにアップロードし、クラウドプラットフォームは大規模な計算とモデリング、認識などの処理を実行し、計算結果をローカルに送信します。この方法の主な利点は、柔軟性が高く、迅速に導入でき、ユーザーの実際のビジネスニーズに応じてコンピューティングノードをいつでも調整できることです。

UAI-Inference GPU オンラインサービスプラットフォームは、ユーザーがいつでも GPU クラスター内のノード数を調整し、ビジネスのピークやオフピークのさまざまな段階に応じて GPU クラスターを水平に拡張および縮小することをサポートします。したがって、ユーザーはアイドル状態や無駄なリソースを心配することなく、実際のニーズに応じてリソースを調整できます。さらに、分単位の正確な課金ディメンションも提供しており、専用サービス P40 GPU ノードの料金は 0.085 元/ノード*分のみです。

人工知能の発展の見通しはますます有望になってきています。企業の AI 変革のためのインフラストラクチャサポートプラットフォームとして、クラウドサービスプロバイダーはさらに多くの課題に直面することになります。しかし、ユーザーのニーズをさらに満たすために、UCloud は AI 製品の探求において革新を続けます。

<<: Oracle、Oracle Autonomous Transaction Processingを発表

>>: TSMCの「ウイルスゲート」から次世代クラウドデスクトップセキュリティ保護の新しいアイデアについて語る

UCloud AIオンラインサービスが低遅延シナリオに重点を置くGPUバージョンをリリース

Xiaomi、AppleのiOSをコピーしたことに反応

pzea - 20% 割引コード + 1G メモリ、ダイレクトライン VPS: シンガポール/香港/日本

SEOルール1: 正しいURL構造を設定する

中規模企業はパブリッククラウドへの大きな賭けを真剣に検討すべき

アンダーレイにおけるUlti-Network Nsの応用について - このハンドブック

本環長老が七色の遺物に生まれ変わったことをきっかけに、ウェブサイトの核心競争力について考える

ハイパースケールからハイブリッドクラウドへ: クラウドコンピューティングの可能性を解き放つ

簡単な議論: SEO は「役に立たない」テクノロジーですか?

SEOをする際に広く転載されるソフトな記事の書き方

分散ストレージ Ceph の進化 · SOSP 2019

推薦する

今日の話題: 生ぬるい短編ビデオはモバイルインターネットの次の爆発点となり得るか?

Kubernetesは問題を解決するため複雑である

ガートナー: 2018 ビッグデータ分析プラットフォームのマジッククアドラント

Baidu 8.25 アップデートへの対処方法: 外部リンク

SEO におけるコピーコンテンツと重複コンテンツ

Yunbase: 独立サーバー 10% オフ、香港 cn2 高防御\米国 3 ネットワーク cn2gia (500G 高防御)\本土 (100G 高防御/CC 無視)

BAT31 PR: さまざまな特徴と強みが国内のインターネットを非常に活発にしている

事例分析：ブラックリストに登録されたウェブサイトの分析プロセス

tripodcloud: 信頼性の高い米国の cn2 gia vps、12% 割引、3 つのネットワークへの直接接続 (China Telecom CN2 GIA\China Unicom AS4837\China Mobile CMI)

Amazon Web Services Serverlessは、企業が不確実性に対処するのを支援するために進化し続けています

インターネット運用：データを冗談として扱うのはおろか、トーテムとして扱うのはやめましょう

desivps: 新年のプロモーション、VPS は年間 20 ドルから、専用サーバーは月額 55 ドルから、ロサンゼルス/オランダのデータセンター

SEOコミュニケーションの聖地を回復するためにフォーラムセクションから始めましょう

主要変電所の類似性を減らす方法

#BlackFriday# vsys: オフショアの苦情防止専用サーバー、50% 割引、月額 49 ドルから、GPU シリーズ、大容量ハードディスクストレージシリーズ、10Gbps 帯域幅、無制限のトラフィック