[51CTO.comよりオリジナル記事] 9月25日、DAMOアカデミーの張建鋒学長は杭州雲奇カンファレンスでHanguang 800 AI推論チップのテープアウトを実演しました。業界標準のResNet-50テストでは、Hanguang 800は78,563 IPSの推論性能を達成しました。これは、現在の業界最高のAIチップの4倍に相当します。エネルギー効率比は500 IPS/Wで、2位のチップの3.3倍です。 「Hanguang 800は、アリババのチップ分野における長い行進の第一歩です。」
Hanguang 800とは何ですか? Hanguang 800は推論に重点を置いたAIチップです。人工知能チップの差別化された設計は主にハードウェアアーキテクチャとソフトウェアアルゴリズムに反映されるため、チップの価値を最大化するには、この2つを高度に適応させる必要があります。現時点では、従来の CPU と GPU は、ディープラーニングの推論タスクにおいてハードウェア機能を十分に活用できていません。たとえば、GPU アーキテクチャは主に画像処理用に設計されており、ハードウェア構造とソフトウェア エコシステムがほぼ固定化されているため、AI タスクを深く最適化することは困難です。 パフォーマンスはどうですか? Hanguang 800 のチップ アーキテクチャに関しては、革新的なアーキテクチャを採用しています。ディープラーニングで使用される大量の重みパラメータやテンソルデータに対して、スパース圧縮や量子化処理をサポートし、独自に設計されたデータアクセスとパイプライン処理技術を使用することで、I/O要件とデータ移動を大幅に削減します。 NPU は、畳み込み、行列乗算、ベクトル計算、およびさまざまな活性化関数も徹底的に最適化します。非常に効率的なハードウェア リソース スケジューリングと完全に並列化されたデータ ストリーム処理により、AI コンピューティングのパフォーマンスとエネルギー効率が最高レベルに引き上げられます。 Hanguang 800 のパフォーマンスの飛躍的向上は、ソフトウェアとハードウェアの共同イノベーションによるものです。 アルゴリズムの面では、アリババDAMOアカデミーの機械知能研究所は過去2年間で音声知能、言語技術、機械視覚、意思決定知能などの分野を網羅した完全なアルゴリズムシステムを構築し、多くの高レベルの成果を達成しました。ハードウェアに関しては、アリババはサーバー、FPGA、ストレージの分野で長年の研究開発経験を持っています。さらに、Pingtou Ge の技術チームは、アーキテクチャ、コンパイル技術などの分野で深い技術的蓄積を持っています。 1 つの Hanguang 800 チップ = 10 個の GPU
実際のパフォーマンス Hanguang 800は現在、アリババのコアビジネスで使用されています。雲斉会議での現地デモンストレーションによると、杭州市主要都市の都市脳における交通ビデオのリアルタイム処理には、従来は300msのレイテンシを持つGPUが40個必要だったが、Hanguang 800を使用するとGPUが4個しか必要なくなり、レイテンシは150msに短縮された。また、皆さんがよく使っている Pailitao 製品が高速なのも Hanguang 800 の性能によるものです。 Pailitao 製品ライブラリには毎日 10 億枚の製品画像が追加されており、従来の GPU コンピューティング能力では認識に 1 時間かかりますが、Hanguang 800 を使用すると 5 分に短縮できます。 まとめ: [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] [編集者:張斌 TEL:(010)68476606] |
<<: Huawei Cloud、クラウドネイティブ技術の商用化を加速する新しいコンテナソリューションをリリース
>>: 天一クラウドの5G時代の中核競争力は10年間の努力を経て際立っている
約 3 ~ 4 日前、pzea.com (別名 kvmla.pro) からシンガポール データ セン...
SEO は非常に簡単なことだと考えているウェブマスターの友人はたくさんいます。実際、Lian Xin...
オンラインマーケティングに携わる友人は、垂直フォーラムに多数の正確な顧客が集中することを知っており、...
外部リンクと内部リンクは、ウェブサイトのランキングの 8 割を占めています。外部リンクとコンテンツの...
多くの学生は、ウェブサイト最適化の専門家は非常に神秘的だと考えています。私も最適化の知識を学び始めた...
[[322641]] Apache Kafka を使用してメッセージを生成および消費する場合、データ...
Cloudcone は大晦日の正午から、中国の顧客向けに、年間料金がわずか 7.5 米ドルで毎月 5...
新セレブ経済の商業収益化モデルは、主にセレブトラフィック、セレブコンテンツ、周辺サービスの収益化を含...
検索エンジンによってウェブページのサポートが異なるため、ウェブページをデザインする際には見た目の美し...
かつて、水と電気は人類史上2つの産業革命を推進し、すべての人々の生活の基本的なインフラとなりました。...
多くの人は、ファーストレベルドメイン名とセカンドレベルドメイン名が何であるかを理解していません。実際...
12月3日午前のニュース、LeTV Holdingsが投資したワインB2CプラットフォームWangj...
この記事では、市場における主流のマーケティングおよびプロモーション チャネルと、それぞれの特徴につい...
数日前、私はアリババが発売しようとしているボックスが市場に大きな影響を与えるかどうかに注目していまし...
ブランドが、高品質で魅力的かつ関連性の高いコンテンツの作成に多くの時間と労力を費やすという考え方には...