ファーウェイクラウド人工知能のチーフサイエンティスト、ティエン・チーフサイエンティスト:ModelArts+3.0は産業界におけるAIの実装に貢献

ファーウェイクラウド人工知能のチーフサイエンティスト、ティエン・チーフサイエンティスト:ModelArts+3.0は産業界におけるAIの実装に貢献

[中国、上海、2020年9月25日] HUAWEI CONNECT 2020において、HUAWEI Cloudは、バックボーンモデル、フェデレーテッドラーニング、インテリジェント評価、インテリジェント診断、効率的なコンピューティングパワーを統合したModelArts 3.0を発表しました。

ファーウェイクラウドAIのチーフサイエンティストであるティエン・チーフサイエンティストは、ファーウェイクラウドは長年にわたり基礎AI技術研究に根ざしており、コンピュータービジョン、音声セマンティクス、意思決定最適化という3つの主要なAI分野をカバーし、6つの基礎研究計画を提案してきたと紹介しました。これらのプログラムによって生成された多くの研究成果は、プラグアンドプレイ方式で徐々にHuawei Cloud ModelArtsに展開され、業界におけるAIの実装に貢献しています。

[[343878]]

以下は、田奇氏のスピーチの全文です。

皆さん、こんにちは。ModelArts は複数の業界やプロジェクトで成功裏に導入されており、これは Huawei Cloud EI の人工知能分野への長期投資と切り離せないものです。

Huawei Cloud は長年にわたり基礎 AI 研究に根ざしており、コンピューター ビジョン、音声セマンティクス、意思決定の最適化という 3 つの主要領域をカバーしています。私たちは、モデル効率、データ効率、コンピューティング効率、知識効率という4つの主要な方向性に焦点を当て、大規模モデル向けのモデル高さ計画、小規模モデル向けのモデルスリム化計画、マルチモーダル学習向けのデータルービックキューブ計画、小サンプル学習向けのデータアイスバーグ計画、一般知識抽出向けのエブリシングプレビュー計画、新しい学習パラダイム向けの仮想-現実統合計画など、6つの基本研究計画を提案しました。

自動機械学習、小サンプル学習、フェデレーテッドラーニング、事前トレーニング済みモデルなど、当社の研究成果の多くは、プラグアンドプレイ方式で ModelArts 有効化プラットフォームに展開でき、AI が何千もの業界に力を与えるのに役立ちます。

多くの業界の公開コンテストや評価において、Huawei Cloud EI の継続的な革新的研究は優れた成果を達成しています。これらはModelArtsプラットフォームに適用され、世界中の開発者に提供されます。

Ø 認識の面では、ImageNet 大規模画像分類、WebVision 大規模ネットワーク画像分類、MS-COCO 2 次元オブジェクト検出、nuScenes 3 次元オブジェクト検出、および視覚事前トレーニング済みモデルのダウンストリーム分類/検出/セグメンテーションにおいて業界リーダーシップを維持しています。現在、ModelArts によって駆動される知覚モデルは、医療画像分析、石油・ガス探査、産業障害検出などの分野で広く使用されています。

Ø 認知面では、音声セマンティクスとナレッジグラフの蓄積を活用して、業界のデータを統合し、多様で複雑かつ孤立したデータを管理し、知覚インテリジェンスから認知インテリジェンスへの飛躍を実現します。現在、ModelArts 駆動型認知モデルは、医薬品ターゲット予測、金融詐欺分析、インテリジェントなアフターセールス顧客サービスなど、多くのタスクに適用されています。

Ø 意思決定の面では、運用最適化、強化学習、インテリジェント制御などのアルゴリズムを活用して完全な意思決定基盤を構築し、AI が知覚-認知-意思決定のインテリジェントなクローズドループを真に実現できるようにしました。現在、ModelArts が駆動する意思決定エンジンは、航空機のスロット割り当て、工業製造、インテリジェント輸送、ゲームおよびエンターテイメントなどの分野に適用されています。

当社がリリースしたModelArts 3.0は、産業界におけるAIの実装に向けたAI開発プラットフォームです。ここで、私と私のチームは主に技術分野から、AI テクノロジーを使用して業界の課題を効率的に解決する方法、たとえば、非常に少ないデータで高精度のモデルをトレーニングする方法などを探求し、研究しています。企業が AI を導入するためのハードルを下げるにはどうすればよいでしょうか?データの安全な利用などに関する企業の懸念にどう対処するか。最終的には、バックボーンモデル、フェデレーテッドラーニング、インテリジェント診断と評価の最適化、効率的なコンピューティングパワーをModelArts3.0に統合しました。これについては、以下で詳しく説明します。

Huawei Cloud のバックボーン ツール チェーン EI-Backbone は、効率的なモデル、データ、コンピューティング能力、知識を統合し、業界の AI 実装機能を総合的に向上させます。 EI-Backbone の機能は 10 を超える業界で検証されており、10 を超える業界チャレンジ チャンピオンシップで優勝し、100 を超えるトップ論文を発表しています。 EI-Backbone は、肺の医療画像のセグメンテーションを例に、AI 開発の新しいパラダイムを提供します。

Ø 以前は、トレーニングには数百または数千のラベル付きデータが必要でした。現在、EI-Backbone を使用すると、数十または数十個のラベル付きデータのみが必要になるため、ラベル付けコストが 90% 以上削減されます。

Ø 従来は専門家の経験と試行錯誤のコストを多く必要としていたモデル選択とハイパーパラメータ調整が、EI-Backboneが提供するフルスペースネットワークアーキテクチャ検索と自動ハイパーパラメータ最適化技術により、人間の介入なしに迅速に完了できるようになり、精度が大幅に向上しました。

Ø 以前は数週間、あるいはそれ以上かかっていたモデルのトレーニング、テスト、承認、展開のプロセスを、EI-Backbone に統合された事前トレーニング済みモデルをロードした後、数時間、あるいは数分で完了できるようになり、トレーニング コストが 90% 以上削減されました。

Huawei Cloud ModelArtsは、EIバックボーン技術をベースに、杭州雲神初科技有限公司と提携し、四足歩行ロボット犬を使った産業現場検査を実現しました。

Huawei Cloud ModelArts 3.0 の次の機能は、フェデレーテッド ラーニングです。

ご存知のとおり、データは AI アプリケーションの基礎です。多様化されたデータに基づいてのみ、AI によるインテリジェントな認識を実現できます。しかし、AI 業界の実際の実装では、データが異なるデータ コントローラー間で分散しているため、業界のアプリケーションでデータ サイロの問題が発生し、AI アルゴリズムのトレーニング効果が制限されます。

この問題に対処するために、Huawei Cloud Modelarts は、データを残さずに共同モデリングを可能にするフェデレーテッド ラーニング機能を提供します。ユーザーはそれぞれトレーニングにローカルデータを使用し、データ自体を交換することはありません。共同トレーニングを実現するために、更新されたモデル パラメータのみを暗号化された方法で交換します。

Huawei Cloud EIは、中国科学院上海薬物研究所の蒋華良院士と協力し、Huaweiが独自に開発したFedAMPアルゴリズムとAutoGenomeアルゴリズムを医薬品開発のAIタスクに適用し、医薬品の水溶性、心毒性、キナーゼ活性を正確に予測しました。その精度は、従来の連合学習やディープラーニングアルゴリズムをはるかに上回ります。

さらに、Huawei Cloud は、さまざまな場所や顧客からのデータのフェデレーショントレーニングをサポートするクラウドエッジコラボレーションサービスも提供します。データは暗号化された状態でサーバーにアップロードされ、グローバル モデルが更新されてからエッジ デバイスに送信されるため、同じ業界内での水平フェデレーションと業界間の垂直フェデレーション ラーニングが便利にサポートされます。フェデレーテッド トレーニングの参加者は、クラウドまたは Huawei Cloud エッジ デバイス (スマート ステーションなど) のコンピューティング能力を通じてフェデレーテッド トレーニングに参加し、業界内での共同モデリングを実現できます。

モデルをオンラインで展開する前に、完全に評価する必要があります。優れた結果が得られたモデルは直接本番環境に導入できますが、不十分な結果が得られたモデルは、さらに最適化と反復が必要になります。 ModelArts は包括的な視覚的評価とインテリジェントな診断機能を提供し、開発者がモデルのさまざまな側面のパフォーマンスを直感的に理解し、ターゲットを絞ったチューニングや本番環境への展開を実行できるようにします。

上皮性病変細胞分類のモデル評価を用いた詳細な説明は以下のとおりです。

Ø 精度の面では、Huawei Cloud ModelArts は、精度、適合率、再現率、F1 値、混同行列、ROC 曲線などの従来の指標を提供します。また、さまざまなデータ機能サブ間隔でモデルのパフォーマンスを評価するためのデータ感度分析モジュールも含まれています。

Ø パフォーマンスの面では、ModelArts は、時間とスペースの消費量、およびさまざまな全体的なパフォーマンス指標に関するオペレーターレベルの統計分析を提供し、モデルの量子化や蒸留など、モデルのパフォーマンスに基づいて対応する提案を提供します。

Ø 説明可能性の点では、ModelArts はモデルが推論を行う領域を示すヒートマップを提供します。

Ø 信頼性の面では、ModelArts には複数のモデルの信頼性に関する評価方法が組み込まれており、多角的なモデルのセキュリティ機能評価指標を提供し、現在のモデルのパフォーマンスに基づいて対応する防御提案を行います。

ディープラーニング分散トレーニングの継続的な発展に伴い、さまざまなモデルをトレーニングするためのコンピューティング デバイスの需要が高まっています。しかし、さまざまな理由により、研修職のリソースは十分に活用されていません。リソースの浪費には多くの理由がありますが、主に次のようなものがあります。

Ø トレーニングアルゴリズムコード自体の品質は高くなく、リソース利用率が低い。

Ø モデルのサイズとハイパーパラメータの設定によっても、コンピューティング リソースの使用率が大幅に変化する可能性があります。

Ø リソース プールの全体的な使用率は変動します。 「電力のピークと谷」と同様に、トレーニング ジョブの送信にもピーク期間と谷期間があり、その結果、リソースが大量に浪費されます。

弾性トレーニングは ModelArts のコア機能の 1 つであり、モデルのトレーニング速度の要件に基づいて最適なリソース割り当てを適応的に実現できます。

ModelArts には 2 つのモードがあります。 1 つ目はターボ モードで、アイドル リソースを最大限に活用して既存のトレーニング ジョブを高速化できます。モデルの収束精度に影響を与えることなく、トレーニング速度を 10 倍以上に上げることができます。 2 つ目はエコノミー モードです。このモードでは、リソースの使用率を最大化することで、開発者に究極のコスト効率を提供できます。最も典型的なシナリオでは、コスト効率は 30% 以上向上します。

超大規模なコンピューティング能力を必要とする AI の研究開発をより適切にサポートするために、Huawei の ModelArts プラットフォームは、クラスターのサイズ、タスクの数、分散トレーニングをターゲットに最適化しました。

ModelArts R&D プラットフォームは、数万のノードを管理し、大規模なトレーニング タスクのニーズをより適切にサポートできます。 ModelArts プラットフォームは、サービス フレームワークを最適化することで、10,000 個のチップ上で 100,000 個のジョブと大規模な分散タスクの同時実行をサポートします。

優れた分散加速比は、大規模クラスター分散トレーニングの重要な機能であり、ユーザーが AI サービスを加速するために大規模クラスターの使用を選択する重要な要素でもあります。

Huawei Cloud ModelArts は、最先端の分散アクセラレーション機能を備えています。 MLPerf ベンチマーク Imagenet-1K 分類タスクでは、512 チップ クラスターを使用して 93.6 秒で実行され、NVIDIA V100 の 120 秒よりも高速でした。

バックボーンネットワーク、フェデレーテッドラーニング、モデル診断と最適化、効率的なコンピューティングパワーのサポートにより、Huawei Cloud ModelArtsは業界におけるAIの実装を加速します。今後もファーウェイクラウドは、モデル効率、データ効率、コンピューティング効率、知識効率という4つの重点分野に注力し、基礎AI研究に根ざしていきます。当社は、コンピュータービジョン、音声セマンティクス、意思決定最適化という3つの主要なAI分野における基礎研究計画に引き続き投資し、強力なAI技術を提供することで、すべての開発者が強みを最大限に発揮し、独自の価値を創造できるようサポートします。 Huawei Cloudは今後もインクルーシブAIを実践し、世界中の開発者とともに成長していきます。

皆様ありがとうございました!

<<:  ファーウェイクラウド、業界のコアビジネスシステムにAIを導入するナレッジコンピューティングソリューションをリリース

>>:  オラクルはTikTokを活用してクラウドインフラ事業の拡大を目指す

推薦する

企業マイクロブログの運用方法:擬人化運用は実在の人間ほど良くない

企業はWeiboの公式アカウントを運営する際に、それを単なるオンライン顧客サービスホットラインとして...

stablehost-年間15ドル/無制限のcpanel仮想ホスト/シンガポールの4つのコンピュータルーム

stablehost は 2009 年から、仮想ホスティング、リセラー、VPS、独立サーバーなどのホ...

フォーラムは消滅しつつある?結論を出す前に、いくつかの事実を見てみましょう。

BBS が急速に発展していた 2002 年から 2008 年にかけて、BBS の唯一のコミュニティ製...

海外VPSプロモーション概要

今月は一年で最大の祝日であるブラックフライデーと重なり、サイバーマンデーも間近に迫っているため、海外...

/ と /* の違いが思い出せませんか?私の答えはあなたにとって忘れられないものになるでしょう

[[407627]]この記事はWeChatの公開アカウント「BAT's Utopia」から転...

Tencent Cloud の軽量香港 VPS の簡単なレビュー

最近、Tencent Cloud の軽量アプリケーション サーバーである Lighthouse (T...

クラウドコンピューティングとは何ですか?

クラウドは一般的にグローバルなインターネットまたはネットワークを指しますが、コンピューティングはリモ...

理解する必要がある分散システムにおける同様のクラスタ技術と原則

序文今日の情報爆発の時代では、1 台のコンピューターでは、成長するビジネスの発展をサポートできなくな...

CNCF: クラウドネイティブの6つの主要トレンド

Cloud Native Computing Foundation (CNCF) は、2019 年後...

百度の爆発的なインデックス増加の核心スキル

Baidu の包含をいかに迅速に増やすかは、多くのウェブマスターにとって常に頭痛の種でした。ウェブサ...

高級Tシャツのeコマース「ピックウィック&ウェラー」が閉鎖:eコマースは簡単ではない

アシュトン・カッチャーの高級Tシャツ電子商取引店「ピックウィック&ウェラー」が閉鎖され、電子商取引が...

古いウェブサイトのランキング速度の包括的な分析

みなさんこんにちは。私はShi Touです。企業のウェブサイトの SEO を行うと、常にいくつかの厄...

インターネットポート: スウェーデンの VPS、著作権なし、月額 2 ユーロ、512M メモリ/1 コア/10g SSD/5T トラフィック

internetport (2008~) はスウェーデンの会社で、主にスウェーデンで VPS、独立サ...

プライベートクラウドとパブリッククラウド: Kubernetes がバランスをどう変えるか

今日の企業のほとんどはハイブリッド クラウド ユーザーになります。 2021 年に Statista...

空地インターネット産業連盟理事長 王妙:中国の空地インターネット産業の探究と変革

中国電子技術標準化研究所が主催し、51CTOが主催する「第7回中国クラウドコンピューティング標準およ...