マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

この疫病は人々の生産や生活の仕方を変えました。共同作業、リモートワーク、オンライン教育などのシナリオが標準となり、これらのシナリオでもインフラストラクチャに対する要求が高まっています。

ガートナー リサーチの副社長であるシド・ナグ氏は、クラウド コンピューティングが主流の戦略になったと考えています。「次世代の製品ソリューションのほぼすべてがクラウド プラットフォーム上に構築されています。」しかし、クラウドに移行するユーザーが増えるにつれて、システム管理はかつてない課題に直面しています。膨大なユーザー、大規模なクラスター、複雑なシステム アーキテクチャにより、従来の運用および保守方法では状況に対応できなくなります。いかにリアルタイムに異常を検知し、障害に迅速に対応し、障害を予測し、容量を合理的に計画するかが重要な課題となっています。このとき、インテリジェントな運用と保守を実現する AIOps がデビューします。

AIOps は、多くの面で従来の運用と保守の問題点に直接的に影響します。 AI アルゴリズムは、膨大な量の運用および保守データを分析するという重要なタスクを担います。問題を自動的かつ正確に検出して特定し、意思決定レベルで運用効率を向上させ、コスト、品質、効率の観点から企業の運用と保守作業を最適化するための重要なサポートを提供します。ガートナーの戦略計画の想定によると、2023 年までに DevOps チームの 40% が IT 運用向け AI (AIOps) プラットフォームを使用してアプリケーションおよびインフラストラクチャ監視ツールを強化することになります。

注目の人工知能分野において、データ駆動型で AI 対応の Microsoft Cloud は、世界のクラウド サービス市場において常に合理的かつ楽観的な姿勢を維持してきました。データは、Microsoft クラウド管理に新しい次元、つまりデータ インテリジェンスを提供します。 Microsoft Research Asia のエグゼクティブ バイスプレジデントであり、Microsoft の著名な主任科学者でもある Dongmei Zhang 氏は、Microsoft は AIOps を主に「システム向け AI」、「顧客向け AI」、「DevOps 向け AI」という 3 つの側面から定義していると述べました。 AIOps は、これらのアプリケーション シナリオで多くの課題に直面します。

AIOps の応用: 正確な予測、効率的なソリューション、より良いサービス

システム向け AIでは、開発者は実行中のシステムの観点から問題を検討する必要があります。たとえば、システムの異常検出は、問題を見つけることだけではなく、早期に警告を提供することも重要です。ハードディスクの障害予測を例にとると、開発者は変化したデータやステータスを分析することで、ディスクに障害があるかどうかを予測できます。システムはハードディスクの大量の履歴データを学習した後、ディスクの現在の状態を比較して、将来的にタイムリーな対策を講じることができるかどうかを予測します。さらに、故障したハードドライブに加えて、隣接するディスクの状態も考慮する必要があります。

Microsoft Research Asia の主任研究員である Lin Qingwei 氏は、Microsoft Research Asia が Neighborhood-Temporal Attention Model (NTAM) を開発したと紹介しました。このモデルには、近隣認識コンポーネント、時間コンポーネント、意思決定コンポーネントが含まれており、時間と空間の両方でより多くの情報を取得できます。林青偉氏は、過去10年から20年の間に最先端の学術誌や会議で発表された論文の方法と比較したところ、このモデルは精度と再現率の点で良好な結果を示し、強力な予測能力を備えていると述べた。

DevOps 向け AI は、主に開発および運用担当者の生産性向上をターゲットにしています。問題が発生した場合、その解決はただ早く正常に戻すことではなく、大量のテストと診断を通じて問題自体をより迅速かつ効率的に解決することです。関連する展開は通常、非常に小規模から始まり、徐々に規模を拡大し、各ステップが安全であることが確認された後にのみクラウド プラットフォームに展開されます。資格、センサー信号、ステータスなど、展開プロセス全体を通じてすべてのヘルス信号を検出する必要があります。いずれかの側面で問題が発生した場合、開発者はまずそれが展開の問題によって発生したかどうかを確認し、次に展開に基づいて相関トラブルシューティングを実行します。

DevOps 向け AI におけるセキュリティ展開診断の問題に対処するために、Microsoft Research Asia は Active Transfer Learning Anomaly Detection (ATAD) ソリューションを提案しました。このソリューションは、転移学習を使用して他のデータから学習した知識を対象分野に変換すると同時に、エンジニアが能動学習を通じて優先順位を付け、より良い学習結果を達成できるようにします。このソリューションは、Microsoft クラウド プラットフォームで使用されています。 「このソリューションでは、通常、高品質のラベル付きデータを入手するのは難しいため、エンジニアは判断を下すために非常に強い洞察力を持っている必要があります」とリン・チンウェイ氏は語った。

AI for Customer は、より優れたユーザー エクスペリエンスを生み出し、顧客に優れたサービスを提供することを目的としています。

Lin Qingwei 氏は、インテリジェントな仮想マシンの事前構成を例に挙げ、Microsoft Research Asia が AI for Customer 分野で行った研究成果の一部を紹介しました。クラウドプラットフォーム上の仮想マシンを申請するには時間がかかります。この問題の解決策の 1 つは、ソフトウェアとシステム構成を事前にインストールして、ユーザーが必要なときに直接使用できるようにすることです。しかし、仮想マシンプールの容量には限りがあり、同様の機種を大量に構成することは不可能であるため、最適な構成を実現するためには、ユーザーがどのようなタイプの仮想マシンを構成するかを予測する必要があります。 Microsoft Research Asia は、予測と最適化に不確実性認識フレームワークを使用する新しい方法論フレームワークを提案しました。結果は、この方法が他のアルゴリズムよりも優れたパフォーマンスを達成することを示しています。

Microsoft Research Asia のデータ、ナレッジ、インテリジェンス グループと Microsoft Cloud 製品チームの緊密な協力により、クラウド システムの障害予測、異常検出、インテリジェント診断、容量計画、インシデント管理など、多くの実用的なアプリケーション シナリオに一連の革新的なテクノロジが実装されました。関連する研究成果は、ICSE、OSDI、USENIX ATC、WWW、AAAI、KDD などの影響力の大きい会議でも発表されており、サービス品質、ユーザー エクスペリエンス、産業生産性が大幅に向上しています。

AIOps の未来: 自律性、活性化、普遍性

AIOps の将来の研究方向について語る際、Lin Qingwei 氏は、第一に自動化と自律性の向上だと述べました。現在、AIOps の方向性は、ユーザーに特定の提案や推奨事項を提供することですが、Microsoft Research Asia は、将来、AIOps がより自律的になり、自動的に決定を下せるようになり、ユーザーが人間の介入なしに最善の決定を下せるようになることを期待しています。第二に、より積極的に行動し、問題が発生するまで解決を待つのではなく、問題の芽を摘み取るようにします。 3 つ目は、より汎用的になり、クロスプラットフォームの AIOps アプリケーションがクラウド プラットフォームだけでなくすべてのプラットフォームで利用できるようになることです。



<<:  SaaS データ保護の責任をどのように確立するのでしょうか?

>>:  クラウドコンピューティング環境における主要なセキュリティ技術の研究

推薦する

ゲームの仕組みを通じてユーザー維持率を向上させるにはどうすればよいでしょうか?

2017年中国ゲーム産業レポートによると、中国ゲーム市場の実際の売上高は2,786億8,700万元に...

ガートナーは、世界のパブリッククラウドのエンドユーザーの支出が2021年に18%増加すると予測している。

[[352897]]ガートナーは、パブリッククラウドサービスに対する世界のエンドユーザーの支出が、2...

Google Baiduにできるだけ早くあなたのウェブサイトを掲載しましょう

12月1日にウェブサイトが開設され、Baiduでは早くても12月3日に登録されました。Googleは...

ウェブマスターはどのようにして究極のサイト最適化を実現できるのでしょうか?

最近、ブログサイトにいくつかの最適化と調整が行われました。 Haoxin はサイト外のアンカーテキス...

ウェブマスターネットワークレポート:タオバオの偽造注文は空中楼閣に過ぎず、迅雷クラウドブロードキャストも崩壊

1. SNS軍の地下産業チェーンが、タオバオの偽注文は単なる空想であることを暴露最近、SNS軍はさま...

マルチクラウド ストレージ管理で避けるべき 5 つの間違い

不十分なセキュリティやベンダー ロックインなどの一般的な問題によって、組織がストレージに複数のクラウ...

電子商取引ウェブサイトの外部リンク構築戦略とテクニック

電子商取引サイトの本質はオンラインで商品を販売することであるため、電子商取引サイトの外部リンクは一般...

商務省:電子決済をめぐるWTO紛争の部分的判決を歓迎

中国新聞社、北京、7月16日(記者:石燕)世界貿易機関が16日夜発表した、電子決済をめぐる米国と中国...

コロクロッシング: バレンタインデー、年間 12 ドルから利用できる無制限のトラフィック VPS、1G メモリ/1 コア/20g SSD/1Gbps 帯域幅

colocrossing はバレンタインデー特別プロモーション VPS をリリースしました。帯域幅は...

タオバオモールからTmallへの変更によるタオバオアフィリエイトマーケティング戦略

最近、Taobao Mallが正式にTmallに改名され、ネット上で大きな騒動を巻き起こした。 Tm...

推奨: securespeed-$2/512m メモリ/25g SSD/750g トラフィック/QN データセンター/ロサンゼルス

securespeed は優れた個人商人です。2009 年から VPS とサーバーを運営しています。...

「Trusted Certified」のウェブサイトは本当に信頼できるのでしょうか?

「インターネット信用認証」、「信用組合」、「電子商取引信用認証」…2010年以来、国内の何十万ものウ...

競合他社の5つの運用方法を分析する

自分自身と敵を知ることによってのみ、あらゆる戦いに勝つことができます。後ろの波が前の波を押し進めるよ...

忘れられがちな効果的な外部リンク方法を統合する

ウェブマスターのウェブサイトによく出入りする草の根の人間として、私はウェブマスターの中には外部リンク...