マイクロソフト、クラウドサービスの停止に関する予備分析を発表

マイクロソフト、クラウドサービスの停止に関する予備分析を発表

Microsoft は、9 月 4 日に世界中の顧客に影響を与えた障害について、予備的な根本原因分析 (RCA) レポートを公開しました。Azure エンジニアリング チームはこのインシデントの調査を継続しており、「今後数週間以内に」より詳細な分析を提供すると述べています。

マイクロソフトの関係者は分析の中で、影響を受けた顧客はマイクロソフト・アジュール・サービス・レベル・アグリーメントに基づき、10月の請求書で払い戻しを受けると述べた。

9月4日、米国中南部のマイクロソフトのデータセンター付近で落雷が発生し、多くのAzureサービスに障害が発生しました。 Azure Active Directory を介した ID 認証を必要とする Office 365 も影響を受けました。この事件の影響は世界中の多くの Microsoft 顧客に影響を及ぼしました。

[[244179]]

マイクロソフトの分析では、嵐により「電力システムの供給に変動が生じ、電圧スパイクが発生した」と結論づけられた。電圧スパイクにより、Azure データセンターは発電機による電力供給に切り替えられ、データセンターの冷却システムが停止しましたが、センターにはサージ サプレッサーが装備されていました。データ センターは、冷却システム内の負荷関連の熱バッファーを通じて必要な動作温度を維持していましたが、バッファーが使い果たされると、温度が上昇し、機器は自動的にシャットダウンしました。

シャットダウン前には、「多数のストレージサーバー」やその他のネットワーク機器、電源装置など、一部のハードウェアが損傷していた。オンサイト チームはインフラストラクチャの復旧を試み始めました。これは、故障したハードウェアの交換、正常なサーバーへの移行、データの破損の有無の確認を意味しました。

障害発生時に Microsoft のデータセンターがバックアップ サイトにフェールオーバーしない理由を疑問に思う方のために説明します。「フェールオーバーを行うと、地理的レプリケーションの非同期性により部分的なデータ損失が発生するため、別のデータセンターにフェールオーバーするのではなく、データを回復するという決定が当時下されました。」

データセンターをシャットダウンすると、そのデータセンター内のストレージ サーバーに依存する多くの Azure サービスに影響します。影響を受けるサービスには、ストレージ、Virtual Machines、Application Insights、Cognitive Services と Custom Vision API、バックアップ、App Service (および Linux 用 App Service とコンテナー用 Web アプリ)、Azure Database for MySQL、SQL Database、Azure Automation、Site Recovery、Redis Cache、Cosmos Database、Stream Analytics、Media Services、Azure Resource Manager、Azure VPN Gateway、PostgreSQL、Application Insights、Azure Machine Learning Studio、Azure Search、Data Factory、HDInsight、IoT Hub、Analysis Services、Key Vault、Log Analytics、Azure Monitor、Azure Scheduler、Logic Apps、Databricks、ExpressRoute、Container Registry、Application Gateway、Service Bus、Event Hub、Azure Portal IaaS エクスペリエンス - Bot Service、Azure Batch、Service Fabric、Visual Studio Team Services (VSTS) などがあります。

マイクロソフトは「これらのサービスの大部分は9月5日の11:00 UTCまでに復旧した」と述べたが、問題が完全に解決するまでに9月7日の8:40 UTCまでかかったことを認めた。

なぜ、米国中南部地域以外の顧客もこの一連の出来事の影響を受けたのでしょうか?投稿によると、これは「クラシック」リソース タイプで管理サービスを運用する「Azure Service Manager の回復力が不十分」なことが原因だったという。 Microsoft の幹部は、「ASM はグローバル サービスですが、自動フェイルオーバーはサポートしていません」と述べています。 ASM およびその他の関連サービスへのさまざまな依存関係により、米国中南部リージョン外の Azure Resource Manager サービスも影響を受けました。

<<:  強化された制御、統合、スケーラビリティ、コンテナサポートを備えた Red Hat Ansible Tower 3.3 がリリースされました

>>:  一般的に、クラウド コンピューティングのコストの主なカテゴリは何ですか?

推薦する

中国のバレンタインデーにフィッシングサイトの数が135%増加

フィッシングサイトの活動の特徴は、常に「ニュースを聞いてすぐに行動する」ことです。電子商取引サイトの...

ブランド マーケティング プランニング: 6 つの定番クリエイティブ テンプレート!

広告には 2 つの基本的な属性があります。まず、それは個人の楽しみのためだけではなく、企業のマーケテ...

2012年に流行したインターネットマーケティング研修を冷静に見る

2012年は、インターネットが急速に発展した年でした。国内のあらゆる業種の企業が次々とオンラインマー...

Baidu Live は YY に頼ることができますか?

2008年に立ち上げられ、ゲームポータルとして始まり、YY音声派生ライブ放送事業に依存していました。...

フォーチュン・ビジネス・インサイト:AIとクラウドコンピューティングがIoT市場の成長を後押し

市場調査会社フォーチュン・ビジネス・インサイトが発表したレポートによると、IoT市場規模は2019年...

車のロゴの意味についてどれくらい知っていますか?オンラインテストを受けて、自分だけのロゴを作りましょう

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています車のロゴは...

インターネット企業の急速な興亡の全過程

インターネット企業の急速な興亡の全過程については、「MySpace を盗んだのは誰か: ソーシャル ...

Baiduの新機能について簡単に説明:優れたユーザーエクスペリエンスを提供することは想像するほど難しくない

SEO にとって最終的な目標は優れたユーザー エクスペリエンスを提供することなので、SEO 担当者は...

ハードウェア + ソフトウェア + 質問で SEO 面接で有利になる

SEO業界について語るとき、人々はバーゲン価格や混沌とした競争といった言葉を思い浮かべることが多い。...

adroitssd: $6.47/KVM/1g メモリ/20g SSD/1T トラフィック/Phoenix

adroitssd は、2001 年からホスティング サービスを提供していると主張しています。200...

チップ不足、エッジコンピューティング、IoTが2022年のIT変革を推進する

Forrester Research は調査の中で、多くの IT プロフェッショナルがモノのインター...

fastervm-90元/年/KVM/128Mメモリ/アジア最適化ラインVPS

FasterVM は、アジア、特に国内の通信ユーザー向けに最適化された新しいデータセンター、ロサンゼ...

マーケティングにおける企業雑誌の役割

多くの IT 専門家の目には、紙の資料はすべて光にさらされると破壊されるように見えます。その理由は非...

Godaddyが4月第1週に集めた最初の割引コード

中国人に適した特別な割引コードは見つかりませんでした。com には 1.69 米ドルの登録料がありま...

インターネットマーケティング前の準備

マーケティングを行うということはコミュニケーションを取ることであり、コミュニケーションを取るためには...