Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に

Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に
  • 海外メディアCNBCが入手した内部文書によると、プライムデーのプロモーションが麻痺した主な原因は、アマゾンがオラクルのデータベースからAurora PostgreSQLに移行したことだった。
  • この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題を浮き彫りにしている。
  • アマゾンとオラクルは近年、それぞれ自社のデータベースソフトウェアとクラウドツールの方が優れていると主張し、激しい論争を繰り広げている。

Amazon は現在、Oracle データベース ソフトウェアからの移行がいかに難しいかを知りつつあります。

[[247571]]

CNBCが入手した内部報告によると、プライムデーに、この家電量販店最大手は、売り上げを鈍化させた大規模なウェブサイト障害に対処していたほか、オハイオ州にある最大規模の倉庫の1つで数万個の荷物の出荷を遅らせる技術的問題にも取り組んでいた。

文書によると、この問題は主にアマゾンがOracleデータベースから自社のデータベース技術に移行したことが原因とされている。この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題と、そのレベルの信頼性を取り戻すことがいかに難しいかを浮き彫りにしている。また、これは、オラクルのデータベースがアマゾンの同等のソフトウェアよりもいくつかの点で確かに効率的であることを示唆しており、オラクルは今週サンフランシスコで開催される年次オープンワールドカンファレンスでこの点を強調する可能性が高い。

プライムデーの障害後、アマゾンのエンジニアは25ページのレポートを作成したが、アマゾンはこれはエラーを修正するためのものだと述べた。 Amazon では、この標準プロセスを使用して、重大なインシデントが発生する理由を理解し、将来的に発生しないようにする方法を検討しています。

報道によると、Amazon はプライムデーの問題の根本原因の特定に苦労していたが、これはデータベースの移行後に機能が失われたことが原因だったという。文書によると、アマゾンは、新たにインストールされたAurora PostgreSQLと呼ばれるデータベースでエラーが発生した場合の緊急時対応計画も提供していなかった。

ある質問では、エンジニアはなぜアマゾンの倉庫データベースが「Oracle データベースが使用されていた前回のトラフィック急増時と同じ問題」を経験しなかったのかと尋ねられた。彼らは、「Oracle と Aurora PostgreSQL は 2 つの異なる [データベース] テクノロジーであり、セーブポイントの処理方法が異なります」と答えました。

セーブポイントは、個々のトランザクションを追跡および回復するために使用される重要なデータベース ツールです。報告書によれば、プライムデーには保存ポイントが多すぎるためにAmazonのAuroraソフトウェアが過負荷になり、データベース全体のパフォーマンスが低下したという。

いずれにせよそれは起こり得る

「アマゾンがオラクルを使い続けていたら、この障害はおそらく起きなかっただろう」と、CNBCが文書の詳細を明らかにした後、イリノイ大学アーバナ・シャンペーン校のコンピューターサイエンス教授マット・シーザー氏は語った。 「また、アマゾンがオラクルのデータベースを使用していれば、問題をより早く診断できた可能性があり、停止期間を短縮できたはずだ。」

アマゾンの広報担当者は電子メールでの声明で、データベースの「パフォーマンスの低下が遅延と深刻な停止を引き起こした」と内部文書に記載されているにもかかわらず、停止はなかったと述べ、問題を軽視した。

「倉庫に停電はなく、この問題により荷物の約1%の配送が短時間遅れただけだったことに留意することが重要です。この問題はすぐに特定され、解決されました」と広報担当者は述べた。

オハイオ州の倉庫は、プライムデーを前に Oracle データベースから移行した 13 の倉庫のうち最新のものとなった。文書によると、この倉庫はプライムデーのプロモーション期間中に1日あたり110万個以上の荷物を取り扱った。在庫および出荷データを処理するすべてのサービスとソフトウェアは、これらの倉庫内の Aurora データベースに移行されています。

報道によると、プライムデーには数時間にわたって障害が続き、1万5000個以上の荷物の配送が遅れ、人件費で推定9万ドルの損失が発生したという。この損害には、エンジニアがトラブルシューティングやバグの修正に費やした時間や、失われた可能性のある売上は含まれません。

報告書の「学んだ教訓」というセクションで、Amazon のエンジニアは「セーブポイントの動作は Aurora PostgreSQL では Oracle とは異なる」と記しており、Oracle のソフトウェアの方が問題をより効率的に処理することを示唆している。報告書ではまた、PostgreSQL には分析用の SQL 文データが存在しなかったと述べており、これが問題の根本原因を「特定するのに役立つはずだった」という。

アマゾンがもっと準備を整えていれば、障害はそれほど深刻ではなかったかもしれない。同社は文書のあるセクションで、「基盤となるPostgreSQLデータベースでパフォーマンスの問題が発生したときに回避策がなかった」ため、問題の「解決に長い時間がかかった」と述べている。この文書はまた、「完全な対応計画や運用マニュアル」があれば「より迅速に影響を排除する」ことができたはずだと主張している。

コロンビア大学のコンピューターサイエンス教授ヘニング・シュルツリン氏は、この文書を確認した後、「私の推測では、アマゾンはデータベースを変更しただけで、アマゾンプライムデーで発生した特定の負荷パターンをテストしていなかったため、驚いたのではないか」と述べた。

アマゾンはオラクルとより直接的に競合するためにソフトウェアの提供を拡大しており、近年両社は舌戦を繰り広げている。 CNBCは8月に、アマゾンが2020年初頭までにデータベース全体をOracleから移行する取り組みを進めていると報じた。

「本当に大変です」

オラクルの会長兼共同創業者のラリー・エリソン氏はアマゾンの主張を信じていない。エリソン氏は12月の同社の決算発表で、アマゾンは「オラクルから離れるつもりはない」と述べた。同氏は8月のイベントでも自身の見解を繰り返し、「アマゾンがそんなことをできるとは思わない」と述べた。

「アマゾンにはOracleから移行するための10年の猶予があるが、彼らはまだOracleを使っている」と彼は語った。 「彼らにとって、自社の技術を使うのは簡単なことではありません。コスト効率が悪いのです。本当に難しいのです。」

市場調査会社ムーア・インサイツ・アンド・ストラテジーの上級アナリスト、パトリック・ムーアヘッド氏は、この事件は、アマゾンの倉庫で使用されているような古いアプリケーションを、何十年にもわたって世界最大の企業と取引してきたオラクルから移行することがいかに難しいかを示していると述べた。

「AWS Auroraは将来を見据えたアプリケーション向けに設計されているが、Oracleはより伝統的なアプリケーション向けに設計されている」と同氏は語った。

論文: Amazon Aurora: 高スループットのクラウドネイティブリレーショナルデータベースの設計上の考慮事項

<<:  21Vianet Blue CloudはMicrosoftと提携し、クラウドパートナーを募集し、インテリジェントクラウドのローカルエコシステムを構築します。

>>:  メラノックスは2018年第1四半期から第3四半期にかけて210万枚以上のイーサネットカードを販売した。

推薦する

仮想オペレーターライセンスが間もなく発行されると報じられており、60社以上の民間企業が激しい競争を繰り広げている。

北京ビジネスデイリー(記者:屈中芳) 仮想オペレーターライセンスの第1弾がまもなく発行されるというニ...

Vultr クラウド サーバーはどうですか? Vultr India (ムンバイ) データセンターの簡単な評価

Vultrはどうですか? Vultr クラウド サーバーはどうですか? Vultr India クラ...

パフォーマンスと効率の選択は進化する

コンピュータを組み立てたことがある人なら誰でも、マシンのパフォーマンスを追求する方法を知っています。...

JD.comの子会社MiniTiaoは、同社が賃金を滞納していることを明らかにし、親会社を公に非難した。

上場を控えたJD.comは、Yixunとの統合危機に直面したばかりだ。その後すぐに、主に日本と韓国の...

SEO の最初の 2 年間でウェブマスターが学ぶべきこと

SEMWATCHのデータが失われ、以前書いた記事もいくつか消えてしまいました。 Baidu スナップ...

王小川:攻撃を受けるインターネット大手からの生き残りのヒント

記者:ハン・ジチャン写真 | 王昭雑誌記者は、ネット界の新人で捜狗のCEOである王小川の人柄を、無神...

中国最大のプログラマーウェブサイトが600万人以上のユーザー情報を漏洩

中国最大のプログラマー向けウェブサイト「CSDN」でユーザー情報の漏洩が発生し、600万件以上の登録...

バーチャルとリアルデザインがウェブサイトを正しく最適化する方法について解説(ケース分析)

みなさんこんにちは。私はハルビン仮想および現実ウェブサイト設計です。最近、いくつかの新しいウェブサイ...

IoTエコシステム: エッジコンピューティング

現代の IoT エコシステムのほとんどは、インターネットへの安全な接続に依存しています。デバイスはク...

架橋の詳しい説明:架橋の役割

昨日、私は「クロスリンクの詳細な説明:クロスリンクとは何か」という記事を書きました。多くの友人がこの...

装飾業界のローカルポータルサイトはどうやって収益を上げるべきでしょうか?

私は小さな都市で地元の装飾ポータルサイトを運営しています。私のサイトである嘉興装飾ネットワーク (h...

2021 年のクラウド コンピューティング業界の発展動向は何ですか?

2021 年のクラウド コンピューティング業界の発展動向は何ですか? 2020 年、クラウド コンピ...

対外貿易促進: 公開した製品をすぐに掲載してもらうにはどうすればよいでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くの貿易...

WEB2.0ボタンツール:Baiduの共有

Baidu Share は、Baidu が Web ページのアドレスを収集して共有するために提供して...