この記事はWeChatの公開アカウント「Dotnet Plus」から転載したものです。以下のQRコードからフォローできます。この記事を転載する場合はDotnet Plus公式アカウントまでご連絡ください。 1. 不条理 過去 1 ~ 2 か月間、本番環境の K8s クラスターでは、短期間の 503 Service Temporarily Unavailable が頻繁に発生しており、積極的に再現することはできません。これはかなり憂鬱でストレスがたまります。 HTTP 5xx 応答ステータス コードは、サーバー側のエラーを定義するために使用されます。
2. トラブルシューティング記録
k8s クラスター ノードに入ると、確かに一部のノードのクロック調整サービスが開始されておらず、北京時間よりも 2 ~ 3 分遅れていることが時々わかります。これは確かに、時間差によって Impala 接続認証が失敗する原因を説明できます。
3. 思考と推論 障害サイトで Impala 接続の問題が発生するたびに、Impala 接続の問題によって Web アプリケーション サービスがオフラインになる理由がわかりません。 当社のウェブアプリには、toB と toC の両方のビジネスがあります。このサイトは mongodb に大きく依存しており、impala への依存度は低いです。impala が接続できない場合でも、それをチェックできないだけで、サイトの SSO + 注文関連の書き込み操作は引き続き利用できるはずです。 数日前に見たk8sプローブを思い出すと、準備プローブがImpalaを検出したようです。
準備プローブが Impala の検出に 3 回失敗すると、Pod は Unready としてマークされ、Pod は webapp サービス ロード バランサーから削除されてトラフィックを分散しなくなり、nginx に実用的なバックエンド サービスがなくなり、サイト 503 になる可能性が高くなります。 すぐにベータ環境を見つけ、Impala を切断して仮説を検証します。 4. 問題のレビュー バグ修正は私が推測したものではなく、純粋に経験に基づいて推測されたものです。はっきりとした推理のアイディアはありませんが、誰もが落とし穴に足を踏み入れる早期警告とみなすことができます。 Docker のヘルスチェックは検出のみ可能ですが、Kubernetes の生存プローブと準備プローブには検出機能だけでなく意思決定機能もあります。 ここで、k8s 準備状況検出戦略に問題があります。 webapp の impala への弱い依存関係に問題があることが検出された場合、webapp サービス全体がオフラインになります。強い依存関係のみを検出する必要があります。強い依存関係の問題は、コンテナの準備ができていないことを示しており、これは準備状況プローブの本来の目的でもあります。 |
<<: シングルテナント SaaS アーキテクチャとマルチテナント SaaS アーキテクチャの違いは何ですか?
>>: 【純乾物】5G?エッジコンピューティング?またまた大げさな「コンセプトの誇大宣伝」?
Racknerdは、米国独立記念日に向けて、米国(ロサンゼルス、ダラス、シカゴ、ニューヨーク)の1C...
最近、「アクティブセキュリティと産業エコシステムの構築」をテーマにした2020 HCS合肥サイバーセ...
しばらくデータセンターで運用してきた場合は、特定の目的のためにクラウド移行戦略に移行する可能性があり...
QQは中国最大のチャットツールであり、QQ Spaceは多くのユーザーを魅了しています。したがって、...
VMware (NYSE: VMW) は本日、通信サービス プロバイダ (CSP) と企業の進化する...
昨日の土曜日は何もすることがなかったので、オンライン上の友人2人に連絡して小さな集まりを企画しました...
韓国のローカル VPS、韓国の VPS、韓国の VPS の推奨 (韓国のクラウド サーバー): 速度...
[[410405]] JVM が Java にとって、そしてプログラマーの面接にとってどれほど重要で...
「小規模サイトは外部リンクに依存し、大規模サイトは内部リンクに依存する」という格言がありますが、これ...
2017年10月、テンセントは一部のユーザーを対象に、Sogou SearchをWeChatに統合す...
Digitalocean は 6 か月の沈黙を経て、ドイツに新しいデータセンターをオープンしました。...
旧正月で帰省した際、写真や壁紙を掲載した私のウェブサイトが降格されました。約1か月後、ウェブサイトの...
Zenlayer はベトナムのサーバー (ベトナム独立サーバー、ベトナム物理マシン) を提供し、カス...
ユーザーインタビューとは、基本的には私たちが質問をして、ユーザーがそれに答えることを意味します。少し...
——24KピュアクラウドERPがここにあります。一見すると、伝統的な地元のものの影がいたるところに見...