2021 年の調査では、回答者の 96% が Kubernetes を使用しているか、近い将来に使用する予定であり、69% が現在本番環境で Kubernetes を使用しているという驚くべき結果が出ました。 Kubernetes は、大規模な組織から小規模な組織まで、多くのメリットをもたらします。開発者の生産性の向上、コストの削減、効率性の向上、そして最終的にはエンドユーザーのエクスペリエンスの向上につながります。 ただし、Kubernetes には多くの利点がある一方で、いくつかの課題もあります。包括的な監視スタックを実装することは、K8 上でワークロードを実行するチームにとって重要な初期ステップです。この記事では、ダウンタイムを短縮し、トラブルシューティングをより効果的に行い、クラスター内で発生しているすべての事象を完全に可視化するために使用できる 4 つのオープン ソース ツールとテクニックについて説明します。 オープンソースのツールとテクノロジーCloud Native Computing Foundation (CNCF) は、監視と観測のための数多くの素晴らしいテクノロジーとツールを育成し、卒業させてきました。これらのツールとテクニックのうち 4 つは特に有用であり、あらゆる規模の組織で活用できます。さあ、始めましょう。 指標とアラートPrometheus は 2016 年 5 月 9 日に CNCF に承認されました。これは強力で 100% オープン ソースのツールおよび時系列データベースです。 Prometheus を使用すると、エンジニアリング チームはメトリックを収集し、大規模にアラートを構成できます。 Prometheus は、新興のスタートアップ企業だけでなく、Digital Ocean、Ericsson、Docker など世界最大規模の企業でも使用されています。 Prometheus を使用すると、チームは PromQL を使用してクエリを記述し、アドホック テーブル、グラフ、アラートを作成できます。 Alertmanager を使用すると、チームは事前に設定されカスタマイズ可能なアラートを使用して、発生した重要な問題を特定できます。アラート ルールを使用すると、ユーザーは Prometheus 式言語を使用してアラート条件を定義し、外部サービスに通知を送信できます。 Prometheus には視覚化ツールのセットが組み込まれていますが、Grafana や ContainIQ などの別の視覚化ツールと組み合わせて使用されることもよくあります。 Prometheus を視覚化ツールに接続するのは簡単です。 Grafana には、多数の事前構築されたダッシュボードが用意されています。 Prometheus には多くの統合と既存のエクスポーターがあるため、公式のエクスポーターと外部で管理されているオプションの両方を使用して、サードパーティのメトリックを Prometheus にブリッジすることは非常に簡単です。 Prometheus は CNCF の卒業プロジェクトです。 GitHub では、Prometheus には 42,000 を超えるスターがあり、700 人を超える貢献者からの貢献があります。 リンクトラッキングJaeger は 2017 年 9 月 13 日に CNCF に承認された、分散トレースのオープンソース プラットフォームです。 Jaeger を使用すると、エンジニアは分散トランザクションの監視またはトレースを介して監視およびトラブルシューティングを行うことができます。 Prometheus と同様に、Jaeger は大規模なチームから小規模なチームまで使用されており、大規模に使用できるように設計されています。 Uber のような企業は、Jaeger を使用して毎日数十億のスパンを処理しています。 Jaeger は、パフォーマンスとレイテンシの分析、および最適化に特に役立ちます。 Jaeger を使用すると、根本原因分析の実行とサービス依存関係の調査がはるかに簡単になります。たとえば、Jaeger を使用すると、エンドユーザー エクスペリエンスに影響を与えるものも含め、特定のマイクロサービスのレイテンシの急増を特定できます。 Prometheus と Jaeger は一緒に使用されることがよくあります。Prometheus はインフラストラクチャの問題を検出するためのツールセットを提供し、Jaeger は個々のリクエストをドリルダウンして問題のトラブルシューティングを支援します。 Jaeger には、Javascript で実装された Jaeger Web UI と呼ばれるネイティブ UI があります。 Jaeger と Kubernetes の使用を開始するのは簡単なプロセスです。 Jaeger Operator は Kubernetes クラスターにインストールでき、特定の名前空間またはクラスター全体に対して有効にすることができます。 Jaeger は CNCF の卒業プロジェクトです。 GitHub では、Jaeger には 15,000 を超えるスターがあり、200 人を超える貢献者からの貢献があります。 標準化されたメトリクス、ログ、トレースOpenTelemetry は 2019 年 5 月 17 日に CNCF に承認され、テレメトリ データを計測、生成、収集、エクスポートするためのツール、API、SDK のセットです。 OpenTelemetry を使用すると、エンジニアはメトリック、ログ、トレースを収集できるため、インフラストラクチャとアプリケーションのパフォーマンスをより深く調査できます。 OpenTelemetry はオープンソースでベンダー中立であり、可観測性の分野で大手企業の多くやクラウド プロバイダー自身によってサポートされています。マイクロサービス アーキテクチャには多くの利点がありますが、大規模に導入されると、エンジニアリング チームがサービスのパフォーマンスや他のサービスへの影響を把握することが難しくなる可能性があります。メトリクス、ログ、トレースにより、チームは現状を包括的に把握できますが、このデータを収集するには複数のエージェント/コレクターを実行、操作、保守する必要があり、困難な場合があります。 OpenTelemetry は、オープンソース ツールであろうと有料ソリューションであろうと、観測性バックエンドにデータを送信するための形式を標準化することでこの問題を解決します。チームは標準形式を使用してバックエンドを簡単に切り替えることができるため、ベンダー ロックインのリスクが排除されます。 OpenTelemetry は CNCF 卒業プロジェクトであり、GitHub でホストされています。 マルチクラスタとメトリクスの長期保存2019 年 7 月 20 日に CNCF に承認された Thanos は、エンジニアが高可用性の長期ストレージ オプションを使用して Prometheus セットアップを拡張できるようにするオープン ソース プロジェクトです。 Thanos は、Prometheus サーバーと同じホストまたは同じポッドで実行されるサイドカーを使用して、Prometheus と簡単に統合できます。 Prometheus と同様に、Thanos は Kubernetes に特に依存しているわけではありませんが、これは一般的な使用例です。サノスはいくつかの重要な点でプロメテウスを改善することを目指しています。まず、Thanos を使用すると、エンジニアは複数のサービスとクラスターにわたるクエリを許可することで、Prometheus セットアップを拡張できます。複数のクラスターにわたって Kubernetes ワークロードを実行している企業にとって、これは集中化されたビューを通じて時間を節約できる改善されたアプローチです。 2 番目に、Thanos を使用すると、チームは S3 などの多くの長期ストレージ オプションを活用できるようになりました。 Prometheus と同様に、Thanos は Grafana などの視覚化ツールで使用でき、Prometheus クエリ API をネイティブにサポートします。 Thanos は CNCF インキュベーション プロジェクトです。 GitHub では、Thanos には 10,000 を超えるスターがあり、400 人を超える貢献者からの貢献があります。 その他の考慮事項考慮すべき追加のベストプラクティスをいくつか示します。
要約するこの記事では、Kubernetes 上でワークロードを実行するエンジニアの監視を強化および改善できる 4 つのツールセットを紹介しました。 Prometheus は多くの組織が選択する時系列データベースであり、Thanos と併用すると長期的なソリューションとなります。 Jaeger は、インフラストラクチャで検出された問題を修正するために必要な追加のコンテキストを提供します。 OpenTelemetry は、メトリック、ログ、トレースの形式と収集を標準化し、チームに安心感を与え、前進し続けることを可能にします。 これらのツールを組み合わせることで、効果的なトラブルシューティングとエンドユーザーの優れたエクスペリエンスの確保に必要なメトリック、ログ、トレースが提供されます。 |
<<: Kubernetes クラスターでの Etcd データのバックアップと復元
>>: Ctrip の大量コールドデータ シナリオにおける JuiceFS の実践
インドネシアの会社であるNatanetworkは、インドネシアのVPS(インドネシアのクラウドサーバ...
2 週間前、A5 フォーラムで外部リンクの構築に関する専門家の投稿を見ました。質問の多くは、「外部リ...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeChatが使われるよ...
インターネットはほとんどの人に知られているので、オンラインになったときに最初に接触するのはウェブサイ...
ハイパーコンバージド インフラストラクチャ (HCI) が、組織が簡単に拡張してデータをより細かく制...
Java仮想マシンの概念Java 仮想マシン (JVM) は、実際のコンピュータと同様に、シミュレー...
偽の鳥の巣事件により、かつて人気を博した快手のトップキャスター、シンバが再び出禁となった。今回は半年...
インターネットマーケティング市場は本格的に発展しており、ますます多くの企業がインターネットマーケティ...
テンセントテクノロジーの雷建平は6月10日に報告した。テンセントテクノロジーは本日、Xunleiが早...
Docker チームの SCOTT JOHNSTON 氏は、2021 年の開発チームに関連する主なト...
ブルガリアのDA International Group Ltd傘下のalphavpsブランド(AS...
Docker入門Docker は、コンテナ内でアプリケーションを構築、デプロイ、実行するためのオープ...
テキスト リンクは紙の上では非常に簡単に見えますが、特に初心者の場合、操作を間違えることがよくありま...
Lieyun.comが4月2日に報じた。先週、Lieyun.comは、Weiboがセルフメディアユー...
モノのインターネットの台頭により、これらのデバイスによって生成される膨大な量のデータをサポートできる...