マルチクラウドおよびハイブリッドクラウドシナリオにおけるデータ同期ソリューション: Kafka

マルチクラウドおよびハイブリッドクラウドシナリオにおけるデータ同期ソリューション: Kafka

[[427949]]

この記事はWeChatの公開アカウント「Mingge's IT Essays」から転載したもので、著者はIT Minggeです。この記事を転載する場合は、Mingge の IT Essays 公開アカウントにご連絡ください。

1 エンタープライズビジネスシステム展開アーキテクチャのトレンドの変化 - マルチクラウドとハイブリッドクラウド

現在、企業の情報システムの展開アーキテクチャ(DA:展開アーキテクチャ)における大きな変化は、ますます多くの企業が継続的にクラウドにアプリケーションを展開していること、つまり、業務システムがクラウドに移行する傾向が強まっていることです。

ただし、企業のビジネス システムをクラウドに移行することは、一夜にして達成できるものではなく、また一方通行でスムーズに進むプロセスでもありません。これには、新しく開発された業務システムのクラウドへの積極的な移行(クラウドネイティブのテクノロジー スタックを使用して新しく開発された業務システムであるため、クラウドへの移行は比較的スムーズです)と、歴史的なレガシー システムのクラウドへの移行(単一のレガシー システムの変換、移行、クラウド移行には、複雑さに応じて 1 年以上かかることがよくあります)が含まれます。場合によっては、クラウド展開をプライベート クラウドまたはデータ センターにロールバックする必要がある状況があります (クラウドへの移行がスムーズでなかったり、適応性がない場合は、ロールバックされるシナリオもあります)。

企業のすべてのビジネス システムをクラウドに移行する最終的な目標は、さまざまな理由 (ビジネス システムの高可用性、クラウド ベンダーに縛られないこと (ベンダー ロックイン)、エコシステム パートナー (経済的要因) など) により、単一のパブリック クラウドではなく、複数のパブリック クラウド、プライベート クラウド、さらにはローカル データ センターのハイブリッド アーキテクチャを展開することです。

技術的観点から見たビッグデータ産業の発展動向

2. マルチクラウドおよびハイブリッドクラウド展開アーキテクチャの難しさ - データ同期

前述のように、長期的には、企業の複数の業務システムは、マルチクラウド、ハイブリッドクラウド、ローカルデータセンターのハイブリッドアーキテクチャで展開されることになります。同時に、複数のビジネス システムは互いに分離されておらず、連携してデータを操作する必要があるため (もちろん、通常は直接の RPC/HTTP 呼び出しではありません)、マルチクラウドおよびハイブリッド クラウド展開アーキテクチャでのデータ同期という難しい問題が発生します。

企業が会社レベルで統一された計画を持たず、各部門およびプロジェクトが個別に展開計画を設計および実装する場合、そのアーキテクチャは次の図のようになります。

マルチクラウドおよびハイブリッドクラウドの展開アーキテクチャ

マルチクラウドおよびハイブリッドクラウド展開アーキテクチャにおける 3 つのデータ同期ソリューション - KAFKA

KAFKA に詳しい人は、KAFKA が企業内の複雑で多方向のデータ相互作用を解決するために 2010 年頃に LinkedIn によって開始されたデータ バス/中央データ パイプライン ソリューションであることを知っています。 LinkedIn のデータ相互作用アーキテクチャを簡素化します。

LinkedIn の kafka

LinkedIn が KAFKA をオープンソース化して以来、高スループットと低レイテンシの機能 (シーケンシャルな書き込みと読み取り、ZeroCopy、エンドツーエンドの圧縮、パーティションベースの水平拡張)、継続的な進化によって獲得したその他の機能 (複数のコピーに基づく高可用性とフォールト トレランス、EOS の 1 回限りのセマンティクス、プロデューサーの冪等性、ACID トランザクションのサポート、階層型ストレージ アーキテクチャ)、および継続的に強化および拡張されたエコシステム (kafka connect、kafka スキーマ レジストリ、高レベル抽象化 kafka stream、ksqlDB) により、データの適時性 (リアルタイム警告、リアルタイムのリスク管理、リアルタイム データ ウェアハウスなどのシナリオ) に重点を置く今日のビッグ データ、および疎結合 (マイクロサービスはもはや直接相互に呼び出すことはなく、データを同期することでステータスを同期する) に重点を置く今日のマイクロサービス (適切なベントに立って、その地位が上昇中) において、ほぼすべての企業が多かれ少なかれ KAFKA (または同様の競合製品など) を使用しています。ビジネス システムに pulsa を導入します。

KAFKA は企業内のデータバス/中央データパイプラインソリューションとして使用できるため、マルチクラウドおよびハイブリッドクラウド展開アーキテクチャの新時代のデータ同期で役割を果たすことができるのでしょうか?

答えはイエスです。

この時点でのアーキテクチャは次のようになります。

マルチクラウドとハイブリッドクラウドでのデータ同期 - kafka

アーキテクチャの重要なポイントは次のとおりです。

  • ローカル データ センターに KAFKA クラスターをデプロイします。
  • クラウドに Kafka クラスターをデプロイします。 (クラウドが複数ある場合は、各クラウドに Kafka クラスターをデプロイします)。
  • ローカル データ センター内のすべてのアプリケーションのデータは、ローカル データ センターの Kafka クラスターに集約されます。 (Kafka Java/Scala API を使用して Kafka に直接書き込むことも、さまざまな CDC ツールを使用して RDBMS で binlog/redolog を収集してから Kafka に書き込むこともできます。使用可能な CDC ツールには canal/maxwell/ogg/debezium などがあり、Kafka Connect エコシステムのさまざまなコネクタ プラグインも使用できます);
  • Kafka のデータ同期ツール MirrorMaker を使用して、データセンターと各クラウド内の Kafka クラスター間でデータを同期します。
  • 各クラウド アプリケーションは、対応する Kafka クラスターにアクセスしてデータを取得します。

このアーキテクチャの利点は次のとおりです。

  • 複数の大手メーカーの生産システムにより、マルチデータセンターアーキテクチャの実現可能性が検証されています。
  • 継続的な低遅延データ同期ソリューション。 (高速ネットワーク帯域幅では、遅延は数百ミリ秒に達する可能性があります)。
  • 集中管理と監視、複数のセキュリティおよびガバナンス ソリューションの統合をサポートします。
  • コスト削減;
  • KAFKA を開発している商用企業 Confluent が提供する Confluent プラットフォームを使用できます。この製品は、データセンター/プライベート クラウド/パブリック クラウドに導入できます。アーキテクチャ図は次の通りです。画像

4 知識の要約

  • 企業の IT インフラストラクチャにおける大きなトレンドとして、クラウド コンピューティングへの傾向が強まっていることが挙げられます。
  • 企業のビジネス システムをクラウドに移行することは、一夜にして達成できるものではなく、また一方的に順調に進むプロセスでもありません。
  • 将来のエンタープライズ ビジネス システムの展開アーキテクチャは、単一のパブリック クラウドではなく、複数のパブリック クラウド、プライベート クラウド、さらにはローカル データ センターのハイブリッド展開になります。
  • 企業のビジネス システムは、マルチクラウドおよびハイブリッド クラウドの展開アーキテクチャにおいて、データ同期という課題に直面しています。
  • KAFKA は、マルチクラウドおよびハイブリッド クラウド展開アーキテクチャでのデータ同期ソリューションとして使用できます。
  • マルチクラウドおよびハイブリッド クラウド展開アーキテクチャでデータ同期のソリューションとして KAFKA を使用する場合、ローカル データ センターとクラウドの各クラウドに KAFKA クラスターが展開されます。
  • マルチクラウドおよびハイブリッド クラウド展開アーキテクチャで KAFKA をデータ同期ソリューションとして使用する場合、Kafka のデータ同期ツール MirrorMaker を使用して、データセンターと各クラウドの Kafka クラスター間でデータを同期できます。

追記:著者は、複数のデータセンター間のデータ同期問題を解決するために、いくつかのサードパーティ企業がこのソリューションに基づいてパッケージ化された商用製品を発売していることを知りました。 (ビジネスチャンスです、友人の皆さん、これは長期にわたる大きなケーキです)。

関連情報ダウンロード:リンク:https://pan.baidu.com/s/1FNAkwXbxQBn0tPINKPXVCg 抽出コード:kafk

<<:  「ファーウェイクラウド・東武カップ」大会が終了し、産業インターネットエコロジカルベンチマークの健全な発展を促進

>>:  これが Scala の真髄です。これを受講すれば、面接を恐れることはありません。

推薦する

2020年のクラウドコンピューティングの展望: マルチクラウド管理がさらに高レベルへ

過去 1 年間、ハイブリッド クラウドとマルチ クラウドが話題となってきました。サービスを提供するた...

bacloud-$25/I3-3220/8G メモリ/2tHDD または 120gSSD/100m 無制限トラフィック

リトアニアのホスティング会社 bacloud は、2002 年からホスティング事業を運営しています。...

Miyun監視ウェブサイト虚偽宣伝監視ウェブサイト違法行為

これまで、密雲県の企業が運営する商業ウェブサイト1,993件が電子商取引規制「レーダーネットワーク」...

ウェブサイトの降格に関する考察

はい、今回は本当に権利がダウングレードされました。 1 月の Baidu の重みが 4 で、Aizh...

Yahooドメイン名登録は1.99ドル

Yahoo ドメイン名の登録料が 1.99 ドルであることはもはやニュースではありません。しかし、し...

入札アカウントで重複キーワードを処理する方法

入札アカウントでのキーワードの重複は、すべての入札担当者が遭遇する一般的な問題です。この問題に対する...

AiLi Women's Networkは新しいドメイン名aili.comを使用します

最近、中国の女性向け専門ウェブサイトでトップにランクされている愛里女性網が、ドメインwww.aili...

マネージド サービス プロバイダーはクラウド コンピューティングのコストを削減できますか?

Cloud Solutions Architect は、特にクラウド コストの観点から、マネージド ...

pumpcloud: マカオ VPS の再入荷、マカオ テレコム、500Mbps 帯域幅、超大規模トラフィック、市場では珍しい

マカオ VPS は VPS 市場で入手するのが非常に難しく、リソースが不足し、高価です。ここでは、p...

MikroVPS-3.45 ユーロ/Xen/512M メモリ/25G ハード ドライブ/1.5T トラフィック/10G ポート

ハンガリーの VPS 販売業者である MikroVPS.hu は、VPS ビジネスに注力しています。...

格安ドメイン名: 8 月のドメイン名プロモーション概要

Hostcat にドメイン名関連の情報を投稿してから長い時間が経ちました。主な理由は、ドメイン名につ...

hostus-$5/年/128M メモリ/10G ハードディスク/200g トラフィック/ダラス

Hostus は私のお気に入りの VPS プロバイダーです。私が気に入っている理由は、十分なリソース...

ロングテールワードをマイニングし、企業ウェブサイトのロングテールトラフィックをレイアウトする方法

はじめに: 企業のウェブサイトへのトラフィックはどこから来るのでしょうか? 中国では、実際に企業向け...

マイクロサービスアーキテクチャの欠点

クラウド アプリケーション開発のためのマイクロサービス アーキテクチャは、疎結合された小さな (「マ...

データエコノミー: Vertiv がエッジコンピューティングの先駆者となった経緯

最近、海外メディアData EconomyがVertiv GlobalのCEO、ロブ・ジョンソン氏に...