ビッグデータとクラウドコンピューティングの深い統合はどのような側面に反映されていますか?

ビッグデータとクラウドコンピューティングの深い統合はどのような側面に反映されていますか?

[[386838]]

ITエコシステム全体のさらなる発展に伴い、2021年には、IT実務家の間ではビッグデータの開発動向について一般的なコンセンサスが形成され、ビッグデータとクラウドコンピューティングのさらなる深い統合、つまりビッグデータがクラウドコンピューティングを取り入れてクラウドネイティブへと移行するという動向が高まっています。

ミン兄弟がここにいます。私たちは、ディープ インテグレーションのトレンドの中で、ビッグ データとクラウド コンピューティングのディープ インテグレーションが具体的にどこに現れるのかを一緒に見ていきます。

ビッグデータとクラウド コンピューティングの緊密な統合は、次の側面に反映されています。

1. アプリケーション側のビッグデータ プラットフォームはクラウド上にあります。ビッグデータ テクノロジを使用するビジネス アプリケーション ビルダーは、独自のデータ センターを構築するのではなく、ビッグデータ プラットフォームをクラウドに移行します。クラウドベンダーの IaaS レイヤー上に独自のビッグデータ プラットフォームを構築する企業もあります。現状では、このようにクラウド上でビッグデータを活用する事例は比較的少ないです。クラウドベンダーが提供するPaaS層のビッグデータ関連製品を直接利用する企業もあれば、クラウドベンダーが発売するSaaS層のビッグデータ関連製品を直接利用する企業もあります。 「クラウド移行」において強調する必要がある傾向が 1 つあります。それは、ベンダー ロックインが発生しないことを誰もが非常に重視しているということです。基盤となるクラウドは、複数のパブリック クラウドとプライベート クラウドを統合したハイブリッド クラウドである場合があります。

2. クラウド コンピューティング ベンダーは、ビッグ データに基づく独自の付加価値サービスを継続的にリリースしています。主要なクラウド ベンダーは、市場競争力を高め、市場での地位をさらに強化/拡大するために、最も基本的な S3/OSS、EMR/E-MapReduce、前述の AWS RedShift、Alibaba Cloud の MaxCompute など、独自の統合ビッグ データ関連製品を積極的にリリースしています。さらに、さまざまなクラウド データベース、クラウド上のサーバーレス形式のさまざまなビッグ データ サービスなどがあります。次のスクリーンショットに示すように、このリストはまだ増え続けています。


3. 従来のビッグデータベンダーは、自社の製品やサービスを提供するためにクラウドに依存するようになりました。たとえば、Elastic は長年クラウドをベースとした独自の ELK テクノロジー スタックを提供しており、Databricks のビッグデータ プラットフォームと製品は常にクラウドをベースとして顧客にサービスを提供しており、Cloudera はビジネス モデルの変更を常に模索しています。

4. それぞれの特定のビッグデータ コンポーネントは、独自のアーキテクチャを積極的に変更し、クラウド ネイティブから「クラウド化」へと積極的に移行しています。概念レベルでは、ビッグデータは、初期の「データの局所性」と「モバイル データはモバイル コンピューティングほど優れていない」という重視から、現在の「ストレージとコンピューティングの分離」に進化しました。新しくリリースされた各コンポーネントとフレームワークは、クラウド ネイティブを積極的に採用しています。たとえば、Pulsa と TiDB は、ストレージとコンピューティングが分離されたクラウド ネイティブ アーキテクチャに基づいています。伝統的なコンポーネントには歴史的な負担が伴いますが、常に革新と変化を求めています。たとえば、Flink/Spark は深く統合されており、Kubernetes クラスター モードをサポートしています。 Kafka は、Zookeeper と Rebalance Protocol の静的メンバーシップへの依存を完全に排除するなど、フラワーのクラウド化も継続的に検討しています。古いことわざに「意志に従えば繁栄し、従わなければ滅びる」というのがあります。クラウド ネイティブ アーキテクチャに適さない一部の技術コンポーネントの市場は縮小しています。たとえば、多くのシナリオでは、Kubernetes が Yarn に取って代わり、オブジェクト ストレージ OSS/S3 も HDFS に取って代わります。また、Apache コミュニティによって Ozone がリリースされたことも注目しています。このコンポーネントはオブジェクト ストレージに基づいて、ファイル システム API も統合して起動します。このコンポーネントの背後には、元の HDFS コミュニティからの多くのコミッターがコードを提供しており、このコンポーネントは Cloudera CDP プラットフォームにも組み込まれています。次の図は、Flink/Spark と Kubernetes の深い統合を示しています。(k8s オペレーターを使用して k8s クラスターで Spark/Flink ジョブを実行するだけでなく、ネイティブの深い統合であることに注意してください)


<<:  分散システムのCAP定理とBASE理論

>>:  SpringBootとデータベーステーブルレコードに基づく分散ロックの実装

推薦する

ソフトコピーライティングを理解せずにSEOを行うと、オンラインマーケティングへの道は困難で困難なものになります。

著者はかつて、SEO はインターネット マーケティングの易経であると述べました。この文は、SEO が...

インフラ近代化の3つの課題を克服する

今日の組織にとって、インフラストラクチャの近代化は必須です。テクノロジーリーダーは、ビジネス価値を高...

銀行業界は現在、クラウドへの移行をどのように進めているのでしょうか?

2021年7月15日午前、中国建設銀行でシステムクラッシュが発生し、通常の業務が行えなくなり、すべて...

優れたマーケティングと質の悪い製品は市場全体の衰退につながる

私は再びあなたとチャットし、私の一時的なアイデアをいくつか共有して、それがあなたの役に立つことを願っ...

SEOスペシャリストがBaiduプラットフォームを有効活用する方法

SEO 担当者として、常に発見し、試し、実験し、考え、まとめることでのみ、この道を順調に進むことがで...

画像トラフィックのあるウェブサイトを構築するための SEO のヒント

ご存知のとおり、画像ウェブサイトはウェブサイトのトラフィックを増やすことができます。実際、私は最近多...

JVM ランタイム メモリ生成構造

Java アプリケーションの場合、Java ヒープは仮想マシンによって管理されるメモリの最大の部分で...

エッジコンピューティングのイノベーション:少ないリソースでより多くの成果を実現

COVID-19 パンデミックにより、データの使用方法だけでなく、データが使用および生成される場所も...

Pacificrack: 米国向けに最適化された VPS、75% オフ、最低 $8/年 (¥50/年)、無料スナップショット付き

Pacificrack は一昨日 80% 割引をリリースしましたが、提供された構成は 2 つだけでし...

API サーバー ソースコード分析: エントリ ポイント分析

Kubernetes (K8s) クラスターで最も重要なコンポーネントの 1 つは、すべてのクラス...

WEB2.0 ウェブサイトで検索エンジンを最適化する方法

Douban など、多くの WEB2.0 ウェブサイトは検索エンジン最適化をうまく行っています。本を...

Baidu Weigou が突然現れ、検索エンジン マーケティングは「揺さぶられた」!

今日、百度で商品キーワードを検索したところ、突然検索結果に「百度微盘」というセクションがあり、百度百...

Baidu SEO 検索の新しいヒント: Baidu SEO 提案ページがオープン

Admin5 Webmaster Network は 3 月 8 日、A5 SEO Diagnosi...

海外のウェブサイトのおすすめ:MatchPuppyはペットの犬との出会いをベースにしたソーシャルウェブサイトです

北京時間4月25日、海外メディアの報道によると、MatchPuppyはペットの犬同士がブラインドデー...