クラウドストレージに隠されたデータを見つける方法

クラウドストレージに隠されたデータを見つける方法

クラウド オブジェクト リポジトリが事実上のデータ レイクになるにつれ、企業は蓄積されるすべてのデータを検索して把握するのに苦労していることが最近の調査で明らかになりました。

空きスペースがたくさんある人は、物が散らかっている傾向があり、それが人間の性なのかもしれません。クラウド オブジェクト ストレージが、ますます多くの企業にとって事実上のデータ レイクになりつつあるという傾向もあります。幸いなことに、クラウド オブジェクト ストレージは比較的安価で、拡張性が高く、アクセスしやすくなっています。たとえば、ほとんどのクラウド Hadoop サービスでは、オブジェクト ストレージを Hadoop 分散ファイル システム (HDFS) に置き換えており、アドホック クエリを提供したり、クラウド オブジェクト ストレージをデータ ウェアハウスの拡張テーブルとして扱ったりするサービスを提供するクラウド コンピューティング プロバイダーが増えています。

デフォルトのターゲットまたはデータ レイクとしてクラウド ストレージを利用するもう 1 つの側面は、共通のターゲットでのデータの蓄積を調整する必要性と、特に GDPR などの規制が発効した場合に、データのプライバシーやデータ保護についてより責任を持つ必要があることです。

今年の夏にクラウド ストレージ (現在は Amazon S3 として知られています) を追加するための SaaS プロバイダー向けの検索レイヤーを立ち上げる予定の Chaos Sumo が、クラウド導入者が感じている問題点の一部を示す調査結果を発表しました。

確かに、この調査は回答者が 120 名と大規模ではなく、主にデータ運用の専門家を対象としており、サンプルはクラウド コンピューティングをすでに導入している組織に偏っている可能性が高いです。たとえば、72% が現在何らかの形のクラウド オブジェクト ストレージを使用していると回答しています。 Amazon S3 を使用している回答者の 40% は、今後 1 年間で S3 ストレージの使用が少なくとも 50% 増加すると予想していると回答しました。

企業では、主にバックアップ、ストレージ、アーカイブに使用されます。しかし、28% の企業がすでにデータ レイクにオブジェクト ストレージを使用しており、さらに 18% の企業が今後 12 ~ 18 か月以内に実装する予定です。この AWS を多用するサンプルでは当然のことながら、同様の割合 (23%) が現在 Amazon Athena を使用していると報告しています。回答者の約半数がすでに Amazon Redshift データ ウェアハウスを使用していると回答しており、Spectrum では S3 を拡張テーブルとして表示できるようになりました。

Athena などのツールの革新により、ETL を必要とせずに、ストレージ用に最適化されていないシステムのデータへのインタラクティブなアクセスが可能になります (ただし、データは CSV、JSON、Parquet などの何らかの形式の半構造化ストレージである必要があります)。

しかし、グラフが示すように、オブジェクト ストレージにデータが集中するにつれて、説明責任の問題を懸念する少数派が増えています。これはまさに、何らかの形のデータ系統、セキュリティ、アクセス制御を存在意義とする、Hadoop などのプラットフォームや、分析およびデータ準備用のパッケージ化されたツールの商業的販売上の利点です。クラウド オブジェクト ストレージは、ガバナンスや境界セキュリティに関しては無防備です。これは従来、データを使用するデータ プラットフォーム、クラウド ホスト、または分析ツールの役割です。

その結果、回答者の 4 分の 1 は、データを分析するためにデータを移動する必要があることを懸念しており、少数ではあるものの統計的に有意な少数派が、データの検索、コンプライアンス、セキュリティについて懸念を表明しました。回答者の半数以上がデータのクリーニングと準備に多くの時間を費やしており、回答者の半数以上が週に少なくとも 6 時間費やしていると答え、約 40% がタスクの完了に週に 11 時間以上費やしていると答えています。

注目すべきは、現在オブジェクト ストレージ内のデータの分析は簡単だと答えた回答者はわずか 7% だったことです。それが、調査スポンサーであるChaos Sumoの事業目的です。同社は、既存の SaaS プロバイダーによる OEM 利用のために、S3 データを Elasticsearch に公開する「データ ファブリック」と呼ばれるものを今夏に導入する予定です。 S3 が、さらに多くの分析プラットフォームやツールに適した場所になることが期待されます。 Chaos Sumo にとって、SaaS プロバイダーに検索をユーティリティとして追加し、このデータの可視性を高めることは、クラウド ストレージのより優れたアプリケーションにつながる可能性があります。

<<:  8000億ドルのクラウドサービス市場:大手企業が覇権を競い、新興企業が「一口かじり取る」

>>:  華雲とその仲間たち | Huayun Data がハイパーコンバージェンスとハイブリッドクラウド製品をパートナーと共有

推薦する

Google、過剰なSEOサイトを取り締まるため検索ランキングアルゴリズムを更新

Google は最近、検索ランキング アルゴリズムの更新を発表しました。これは主に、「ブラック ハッ...

Baidu の最近の変更からわかるユーザー エクスペリエンスの重要性

「山に住めば山の幸を食う。海に住めば海の幸を食う」ということわざがあります。この国では、ウェブマスタ...

新しいサイトのキーワードを選択し、ウェブサイトのチャンスをつかむための小さな戦略

みなさんこんにちは。私の名前は Yu Hongming です。今日は、新しい Web サイトのキーワ...

SEO担当者は、この職業の浮き沈みを楽しむことを学ぶべきだ

みなさんこんにちは。私はShi Touです。私はSEOに2年以上携わっています。時間は長くはありませ...

検索エンジン上のウェブサイトに関する否定的な情報も「最適化」できます。どうすればいいでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますネガティブ...

携帯電話に広告を掲載するにはどうすればいいですか?勝つための5つのコツを教えます!

モバイル テクノロジーが急速に発展している今日、「モバイル アプリケーションのメリットを最大化する方...

VMware、分散型マルチクラウド企業の接続と保護を実現する仮想クラウド ネットワークのイノベーションを発表

VMware は今週の VMworld 2020 で、顧客が最新のネットワークを構築して現在および将...

トップ 15 のクラウド コンピューティング ホスティング プロバイダー

クラウド コンピューティングの時代において、マネージド サービス プロバイダーが極めて重要な位置を占...

SEO のエキスパートと SEO の敗者を分ける 8 つの領域

SEO 業界は標準化されていません。SEO エンジニアの中には、高額の給与を稼ぎ、大規模な Web ...

新浪微博の行動規範が発表される。微博マーケティングは打撃を受けるのか?

新浪微博は、微博コミュニティの秩序を維持し、違反行為を処理するためのオープンで透明なメカニズムを確立...

中国の検索エンジンの歴史

最近、Toutiao 検索がひっそりと開始されたことを発見した人もいます。かつて情報流通と短編動画の...

「顧客が増えると会社の利益も増える」というのは本当でしょうか? 製品価値の向上が鍵

タオバオのような競争が激しい電子商取引業界の現状では、平均注文額を増やすことは不可能ですよね? 顧客...

2020年のクラウドコンピューティングベンダーの戦い:パフォーマンスには差があるが、生き残りには差がない

現在、HAT が率いるクラウド コンピューティング ベンダーは「クラウド」戦争を繰り広げています。感...