Tencent Cloud Big Data チームが主導する Ozone 1.0.0 バージョンが、Apache Hadoop コミュニティで正式にリリースされたことがわかりました。コミュニティによる2年以上の継続的な開発と、1,000を超える内部ノードでの実際の実装検証を経て、Ozone 1.0.0は大規模な本番環境に実際に導入できる能力を備えていることがわかりました。 Ozone は、Apache Hadoop コミュニティによって立ち上げられた新世代の分散ストレージ システムです。その登場により、多数の小さなファイルの保存問題が解決され、Hadoop 分散ファイルシステムのスケーラビリティの欠陥が解決されました。 Hadoop エコシステムにおける新しいオブジェクト ストレージ システムとして、数百億、さらには数千億のファイルのストレージをサポートできます。 テンセントクラウドビッグデータチームのオゾンプロジェクトリーダーである陳毅氏は、ビッグデータ分野の大手メーカーとして、テンセントはコミュニティに参加した最初の国内一流インターネット企業であると語った。すでにOzoneプロジェクトにおいて、クラスターネットワークトポロジ認識の開発とデータ書き込みMulti-Raftパイプライン機能の開発をリードしています。同時に、先進的なStorageContainerManager(SCM)高可用性HA機能も開発中です。 オゾンアーキテクチャ図 クラスター ネットワーク トポロジ認識を例にとると、従来のビッグ データ アーキテクチャでは、ネットワーク トポロジ構造を使用して、コンピューティング エンジンのスケジューラがデータに最も近いノードにタスクをスケジュールし、「データ ローカリティ」を実現できます。新たなコンピューティングとストレージの分離アーキテクチャでも、データのフォールト トレランスと高可用性を確保するために、クラスター ネットワーク トポロジ情報が必要です。 陳毅氏はさらに、Ozoneのアルファ版リリース後、テンセントの社内ビッグデータプラットフォームがOzoneプロダクションクラスターを立ち上げ、業務の一部のデータストレージを引き継いだと紹介した。データ サービスの量が増えるにつれて、Ozone の書き込みパフォーマンスに一定の変動とボトルネックがあることが徐々にわかりました。この発見に基づいて、Tencent Ozone プロジェクト チームはデータ書き込み Multi-Raft Pipeline 機能を設計および開発し、Ozone の書き込みスループットとパフォーマンスが大幅に向上しました。 さらに、Ozone の全体的な安定性とパフォーマンスをテストするために、アプリケーション導入の先駆者チームである Tencent は、1,000 個のデータ ノードのクラスターを社内に導入しました。数か月にわたる安定性およびストレステストが実施されました。この期間中、チームは OOM、ノードのクラッシュ、期待を下回るパフォーマンスなど、さまざまな問題に遭遇し、解決しました。包括的な最適化により、1,000 ノードの単一クラスターが長期間安定して稼働できるようになり、すべてのデータが正しいことが検証されました。 バージョン 1.0.0 では、1,000 ノードのクラスターでのテストに加えて、10 億のメタデータ オブジェクトもテストおよび最適化され、長年 HDFS を悩ませてきた多数の小さなファイルの問題がさらに解決されました。現在、Ozone 1.0.0 は、メタデータ ノードのメモリ使用量が 64 GB を超えない範囲で、10 KB の小さなオブジェクト 10 億個の書き込みを簡単にサポートできます。 Ozone と Hive、Spark、Impala などのコンピューティング フレームワークとのシームレスな統合を保証するために、Ozone 1.0.0 は Hive LLAP、Spark、Impala と統合されました。 TPC-DS テストでは、データ サイズが 100 GB と 1 TB の場合、Ozone は HDFS よりも全体的に 3.5% 優れていることが示されています。 継続的なテストと最適化を経て、アップグレードされた Ozone 1.0.0 ではバージョン機能において質的な飛躍が実現しました。 Ozone 1.0.0 は、Hadoop 互換ファイルシステム、Hadoop 2.x、Hadoop3.x 環境のサポートに加えて、Hadoop エコシステムの Kerberos 認証システムとも互換性があり、ユーザーに気付かれずに暗号化されたデータ ストレージと Ranger 認証統合、GDPR「消去権」、およびネットワーク アーキテクチャ認識をサポートします。 今後、テンセントクラウドビッグデータは、自社の技術優位性と蓄積を活かし、OzoneをベースとしたSCMに基づく新世代の高性能分散ファイルシステムを開発し、テンセントのより多くの内外業務へのOzoneの導入を推進し、より大規模な本番クラスターを展開していきます。同時に、オープンソースをさらに推進し、Hadoop コミュニティに深く参加して、Ozone の信頼性、安定性、パフォーマンスを向上させ、新世代のビッグデータ ファイルとオブジェクトのハイブリッド ストレージ システムに構築していきます。 特筆すべきは、Ozoneプロジェクトへの貢献に加え、テンセントのビッグデータチームは近年オープンソース分野での貢献を徐々に加速しており、現在ではコアビッグデータ機能のオープンソース化を完了していることだ。同時に、実際のビジネスシナリオを組み合わせてオープンソース技術の実装を加速し、技術的な実践と革新を通じてコミュニティに還元し、オープンソースに貢献し続けます。 Apache Foundation のビッグデータ プロジェクトでは、Tencent は Hadoop、Spark、Flink などの主流プロジェクトに多数の機能とパッチを提供してきました。 |
<<: エッジインテリジェンス: この技術シフトが受け入れられつつある5つの理由
>>: これらの企業は、ファーウェイのクラウドナレッジコンピューティングソリューションを基盤として、知識の力を解き放ちました。
企業がクラウド サービスを導入すると、コストの高騰に直面することが多く、最終的にはデジタル変革の進行...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス近年、ライブストリーミン...
ウェブサイトのトラフィックが増加し、プロジェクトがより多くのデータを消費するにつれて、VPS および...
ルーマニアの商人である hetnix は、ドメイン名、仮想ホスティング、電子メール ホスティング、V...
街頭スクラッチカードからインターネット宝くじの選択まで、過去20年間の中国の宝くじの歴史は、宝くじ参...
cmivpsは本日、米国西海岸シアトルデータセンターにVPSを開設しました。デフォルトでChina ...
ブログの外部リンクは最も一般的で最もよく使用される外部リンクですが、ブログの外部リンクを単純に理解し...
今日、「Taobaoが12.12に新しいゲームプレイを開始、商人と消費者が主人公」という記事を見まし...
大規模システムのマイクロサービス構築では、システムは多数のモジュールに分割されます。これらのモジュー...
これまで、企業が災害復旧 (DR) インフラストラクチャを構築したい場合、それはスタンドアロンの施設...
6 月 28 日、暑い夏の日に北京で 2018 Container Day (2018 Ranche...
要点この削除事件は小紅書に大きな衝撃を与えた。データによれば、月間アクティブユーザー数は減少し、1億...
月給5,000~50,000のこれらのプロジェクトはあなたの将来ですウェブサイトには多くの記事が掲載...
人民日報、北京12月26日(記者:李静)最高人民法院は本日、「情報ネットワーク通信権の侵害に関わる民...
百度は9月10日にセキュリティアライアンスの設立を発表したと報じられており、比較的知名度のある国内セ...