このほど、国際標準化試験機関TPCはビッグデータ処理性能TPCx-BB SF3000の最新ランキングを発表した。アリババクラウドが独自に開発した神龍ビッグデータ加速エンジンは、2187.42BBQpmのスコアで世界記録を更新し、2位に40%以上の差をつけました。
今回、アリババクラウドは自社開発の神龍ビッグデータ加速エンジンMRACC(ApasaraCompute MapReduce Accelerator)でこのコンテストに参加しています。 MRACC は、自社開発の Shenlong アーキテクチャの特性を組み合わせることで、Spark、Hadoop、Alluxio などの一般的に使用されるビッグデータ コンポーネントを最適化し、独自のパフォーマンス上の利点を実現します。最終的には、複雑な SQL クエリ シナリオのパフォーマンスが Spark のコミュニティ バージョンと比較して 2 ~ 3 倍向上し、eRDMA を使用することで Spark のパフォーマンスが 30% 高速化されます。 具体的には、ビッグデータタスクの重いIO特性に対応して、Alibaba Cloud MRACCはクラウドのアーキテクチャ上の利点を組み合わせて、ソフトウェアのSQLエンジンの最適化、キャッシュ、ファイルのトリミング、インデックス作成などの最適化方法の使用、圧縮などの操作の異種デバイスへのオフロードの試みなど、ネットワークとストレージの観点からソフトウェアとハードウェアのアクセラレーションを実行します。また、ネットワークの高速化に eRDMA を使用し、eRDMA ネットワーク上のシャッフル ステージでデータ交換を実行することで、レイテンシが短縮され、CPU 使用率が大幅に向上します。 TPCx-BB のテスト結果は、構造化データ、半構造化データ、非構造化データを含むエンドツーエンドのビッグデータ システムの全体的な動作パフォーマンスを包括的かつ正確に反映できることが報告されています。実際の顧客シナリオの観点から、ビッグデータシステムのソフトウェアとハードウェアのパフォーマンス、コスト効率、サービス、電力消費をより包括的に評価することができ、さまざまな業界のインフラストラクチャ選択にとって重要な参考意義を持ちます。 |
<<: VMware の Xinlei Zheng: オープンソースの採用、イノベーション = 創造性 × 実装
>>: GitLabCI テンプレートライブラリのパイプライン最適化の実践
Siyiou は杭州にある SEO 最適化会社です。Siyiou は 2003 年に設立されました。...
本記事では、大手企業の面接ではほぼ必須となるRedisの分散ロックについて主に解説します。以下では、...
kuriko のロシア VPS が販売中です。データセンターはモスクワにあり、中国電信と中国聯通向け...
ここ2日間、多くの友人から、なぜ私のウェブサイトのランキングが上がらないのかと聞かれました。なぜ外部...
優れたウェブサイトの構築Google の使命は、世界中の情報を整理し、世界中の人々がアクセスして使え...
VLAN と VPC は、パブリック クラウドに展開されたインフラストラクチャを保護するために使用で...
アーキテクチャレビューこのプロセスで取り上げられるアーキテクチャの詳細は、オープンソース テクノロジ...
過去 10 年間で、接続されたデバイスの数とそれらが生成するデータの量は飛躍的に増加しました。一般的...
SEO とマーケティング業界でよく知られている実名マーケティング フォーラムは、常にウェブマスターの...
ftpit が Hostcat に初めて登場したのは 2011 年 8 月で、それから 4 年が経ち...
中国マーチャントであるanyhkは、香港(HKBN、HKT)と台湾HinetのNAT VPS、および...
ウェブサイトのインクルードは非常に厄介な問題です。友好的なリンクを交換するとき、ほとんどのウェブマス...
cmivps は現在、香港 CN2 VPS および米国トリプルネットワーク AS4837 ライン V...
ウェブサイトを構築する目的は、訪問者を引き付け、維持することです。ウェブサイトが訪問者の支持を得たい...
新しい同僚が会社に入社するたびに、その同僚は自分のコンピューター上でさまざまな環境を構成する必要があ...