大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開催されました。このサミットでは、人工知能、ビッグデータ、モノのインターネット、ブロックチェーンなど12の核心的なホットトピックに焦点を当て、国内外から60人の第一線の専門家が集まります。これはハイエンドのテクノロジーの饗宴であり、トップクラスの IT 技術者が学び、ネットワークを拡大するための見逃せないプラットフォームです。

19日午前の「OpenStackイノベーションと実践」フォーラムでは、UMCloudアーキテクチャディレクターの張文墨氏が「OpenStackの大規模ベアメタル管理のベストプラクティス」と題した素晴らしい講演を行い、UMCloudが数多くのベアメタルプロジェクトの実践からまとめた方法論とソリューションを参加者と共有しました。

[[233088]]

UMCloud アーキテクチャ ディレクター、張文模

OpenStackを使用した統合ベアメタル管理

張文墨氏によると、UMCloudは上海、南京、成都、仏山、北京に5つのデータセンターを設立しており、合計4,000台以上のベアメタルマシンを保有している。 5 つのデータセンターすべてに OpenStack クラスターが存在し、同時に 5 つのクラスターに 800 ~ 2,000 個の異なるノードを追加する必要があります。これらのノードは OpenStack によって均一に管理される必要があります。

複数のテクノロジーを選択した後、UMCloud は最終的にクラスター管理を実装するために Ironic の OpenStack O バージョンを選択しました。 Ironic を選ぶ理由この点について、張文墨氏は、Ironic には、ベアメタル構成情報の自動取得、ベアメタルシステムへの自動インストール/消去機能の提供、OpenStack 仮想マシンの管理のようにベアメタルを管理する機能という 3 つの非常に実用的な機能があると説明しました。 Ironic の利点は、単一のクラスターで 3,000 台を超えるベアメタル マシンをサポートでき、他の OpenStack コンポーネントとリンクすることもできることです。

もちろん、張文墨氏も、小規模なクラスターであれば、Ironic の機能、性能、管理方法はすでにほとんどのニーズを満たしているが、数百台、あるいは数千台を超えるマシンの大規模なベアメタル管理となると、まだいくつかの欠点があることは認めている。

彼は例を挙げて、Ironic にはツリー構造がなく、ベアメタル情報の入力や処理も比較的複雑だと述べました。 2 番目に深刻な問題は、ベアメタル ネットワークを管理できないことです。最も直接的な理由は、実は Ironic にはスイッチを管理および構成する方法がないからです。 3 つ目の欠点は、すべてのベアメタル マシンが大きなプールに配置されるため、大規模な管理上の欠陥が発生することです。たとえば、顧客は 2,000 台のベアメタル マシンを所有しており、トランスコーディング ビジネス ドメインで複数のラックを使用し、外部ラックもいくつか使用したいと考えていますが、現在 Ironic にはこの区別がありません。すべてのベアメタル マシンは大きなプールに含まれており、つまり、すべてのビジネスが混在しています。したがって、大規模なベアメタルマシンを管理するために Ironic を使用するだけでは、まだ不十分です。

Ironic で大規模にベアメタルを管理する際の 5 つの重要なポイント

「そのため、大規模なIronicベアメタル管理を実施する際には、主に5つの点に重点を置きました。」張文墨氏は、大規模ベアメタル情報の自動入力、大規模ベアメタルハードウェア情報の自動収集、大規模ベアメタル情報の自動処理、上位層スイッチネットワークの自動構成、ベアメタルのプーリングであると明らかにした。

これら 5 つの重要なポイントを正式に解釈する前に、Zhang Wenmo はまず次のネットワーク アーキテクチャ図を全員に示しました。

Zhang Wenmo 氏は、このアーキテクチャの唯一の目的はベアメタル サーバー (下の図のベアメタル サーバー (オレンジ色の領域)) にサービスを提供することだ、と説明しました。ベアメタル サーバーの左側にある赤い線は、Ironic Conductor (緑の領域) に重点を置いた基本的な IPM 管理ネットワーク セグメントです。このコンポーネントは主に、起動、シャットダウン、再起動、ハードディスクの起動、その他の構成を含むベアメタル サーバーの電源サイクル管理を完了するために使用されます。ベアメタル サーバーの右側にあるオレンジ色の線は、帯域外 1G Inspect (ベアメタル情報の自動収集) です。ベアメタル サーバーの下にあるバンドルされたラインは、ネットワーク管理スイッチに接続され、次に Zabbix Server ネットワーク管理サーバーに接続されます。実際、このラインはベアメタル デバイスの自動監視として存在します。ベアメタル サーバー上のバンドル ラインには、左側にビジネス ネットワーク セグメント、右側にストレージ ネットワーク セグメントがあります。この図はオリジナルのコンセプトマップであり、UMCloud が後から若干の調整を加えました。

先ほど述べた5つの重要なポイントに戻り、張文墨氏はそれらを一つずつ分析し、解釈しました。

大規模ベアメタル情報の自動入力: ベアメタル情報入力の技術的内容は高くありませんが、時間がかかり、プロジェクト実装における最大の課題です。これには、ハードウェア統合が標準配線、標準構成、標準集計の 3 つの標準を満たす必要があり、特定のルールに従ってスクリプトを通じてデータを自動的に入力する必要があります。

大規模ベアメタルハードウェア情報の自動収集: Ironic Inspector/Conductor を使用してベアメタル情報を自動収集します。まず、Conductor を使用して、IPMI 経由でベアメタルを起動します。次に、ベアメタルは PXE を介して Inspector からメモリ オペレーティング システムを取得します。最後に、オペレーティング システムは組み込みの IPA を通じてベア メタル情報を Inspector に報告します。

大規模な自動ベアメタル情報処理: ベアメタル情報処理プロセスの最初のステップは、接続されていないネットワーク インターフェイスを削除することです。 2 番目のステップは、オペレーティング システムをインストールするためのネットワーク インターフェイスを指定することです。 3 番目のステップは、指定されたビジネス ポートをバインドすることです。上記のタスクを完了するための鍵は、local_link_information にあります。

上位層スイッチ ネットワークの自動構成: 最初の 3 つのポイントは主に効率の最適化であり、ベアメタルの管理時間を大幅に短縮できますが、スイッチ ネットワークを管理することはできません。そこで、UMCloudはまずSDNスイッチを導入し、Huaweiとの協力関係に至りました。両者はベアメタル管理を適応・開発し、下図のようなプロセスを考案しました。これにより、OpenStack は SDN を通じてスイッチを自動制御し、自動管理を実現できるようになりました。

ベアメタル プーリング: これは、ビジネス要件、物理的な場所、その他の基準に基づいて、同じ大きなベアメタル プールを複数の小さなプールに分割することを意味します。これは、まずベアメタル フレーバーの機能パラメータを使用し、次に対応するベアメタル フレーバーのメタデータでそれを一致させることによって行われます。

UMCloud の技術的実践により、現在のベアメタル配信速度は 1 日あたり 300 ベアメタル (10 時間で計算) に達し、サービス切り替え/ビジネス拡張の速度は 20 分ごとに 30 ベアメタルに達することがわかりました。さらに、UMCloud の 20 個のベアメタル リソース プールでは、プール内のベアメタルの自動割り当てとプール間の分離を実現できます。

上記内容は、WOT2018 グローバルソフトウェアおよび運用技術サミットにおける UMCloud アーキテクチャディレクターの張文墨氏の講演を基に 51CTO 記者がまとめたものです。 WOT の詳細については、.com をご覧ください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  【WOT2018】Shi Yang: エッジコンピューティングリファレンスアーキテクチャ2.0の実践と考察

>>:  サーバー仮想化のトレンドとメリットのまとめ、あなたはどれが気になりますか?

推薦する

リベートウェブサイトは本質的に「受動的」であり、トラフィックの売買モデルは持続不可能である。

起業家ラウンドテーブル円卓会議ゲストFanli.com CEO 葛永昌氏Tongcheng.com ...

CitrixのSumit氏へのインタビュー: デスクトップ仮想化が普及しつつある

今日のコンピューティング環境では、IT 部門は以前よりも多くの PC 管理の課題に対処する必要があり...

社内従業員から見たJD.comとYixunのM&A:人々の心は散り散り、6月30日以降の退職を待っている

JD.comとTencentの合併により、Yixunは最も不都合な立場に立たされています。表面上はま...

WeChat危機:WeChatパブリックアカウントはマイナス成長を経験しているようだ

エコノミック・ボイス「ワールド・カンパニー」の報道によると、テンセント・ホールディングスは本日香港市...

静かに変化中? 2023年上半期のクラウド市場における主要イベントのレビュー

時間は矢のように過ぎ去ります。あっという間に2023年の半分が過ぎ、総括する時期が来ました。今年上半...

クリエイティブ: ウェブマスター センター向けの注目のクリエイティブなアイデアを探す

Matt Cutts は SEO と詐欺防止業界で非常に有名です。昨日、Matt Cutts 氏は、...

SEO: SEO理論: 外部リンク構築 (I)

Michael Martinez 氏は、自身のブログで、ウェブサイトの外部リンク構築に関する非常に興...

ninjahawk-Phoenix KVM 50% オフ

NinjaHawk は 1 年以上運営されており、業界では依然として一定の評判を保っています。 Ni...

Buyvm がラスベガスに移転後初のオンライン ストッキングを発売

buyvm はカリフォルニア州ラスベガスに移転した後、ストレージ型 VPS や以前から人気のあった ...

優遇ポリシーと引き換えにクラウド サービス プロバイダーと複数年契約を結ぶのは良い考えでしょうか?

企業のクラウド消費動向に関する調査によると、2022 年はクラウド コンピューティングのコストが驚く...

justhost - ブラックフライデー / 月額 2.25 ドルの Web ホスティング

Justhost は毎年恒例のブラックフライデーのホスティング特別オファーを開始しました。月額わずか...

経験共有:B2Bウェブサイト運用アイデア(ポジショニング)

A5 Webmaster Network に「B2B ウェブサイトの運用アイデア (技術編)」という...

ついにクラウド コンピューティング、ビッグ データ、人工知能をわかりやすく説明してくれる人が現れました。

今日はクラウド コンピューティング、ビッグ データ、人工知能についてお話します。これら 3 つの単語...

Baidu が初の「ソーシャルメディア共有データレポート」を発表

百度が初の「ソーシャルメディア共有データレポート」を発表、ユーザーの1日あたりの平均共有量は60%増...

weloveservers-クリスマス 50% オフ/仮想ホスト/VPS/リセラー

weloveservers は現在順調に発展しており、年末のクリスマスまでにフルサイト仮想ホスティン...