本日、世界初のオープンソース データ オーケストレーション ソフトウェアの開発者である Alluxio は、データ オーケストレーション プラットフォームのバージョン 2.7 の正式リリースを発表しました。このバージョンはすぐにご利用いただけます。バージョン 2.7 では、並列データ読み込み、データ前処理、トレーニング ワークフローにより、機械学習 (ML) トレーニングの I/O 効率が 8 ~ 12 倍向上し、コストを大幅に削減できます。新バージョンでは、パフォーマンス分析が強化され、Apache Hudi や Iceberg などのオープン テーブル形式のサポートも強化されているため、データ レイクへのアクセスの拡張が容易になり、Presto や Spark を使用した分析が高速化されます。 「Alluxio 2.7は、クラウド上の人工知能(AI)、機械学習、ディープラーニングにおけるAlluxioの地位をさらに強固なものにします」と、Alluxioの創設者兼CEOであるHaoyuan Li氏は述べています。 「データセットの増加とCPUおよびGPUの計算能力の向上により、機械学習とディープラーニングがAI技術の主流となりました。これらの技術の台頭はAIの発展を促進しましたが、データやストレージシステムへのアクセスにおけるいくつかの課題も浮き彫りにしました。」 「当社は、ゲーム AI プラットフォームでのモデル トレーニングのデータ前処理を高速化するために、1,000 ノードのクラスターに Alluxio を導入しました。Alluxio は安定性、拡張性、管理の容易さが実証されています」と、テンセントのビッグ データ プラットフォームの研究開発責任者である Chen Peng 氏は述べています。 「ますます多くのビッグデータと AI アプリケーションがコンテナ化されるにつれて、Alluxio はデータ分析とモデルトレーニングを加速する中間層として大企業や機関の第一の選択肢になりつつあります。」 「大規模な分析と AI/ML コンピューティング フレームワークを備えたデータ チームは、安定したパフォーマンスを確保しながら増大するデータ ソースへのアクセス性を高めるというプレッシャーにさらされており、そのためにはデータの局所性、ネットワーク I/O、コストの問題を考慮する必要があります」と ESG のアナリスト、マイク レオーネ氏は述べています。 「企業や組織は、コストのかかるアプリケーションの変更や新たなパフォーマンスの問題への対処を避けながら、クラウド オブジェクト ストレージなどのより手頃でスケーラブルなストレージを導入したいと考えています。Alluxio は、特にハイブリッドおよびマルチクラウド環境において、ストレージの詳細を抽象化し、データをコンピューティングに近づけることで、これらの課題に対処します。」 Alluxio 2.7 では次の機能が追加されました。 Alluxio と NVIDIA の DALI を使用した機械学習トレーニング NVIDIA のデータ ローディング ライブラリ (DALI) は、CPU と GPU を介したデータのロードと前処理をサポートし、ディープラーニングを高速化する人気の Python ライブラリです。バージョン 2.7 では、Alluxio プラットフォームは DALI とともに展開できるように最適化されており、モデルのトレーニングと推論の前のデータの読み込みと前処理の手順を含む Python ベースの ML アプリケーションを高速化します。 I/O 集約型の作業を高速化し、その後の計算集約型のトレーニングを並行して処理できるようにすることで、Alluxio データ プラットフォームでのエンドツーエンドのトレーニングは、従来のソリューションに比べて大幅なパフォーマンスの向上を実現します。大量の小さなファイルのトレーニングの場合、このソリューションは他のソリューションと比較してスケールアウトを実現できます。 大規模データ読み込み Alluxio の中心的な位置付けは、分散データ ソースの統合やキャッシュの実装などのデータ管理機能です。 Alluxio が複数の地理的な場所にまたがるコンピューティングおよびストレージ シナリオでますます使用されるようになるにつれて、Alluxio 自体も拡大しています。このアップデートでは、新しいテクノロジーを使用してデータをバッチ処理し、スケーラビリティを強化します。バッチ処理では、組み込みの実行エンジンを使用してデータの読み込みなどのタスクを処理することで、システム構成の作業負荷が軽減され、管理コントローラのリソース要件が軽減されるため、コストが削減されます。 Kubernetesでの使いやすさ Alluxio は、Kubernetes 用のネイティブ コンテナ ストレージ インターフェイス (CSI) ドライバーと ML 用の Kubernetes オペレーターをサポートするようになり、コンテナ化された環境の Alluxio プラットフォームで ML ワークフローを操作することがこれまで以上に簡単になりました。 Alluxio ボリューム タイプが Kubernetes 環境で利用できるようになりました。この新しいバージョンでは、俊敏性と使いやすさに重点が置かれています。 Prestoの分析に基づいてキャッシュを動的に調整する 新バージョンでは、Shadow Cache と呼ばれる新しいインテリジェント キャッシュ機能も導入されており、キャッシュ サイズが応答速度に与える影響を動的に分析できるため、高性能と低コストのバランスを簡単に実現できます。大規模なマルチテナント Presto 環境では、この新しい機能により、セルフサービス管理を通じて管理オーバーヘッドが大幅に削減されます。 「ストレージと ML 計算が分離されているため、データ プラットフォーム チームは Alluxio を使用してデータの前処理と読み込みフェーズを簡素化できます」と、Alluxio のシニア プロダクト マネージャーである Adit Madan 氏は述べています。 「この簡素化により、Spark ML、Tensorflow、PyTorch などのフレームワークで GPU の使用率を最大化できます。Alluxio ソリューションは、AWS、GCP、Azure Cloud などの複数のクラウド プラットフォームで利用でき、プライベート データ センターまたはパブリック クラウドの Kubernetes でも利用できるようになりました。」 ダウンロード Alluxio 2.7 は、こちらから今すぐダウンロードできます: https://www.alluxio.io/download/ |
>>: ガートナー:世界のクラウド収益は2022年に4,740億ドルに成長する
9月16日午前1時、クック氏は時間通りにスクリーンに登場し、アップルの秋季カンファレンスを開幕した。...
情報公開は、SEO初心者にとってもベテランSEO専門家にとっても、日常的な話題です。しかし、現在オン...
[51CTO.com クイック翻訳] Red Hat Enterprise Linux の最新バージ...
今朝、私に悪いことが起こりました。私が担当していた湖北成利公式サイトの販売サイトがランキング0位にな...
CentOS Linux 8は昨年12月31日にサービスを終了しました。一部のユーザーは CentO...
ウェブサイト飽和の概念とは何ですか? 理解していますか?この言葉を初めて知ったのは、小学校の理科の授...
[[390957]]ハイブリッド クラウドからクラウド ゲームまで、2021 年にクラウド コンピュ...
locvps (~) は現在、15 のデータセンターのすべての VPS を 20% オフにする特別プ...
共同購入戦争が始まって約半年、共同購入業界の構図が徐々に明らかになってきた。第三者共同購入ナビゲーシ...
クラウド コンピューティングの登場により、企業はクラウド コンピューティングを利用してビジネスの革新...
過去2年間、生活のペースが加速し、モバイルインターネットが急速に発展するにつれ、断片的な読書方法とし...
中国国際放送の「ニュースイブニングラッシュアワー」によると、何か必要なことや質問があるとき、私たちが...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeChatビジネスはW...
IaaS+PaaS市場規模は前年同期の31億700万米ドルと比較し、前年同期比49.08%増加し、急...
歴史の車輪は前へ前へと回転する。歴史がインターネット時代に星のように輝くインターネットの有名人を記録...