生成AIシステムの導入により、企業のクラウドアーキテクチャが変化する可能性がある

生成AIシステムの導入により、企業のクラウドアーキテクチャが変化する可能性がある

データの可用性とセキュリティから大規模な言語モデルとその選択と監視まで、企業による生成 AI の導入は、クラウド アーキテクチャの再考を意味します。

そのため、多くの企業がクラウド アーキテクチャを再構築しながら、生成 AI システムも開発しています。では、これらの企業はどのような変化を起こす必要があるのでしょうか?新たなベストプラクティスは何ですか?業界の専門家は、過去20年間、特に過去2年間に、企業がこうしたプラットフォームを構築するのを支援してきたと語った。以下は企業に対する彼の提案の一部です。

ユースケースを理解する

企業は、クラウド アーキテクチャにおける生成 AI の目的と目標を明確に定義する必要があります。間違いが何度も発生しているのに気付いた場合、それはビジネス システムで人工知能を生成することの影響を理解していないためです。企業は、コンテンツ生成、レコメンデーション システム、またはその他のアプリケーションなど、自社の目標が何であるかを理解する必要があります。

つまり、上級管理職は、どのような目標を設定するか、それをどのように達成するか、そして最も重要なことに、成功をどのように定義するかについて合意する必要があるということです。これは生成 AI に特有のものではありません。これは、クラウドで構築されるすべての移行と新しいシステムの成功への一歩です。

多くの企業は、ビジネスユースケースを十分に理解していないため、クラウドで開発された生成 AI プロジェクトで失敗します。会社が開発した製品は素晴らしかったが、ビジネスには何の価値も追加しなかった。そうすると、このアプローチは機能しなくなります。

データのソースと品質が鍵

生成 AI モデルのトレーニングと推論を特定するには、アクセス可能で、高品質で、慎重に管理される効果的なデータ ソースが必要です。企業はクラウド ストレージ ソリューションの可用性と互換性も確保する必要があります。

生成 AI システムは高度にデータ中心であり、データ駆動型システムと呼ぶことができます。データは、生成 AI システムが結果を生み出すための原動力です。しかし、データの品質は依然として「ゴミを入れればゴミが出てくる」状態です。

したがって、データのアクセシビリティをクラウド アーキテクチャの主な推進力として考慮すると役立ちます。企業は、トレーニング データとして最も関連性の高いデータにアクセスする必要があり、通常は、データを単一の物理エンティティに移行するのではなく、存在する場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。データを AI モデルに送る前に前処理してクリーンアップする効率的なデータ パイプラインを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。

生成 AI を使用したクラウド アーキテクチャの 80% が成功しました。しかし、クラウド アーキテクトは、生成 AI システムに高品質のデータを提供することよりも、生成 AI システムの処理に重点を置いているため、これは最も見落とされがちな要素です。実際には、データがすべてです。

データ保護とプライバシー

データが重要であるのと同様に、そのセキュリティとプライバシーも重要です。生成 AI 処理により、一見無意味なデータを機密情報を明らかにできるデータに変換できます。

企業は、Generative AI が使用する機密データと Generative AI が生成する可能性のある新しいデータを保護するために、強力なデータ セキュリティ対策、暗号化、およびアクセス制御を実装する必要があります。企業は関連するデータプライバシー規制を遵守する必要があります。これは、最後の手段として企業のアーキテクチャに何らかのセキュリティ システムをインストールすることを意味するのではなく、あらゆる段階でシステムにセキュリティを適用する必要があることを意味します。

スケーラビリティと推論リソース

企業は、さまざまなワークロードとデータ処理のニーズに対応するために、スケーラブルなクラウド リソースを計画する必要があります。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私たちが目にするより深刻な間違いは、拡張性は高いが非常に高価なシステムを構築することです。スケーラビリティとコストのバランスを取ることが最善ですが、これは実現可能ですが、適切なアーキテクチャとクラウド コストの最適化プラクティスが必要です。

さらに、企業は推論リソースを検討する必要があります。クラウド コンピューティング業界のカンファレンスでは、多くのニュースがこの話題を中心に展開されていることが注目されていますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウド インスタンスを選択します。そして、コスト効率を実現するためにリソースの割り当てを最適化します。

モデル選択を検討する

組織の特定のユースケースとニーズに基づいて、生成 AI アーキテクチャの例 (一般的な敵対的ネットワーク、トランスフォーマーなど) から選択します。モデルのトレーニングにクラウド サービス (AWS SageMaker など) を使用することを検討し、最適化されたソリューションを見つけます。また、企業には多くの接続モデルが存在する可能性があり、これが標準となることを理解することも意味します。

企業は、AI モデルを企業のクラウド アーキテクチャ内のアプリケーションやサービスにアクセスできるようにするために、バージョン管理やコンテナ化を含む堅牢なモデル展開戦略を実装する必要があります。

監視とログ記録

AI モデルのパフォーマンス、リソース使用率、潜在的な問題を追跡するための監視およびログ記録システムを設定することは選択肢ではありません。クラウドで生成された AI を処理するための異常アラート メカニズムと可観測性システムを構築します。

さらに、生成 AI はリソースを大量に消費する可能性があるため、クラウド リソース コストを継続的に監視して最適化します。クラウド コスト管理ツールとプラクティスを使用するということは、クラウド コスト最適化によって展開のあらゆる側面を監視できるようになり、運用コストが最小限に抑えられ、アーキテクチャの効率が向上することを意味します。ほとんどのアーキテクチャでは、チューニングと継続的な改善が必要です。

その他の考慮事項

高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画によりシステム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。必要に応じて冗長性を実装します。さらに、クラウド インフラストラクチャ内の生成 AI システムのセキュリティを定期的に監査および評価します。脆弱性に対処し、コンプライアンスを維持します。

特に生成 AI システムがコンテンツを生成したり、ユーザーに影響を与える決定を下したりする場合には、AI の倫理的使用に関するガイドラインを確立することをお勧めします。さらに、偏見と公平性の問題にも対処する必要があります。現在、AIと公平性に関する訴訟が起こっており、企業は正しい対応をしているかどうかを確認する必要があります。企業は、AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを高めるように、ユーザー エクスペリエンスを継続的に評価する必要があります。

企業が生成 AI システムを使用するかどうかに関係なく、クラウド アーキテクチャの他の側面はほぼ同じです。重要なのは、はるかに重要なことがあることを認識し、クラウド アーキテクチャを常に改善することです。

<<:  完全に無料の K8S 学習プラットフォーム: オンライン クラスター環境がクラウド ネイティブの旅をサポートします。

>>:  Google Cloud Next '24: クラウド サービスが舞台を整え、AI が主役に

推薦する

ウェブサイトは完全にブロックされ、1か月後にようやく回復しました。原因と解決策について簡単に説明します。

2012年8月2日、これは忘れられない日です。朝8時に起きて、いつものように携帯電話でUCを開き、ウ...

Baidu百科事典のnofollow追加を無視する

百度百科事典は、拡張読書外部リンクを削除し、参考資料にnofollow属性を追加しました。さまざまな...

hostkey-ロシア/著作権フリーサーバー/著作権フリーVPS/オフショアホスト

オランダの会社である hostkey.com は、2007 年に設立されました。主な事業は、サーバー...

APPプロモーションの効果を高めるトップ10のチャネルをご紹介します。

APPプロモーションを担当する学生の多くは、iOSでトラフィックを購入する方法について混乱すると思い...

AskDataのYan Peng氏:AI予測を最後まで実行する

[51CTO.com からのオリジナル記事] 周知のとおり、サプライチェーンの効率性は小売業界の中核...

キーワードの主な用途: アンカーテキスト

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますキーワード...

分散ロックの複数の実装

現在、ほぼすべての大規模な Web サイトとアプリケーションは分散形式で展開されています。分散シナリ...

エッジコンピューティングと5G: 低遅延、高速接続を実現

デジタル時代の継続的な進化に伴い、特にモノのインターネット、仮想現実、スマートファクトリーなど、高速...

クラウドネイティブセキュリティを構築するための6つの重要な機能

クラウド コンピューティングは、その固有のスケーラビリティ、柔軟性、および高性能コンピューティング機...

「推奨:Baiduをホームページに設定する」検索して見つかりましたか?

もともと、Baidu の提案のようなものを探していたのですが、検索しているときに突然、ページ上に余分...

Huawei Honor 9iの発売日と構成が明らかに、6月6日の記者会見で発表される予定

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますA5 St...

クラウドコンピューティングは事業者に「第二の金の壺」をもたらすかもしれない

最近、大手3社の2019年度決算報告書が相次いで発表されている。飽和した伝統的ビジネス市場と消滅しつ...

Ping An Host - 国慶節プロモーション/C3 データセンター/CN2 ライン VPS 年間支払いが 35% オフ

Ping An Host は 1 年間運営されています。ロサンゼルスの Zenlayer コンピュー...

海外プロモーションに必須、世界の広告チャネル最新ランキング!

AppsFlyerは9月24日、2019年上半期のベストモバイルメディアチャネルのランキングを掲載し...