クラウド アーキテクチャに生成 AI を追加するためのヒント

クラウド アーキテクチャに生成 AI を追加するためのヒント

デビッド・リンシカム

企画 | ヤン・ジェン

データの可用性とセキュリティからモデルの選択と監視まで、生成 AI の追加はクラウド アーキテクチャの再考を意味します。 したがって、クラウド アーキテクチャを構築する場合は、生成型 AI 駆動型システムも設計することになります。どのような変更を加える必要がありますか?他に何をする必要がありますか?どのようなベストプラクティスが生まれていますか? 著者は過去 20 年間の経験に基づいて、次のようないくつかの提案をしています。皆さんの参考になれば幸いです。

1. ユースケースを理解する

クラウド アーキテクチャで AI を構築する目的と目標を明確に定義します。私が繰り返し目にする間違いがあるとすれば、それは商用システムにおける生成 AI の影響を理解していないことです。コンテンツ生成、レコメンデーション システム、または別のアプリケーションなど、何を達成しようとしているのかを理解します。これは、内容を書き留め、目標、その達成方法、そして最も重要なこととして、成功をどのように定義するかについて合意することを意味します。これは生成 AI にとって目新しいことではなく、クラウドで構築されるすべての移行と新しいシステムで成功するステップです。

私は、ビジネスユースケースを十分に理解していなかったために、クラウドにおける AI プロジェクト全体が失敗するのを何度も見てきました。会社はクールなものを作りましたが、ビジネスには何の価値も追加しませんでした。これは機能しません。

2. データのソースと品質が重要

AI モデルのトレーニングと推論を生成するために必要なデータ ソースを特定します。データはアクセス可能で、高品質であり、慎重に管理される必要があります。また、クラウド ストレージ ソリューションの可用性と互換性も確保する必要があります。生成 AI システムは高度にデータ中心です。私はこれらをデータ指向システムと呼んでいます。データは、生成 AI システムが結果を生み出すための原動力です。ゴミを入れればゴミが出る。

したがって、データのアクセシビリティをクラウド アーキテクチャの主な推進力として考慮すると役立ちます。関連するデータのほとんどにトレーニング データとしてアクセスする必要がありますが、通常は、単一の物理エンティティに移行するのではなく、既存の場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。

データを AI モデルに取り込む前に、効率的なデータ パイプラインを使用してデータを前処理およびクリーンアップすることを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。これは、生成 AI を使用したクラウド アーキテクチャの成功率約 80% に相当します。しかし、クラウド アーキテクトは AI システムにデータを提供することよりも、AI システムを生成する処理に重点を置いているため、この点は見落とされがちです。データがすべてです。

3. データのセキュリティとプライバシー

データが重要であるのと同様に、そのデータに適用されるセキュリティとプライバシーも重要です。 AI によって生成される処理により、一見無意味なデータが機密情報を明らかにできるデータに変換される可能性があります。

Generative AI が使用する機密データと Generative AI が生成する可能性のある新しいデータを保護するために、強力なデータ セキュリティ対策、暗号化、およびアクセス制御を実装します。少なくとも、関連するデータ プライバシー規制に準拠してください。これは、最後のステップとしてアーキテクチャに何らかのセキュリティ システムをインストールすることを意味するのではなく、すべてのステップでシステムにセキュリティを組み込む必要があることを意味します。

4. スケーラビリティと推論リソース

さまざまなワークロードとデータ処理のニーズに対応できるように、スケーラブルなクラウド リソースを計画します。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私が目にする大きな間違いの 1 つは、拡張性は高いがコストがかかるシステムを構築することです。

スケーラビリティとコスト効率のバランスを取ることが最善ですが、これは実現可能ですが、適切なアーキテクチャと FinOps プラクティスが必要です。また、トレーニングと推論のリソースも確認してください。クラウド カンファレンスでの話題の多くがこの話題を中心に展開されていることにお気づきかと思いますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウド インスタンスを選択します。ここでも、リソースの割り当てを最適化してコスト効率を向上させます。

5. モデルの選択を検討する

特定のユースケースとニーズに基づいて、例示的な生​​成 AI アーキテクチャ (Generic Adversarial Network、Transformer など) から選択します。 AWS SageMaker などのモデルトレーニング用のクラウドサービスを検討し、最適化されたソリューションを見つけます。これは、相互に接続されたモデルが多数存在する可能性があり、これが標準となることを理解することも意味します。

バージョン管理やコンテナ化などの堅牢なモデル展開戦略を実装し、クラウド アーキテクチャ内のアプリケーションやサービスが AI モデルにアクセスできるようにします。

6. 監視とログ記録

AI モデルのパフォーマンス、リソースの使用率、潜在的な問題を追跡するための監視およびログ記録システムの設定はオプションではありません。クラウドで生成された AI を処理するために構築された異常アラート メカニズムと可観測性システムを確立します。

さらに、生成 AI はリソースを大量に消費する可能性があるため、クラウド リソース コストを継続的に監視して最適化します。クラウド コスト管理ツールとプラクティスを使用します。これは、finops がデプロイメントのあらゆる側面を監視し、最小限の運用コスト効率とアーキテクチャが最適かどうかを評価するためのアーキテクチャ効率の両方を監視することを意味します。ほとんどのアーキテクチャでは調整と継続的な改善が必要です。

7. その他の考慮事項

高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画によりシステム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。必要に応じて冗長性を実装します。さらに、クラウド インフラストラクチャ内に構築された AI システムのセキュリティを定期的に監査および評価します。脆弱性に対処し、コンプライアンスを維持します。

特に、ユーザーに影響を与えるコンテンツを生成したり、決定を下したりする場合には、AI の倫理的な使用に関するガイドラインを策定することをお勧めします。したがって、偏見と公平性の問題に対処する必要があります。現在、AI と公平性に関する訴訟が起こっており、正しいことを行っているかどうかを確認する必要があります。 AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを向上させるために、ユーザー エクスペリエンスを継続的に評価します。

生成 AI を使用するかどうかに関係なく、クラウド コンピューティング アーキテクチャの他の側面は同じです。重要なのは、いくつかの事柄の方がはるかに重要であり、より厳密さが求められること、そして常に改善の余地があることを認識することです。

参考リンク: https://www.infoworld.com/article/3706094/adding-generative-ai-systems-may-change-your-cloud-architecture.html

<<:  復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます

>>:  AIと新技術が商業用不動産投資に革命を起こす

ブログ    
ブログ    
ブログ    

推薦する

AI技術の7つの主要トレンド

[[323768]]トレンド1: 自律型デバイス自動車、ロボット、農業など、自律型デバイスは従来人間...

Alibaba のエンジニアは、ナレッジ グラフ データ構築の「難題」にどのように取り組んでいるのでしょうか?

[[233069]]アリ姉の紹介:「トマト」を検索すると、その栄養価やカロリーがわかるだけでなく、...

認知マップの科学的インベントリ: グローバルな第3世代AIの「大きな」機会

近年、人工知能 (AI) は、ディープラーニング、コンピューター ビジョン、自然言語処理などの技術革...

人工知能技術は子供たちにどのような影響を与えるのでしょうか?

人工知能技術は、おもちゃ、オンライン アプリケーション、ビデオ ゲームに組み込まれています。AI ア...

パフォーマンスを犠牲にすることなく、メモリ使用量を90%削減。FacebookがQuant-Noiseモデル圧縮方式を提案

数百メガバイトのサイズのニューラル ネットワークの場合、モデル圧縮によりメモリ使用量、通信帯域幅、計...

...

ディープラーニングのこれらの概念をすべて理解できましたか? TF、TLT、TRT、DS

最近、NVIDIA GPU 製品や SDK を使用してディープラーニングを学習している学生に多く出会...

...

...

[ディープラーニングシリーズ] PaddlePaddleとTensorflowによる画像分類

先月は、ディープラーニングにおける「Hello World」であるMNIST画像認識を中心に、畳み込...

...

スタンフォード大学の64歳の学長が辞任!学術不正スキャンダルが勃発、95ページの調査報告書が公表

今日、衝撃的なニュースが突然飛び込んできました。スタンフォード大学のマーク・テシエ・ラヴィーンの学長...

大学における人工知能への熱意を「クール」に振り返る

大学は関連専攻を開設する際に、教授委員会と学術委員会を組織し、国の人材政策、業界の人材需要、国内外の...

人工知能技術の出発点と終着点

1. 人工知能技術の定義人工知能技術は、複雑な生産労働において機械が人間に取って代わることを可能にす...