クラウド アーキテクチャに生成 AI を追加するためのヒント

クラウド アーキテクチャに生成 AI を追加するためのヒント

デビッド・リンシカム

企画 | ヤン・ジェン

データの可用性とセキュリティからモデルの選択と監視まで、生成 AI の追加はクラウド アーキテクチャの再考を意味します。 したがって、クラウド アーキテクチャを構築する場合は、生成型 AI 駆動型システムも設計することになります。どのような変更を加える必要がありますか?他に何をする必要がありますか?どのようなベストプラクティスが生まれていますか? 著者は過去 20 年間の経験に基づいて、次のようないくつかの提案をしています。皆さんの参考になれば幸いです。

1. ユースケースを理解する

クラウド アーキテクチャで AI を構築する目的と目標を明確に定義します。私が繰り返し目にする間違いがあるとすれば、それは商用システムにおける生成 AI の影響を理解していないことです。コンテンツ生成、レコメンデーション システム、または別のアプリケーションなど、何を達成しようとしているのかを理解します。これは、内容を書き留め、目標、その達成方法、そして最も重要なこととして、成功をどのように定義するかについて合意することを意味します。これは生成 AI にとって目新しいことではなく、クラウドで構築されるすべての移行と新しいシステムで成功するステップです。

私は、ビジネスユースケースを十分に理解していなかったために、クラウドにおける AI プロジェクト全体が失敗するのを何度も見てきました。会社はクールなものを作りましたが、ビジネスには何の価値も追加しませんでした。これは機能しません。

2. データのソースと品質が重要

AI モデルのトレーニングと推論を生成するために必要なデータ ソースを特定します。データはアクセス可能で、高品質であり、慎重に管理される必要があります。また、クラウド ストレージ ソリューションの可用性と互換性も確保する必要があります。生成 AI システムは高度にデータ中心です。私はこれらをデータ指向システムと呼んでいます。データは、生成 AI システムが結果を生み出すための原動力です。ゴミを入れればゴミが出る。

したがって、データのアクセシビリティをクラウド アーキテクチャの主な推進力として考慮すると役立ちます。関連するデータのほとんどにトレーニング データとしてアクセスする必要がありますが、通常は、単一の物理エンティティに移行するのではなく、既存の場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。

データを AI モデルに取り込む前に、効率的なデータ パイプラインを使用してデータを前処理およびクリーンアップすることを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。これは、生成 AI を使用したクラウド アーキテクチャの成功率約 80% に相当します。しかし、クラウド アーキテクトは AI システムにデータを提供することよりも、AI システムを生成する処理に重点を置いているため、この点は見落とされがちです。データがすべてです。

3. データのセキュリティとプライバシー

データが重要であるのと同様に、そのデータに適用されるセキュリティとプライバシーも重要です。 AI によって生成される処理により、一見無意味なデータが機密情報を明らかにできるデータに変換される可能性があります。

Generative AI が使用する機密データと Generative AI が生成する可能性のある新しいデータを保護するために、強力なデータ セキュリティ対策、暗号化、およびアクセス制御を実装します。少なくとも、関連するデータ プライバシー規制に準拠してください。これは、最後のステップとしてアーキテクチャに何らかのセキュリティ システムをインストールすることを意味するのではなく、すべてのステップでシステムにセキュリティを組み込む必要があることを意味します。

4. スケーラビリティと推論リソース

さまざまなワークロードとデータ処理のニーズに対応できるように、スケーラブルなクラウド リソースを計画します。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私が目にする大きな間違いの 1 つは、拡張性は高いがコストがかかるシステムを構築することです。

スケーラビリティとコスト効率のバランスを取ることが最善ですが、これは実現可能ですが、適切なアーキテクチャと FinOps プラクティスが必要です。また、トレーニングと推論のリソースも確認してください。クラウド カンファレンスでの話題の多くがこの話題を中心に展開されていることにお気づきかと思いますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウド インスタンスを選択します。ここでも、リソースの割り当てを最適化してコスト効率を向上させます。

5. モデルの選択を検討する

特定のユースケースとニーズに基づいて、例示的な生​​成 AI アーキテクチャ (Generic Adversarial Network、Transformer など) から選択します。 AWS SageMaker などのモデルトレーニング用のクラウドサービスを検討し、最適化されたソリューションを見つけます。これは、相互に接続されたモデルが多数存在する可能性があり、これが標準となることを理解することも意味します。

バージョン管理やコンテナ化などの堅牢なモデル展開戦略を実装し、クラウド アーキテクチャ内のアプリケーションやサービスが AI モデルにアクセスできるようにします。

6. 監視とログ記録

AI モデルのパフォーマンス、リソースの使用率、潜在的な問題を追跡するための監視およびログ記録システムの設定はオプションではありません。クラウドで生成された AI を処理するために構築された異常アラート メカニズムと可観測性システムを確立します。

さらに、生成 AI はリソースを大量に消費する可能性があるため、クラウド リソース コストを継続的に監視して最適化します。クラウド コスト管理ツールとプラクティスを使用します。これは、finops がデプロイメントのあらゆる側面を監視し、最小限の運用コスト効率とアーキテクチャが最適かどうかを評価するためのアーキテクチャ効率の両方を監視することを意味します。ほとんどのアーキテクチャでは調整と継続的な改善が必要です。

7. その他の考慮事項

高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画によりシステム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。必要に応じて冗長性を実装します。さらに、クラウド インフラストラクチャ内に構築された AI システムのセキュリティを定期的に監査および評価します。脆弱性に対処し、コンプライアンスを維持します。

特に、ユーザーに影響を与えるコンテンツを生成したり、決定を下したりする場合には、AI の倫理的な使用に関するガイドラインを策定することをお勧めします。したがって、偏見と公平性の問題に対処する必要があります。現在、AI と公平性に関する訴訟が起こっており、正しいことを行っているかどうかを確認する必要があります。 AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを向上させるために、ユーザー エクスペリエンスを継続的に評価します。

生成 AI を使用するかどうかに関係なく、クラウド コンピューティング アーキテクチャの他の側面は同じです。重要なのは、いくつかの事柄の方がはるかに重要であり、より厳密さが求められること、そして常に改善の余地があることを認識することです。

参考リンク: https://www.infoworld.com/article/3706094/adding-generative-ai-systems-may-change-your-cloud-architecture.html

<<:  復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます

>>:  AIと新技術が商業用不動産投資に革命を起こす

ブログ    
ブログ    

推薦する

...

自動運転車インフラの新たなビジョン

自動運転車の台頭により、都市の建設方法や都市環境における交通手段に対する考え方が一変するでしょう。 ...

2ポインタアルゴリズムを学んでLeetCodeをプレイする

[[421659]]みなさんこんにちは。私は梁唐です。今日は、非常に古典的で非常にシンプルなアルゴリ...

...

地球外文明の探査における人工知能技術の応用

近年、人工知能(AI)は急速に発展し、さまざまな分野で画期的な進歩を遂げています。中国の著名な学者、...

大規模言語モデルの最大のボトルネック:レート制限

マット・アセイ企画 | ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:bl...

AI はポイントアンドクリックプログラミングに終止符を打つことができるでしょうか?

マウスクリックプログラミングは、プログラミングの世界では常に新しいトレンドとなっています。簡単に言え...

AlibabaのBladeDISCディープラーニングコンパイラが正式にオープンソース化

ガイドディープラーニングの継続的な発展により、AI モデルの構造は急速に進化しており、基盤となるコン...

人工知能を通じて「自分を知る」

2016年、AlphaGoが人間のチェスプレイヤーであるイ・セドルを破り、人工知能に関する研究と考...

...

Python は 2023 年のプログラミング言語リストで引き続きトップを占めています。 SQLが求人需要リストのトップに

技術の急速な発展により、プログラミング言語は現代社会に欠かせないものになりました。ウェブサイト開発、...

ディープラーニングフレームワークの競争: TNN vs. MNN、NCNNは依然として定番

近年、「オープンソース」は開発者コミュニティにおける新たなトレンドとなっています。特にディープラーニ...

人工知能におけるコンピュータビジョンとは

人工知能(AI)には、「学習意欲を持つインテリジェントエージェント」の開発が伴います。さまざまなアク...

人工知能、遺伝子編集、ノーベル賞の画期的な進歩により、80歳でも40歳に見えるようになる

年齢を重ねるにつれ、老化を遅らせて若さを取り戻すことが多くの人の夢となります。 クレオパトラにしろ、...

機械学習は、モノのインターネットの発展に欠かせない未来となるだろう

近年、機械学習ほどモノのインターネットの急速な成長を牽引したものはほとんどありません。人間の創造性を...