コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

[[414746]]

企業はコンテナ内で人工知能や機械学習のワークロードを実行する準備ができているでしょうか? 専門家によると、導入する前にいくつか基本的な質問をする必要があるそうです。

人工知能/機械学習とコンテナは、今日の 2 つの主要な IT トレンドであり、多くの企業にとって大きな話題となっています。企業が AI と機械学習のワークロードをより適切に管理する方法を模索する中で、商用テクノロジーとオープンソース テクノロジーの増加により、それらの連携がますます進んでいます。

「IT リーダーにとって朗報なのは、コンテナ内で大規模な機械学習を実行するためのツールとプロセスがここ数年で劇的に改善されたことです」と ISG のエンタープライズ テクノロジー アナリスト、ブレア ハンリー フランク氏は述べています。「現在、データ サイエンティストや IT チームがこれらのシステムを使い始めるのに役立つオープン ソース ツール、商用製品、チュートリアルが数多くあります。」

コンテナ内での AI/ML ワークロードの実行: 6 つの重要な事実

IT リーダーとそのチームが AI/ML ワークロードのコンテナ化の基本的な技術的側面を詳しく調べ始める前に、考慮すべき原則がいくつかあります。考慮すべき 6 つの重要なポイントは次のとおりです。

1. AI/MLワークロードはワークフローを表す

Red Hat の CTO である Gordon Haff 氏は、他の多くのワークロード タイプと同様に、AI/ML ワークロードはワークフローとして説明できると述べています。ワークフローの観点から考えると、コンテナ内で AI/ML を実行することに関する基本的な概念が明確になります。

AI/ML では、ワークフローはデータの収集と準備から始める必要があります。 「データの収集、クリーニング、処理が完了したら、モデルをトレーニングし、トレーニング データに基づいてパラメータを調整します」とハフ氏は言います。「モデルのトレーニングが完了したら、ワークフローの次のステップは、それを本番環境にデプロイすることです。最後に、データ サイエンティストは、予測とパフォーマンス メトリックを追跡しながら、本番環境でのモデルのパフォーマンスを監視する必要があります。」

Haff 氏は、人、プロセス、環境の面で関与する可能性のある作業量を過小評価することなく、このワークフローについて説明します。コンテナ化により、一貫性と再現性が向上し、この作業が簡素化されます。

「従来、このワークフローでは、異なる環境を使用する異なる人々への 2 回または 3 回のハンドオフが必要になる場合があります」と Haff 氏は言います。「ただし、コンテナ プラットフォームに基づくワークフローではセルフサービスが可能になり、データ サイエンティストがモデルの開発とアプリケーションへの統合の責任を負うことが増えています。」

2. 他のコンテナ化されたワークロードと同様の利点

Autify の AI および ML 責任者である Nauman Mustafa 氏は、AI/ML ワークフローのコンテキストにおいてコンテナ化には次の 3 つの利点があると考えています。

  • モジュール性: モデルのトレーニングやデプロイメントなど、ワークフローの重要な部分のモジュール化を可能にします。これは、コンテナ化によって、より広範なソフトウェア開発の世界で、よりモジュール化されたアーキテクチャ、つまりマイクロサービスが可能になった方法に似ています。
  • スピード: コンテナ化により、開発/展開およびリリース サイクルが高速化されます。
  • 人材管理: コンテナ化により、チーム間の依存関係が軽減され、チームの管理も容易になります。 IT の他の分野と同様に、コンテナ化は、作業が 1 つの機能グループから別の機能グループに移るときに、「引き継いで忘れる」可能性を減らすのに役立ちます。

機械学習モデルには他のアプリケーションやサービスとは異なる技術要件や考慮事項があるかもしれませんが、コンテナ化の潜在的な利点は非常に似ています。

Red Hat のデータ サイエンティストである Audrey Reznik 氏は、AI/機械学習のワークロードまたはソリューション (ハイブリッド クラウドなど) の移植性と拡張性の向上を例として挙げました。 「コンテナはベアメタルや VM システムよりもシステム リソースの使用量が少ないため、導入のスピードアップに役立ちます」と Reznik 氏は言います。「私は『コーディングの速さが勝負』という言葉をよく使います。コーディングが終われば、コンテナを使ってソリューションを導入できるからです。」

3. チームの連携が必要

ワークフローをよりモジュール化したからといって、チームメンバー全員が協力して作業する必要がなくなるわけではありません。

「コンテナ化された環境で機械学習ワークロードの構築と運用に携わるチームメンバーが協力して作業していることを確認してください」と ISG の Frank 氏は言います。「たとえば、運用エンジニアは Kubernetes の実行には慣れているかもしれませんが、データ サイエンス ワークロードの具体的なニーズを理解していない可能性があります。一方、データ サイエンティストは機械学習モデルの構築と展開のプロセスには慣れていますが、それらをコンテナに移行したり、実行を継続したりするのに支援が必要になる場合があります。」

コンテナ化により一貫性とコラボレーションが向上しますが、このメリットを当然のことと思わないでください。

「結果の再現性が極めて重要な世界では、企業はコンテナを使用して AI/ML テクノロジへのアクセスを民主化し、データ サイエンティストが最新の IT および情報セキュリティ標準に準拠しながら実験を簡単に共有および複製できるようにすることができます」と、Red Hat のソフトウェア エンジニアリング担当グローバル ディレクターの Sherard Griffin 氏は述べています。

4. 焦点は実際には変わっていない

コンテナ化の利点の多くは AI/ML でも他のワークロード タイプとほぼ同じですが、運用上の重点領域も同様です。他のコンテナ化されたアプリケーションと同様に、注意すべき運用要件の例を 3 つ示します。

  • リソースの割り当て: ムスタファ氏は、長期にわたってコストとパフォーマンスを最適化するには、適切なリソースの割り当てが依然として重要であると指摘しました。リソースを過剰に割り当てると、時間の経過とともにお金が無駄になり、リソースの割り当てが不足すると、パフォーマンスの問題が発生します。
  • 可観測性: 問題が見えないからといって、それが存在しないということではありません。 「マルチコンテナ アプリケーションの動作を理解するには、必要な可観測性ソフトウェアを導入しておく必要があります」とフランク氏は言います。
  • セキュリティ: 「セキュリティの観点から見ると、AI/ML ソリューションの起動は、コンテナ内の他のソリューションの起動と何ら変わりありません」と、Positive Technologies の機械学習エンジニアである Alexandra Murzina 氏は述べています。つまり、最小権限の原則 (ユーザーとコンテナ自体の両方に) を適用する、信頼できる検証済みのコンテナ イメージのみを使用する、ランタイム脆弱性スキャン、その他のセキュリティ レイヤーなどの戦略が、常に最優先事項である必要があるということです。

5. コンテナはすべての潜在的な問題を解決するわけではない

自動化では欠陥のあるプロセスは改善されないのと同様に (欠陥のあるプロセスをより速く、より頻繁に実行することに役立つだけです)、コンテナ化では AI/ML ワークロードの根本的な問題は解決されません。

たとえば、機械学習モデルにバイアスが組み込まれている場合、そのモデルをコンテナで実行しても、この潜在的に深刻な問題の解決には役立ちません。

コンテナ化には大きな利点があります。これらの利点に惑わされて、コンテナ化がすべての問題の解決策であると考えるべきではありません。これは単にデータの誤りや偏見の問題ではありません。コンテナはワークフローのさまざまな側面を高速化できますが、実際にすべての作業を実行するわけではありません。

キャップジェミニのエンジニアリングおよびテクノロジー担当ディレクター、ラグー・キショア・ヴェンパティ氏は次のように述べています。 「コンテナは、AI/ML ワークロードを実行するのに非常に有益です。しかし、AI/ML ワークロードを単にコンテナ化しても、モデルの効率は上がりません。モデルのトレーニングと推論に関連する生産性を向上させる方法を提供するだけです。」

6. 構築と購入を賢く選択する

ほとんどのテクノロジーの選択と同様に、「すべきか、すべきでないか」という疑問がありますが、これは AI/ML ワークロードのコンテナ化に関する決定を下す場合にも当てはまります。ほとんどの重要なテクノロジーの選択と同様に、選択にはコストがかかります。

「機械学習ワークフローのコンテナ化には、小規模チームにとっては負担が大きすぎるコストがかかる可能性がありますが、大規模チームにとってはメリットがコストを上回ります」と、Autifly の Mustafa 氏は述べています。

IT リーダーとそのチームは、明確な目的や理由を持って、単にできるからという理由でこれを行う必要があります。

「すでに複雑な状況をさらに複雑にしないでください」と ISG のフランク氏は言います。「コンテナ化された機械学習ワークロードが、知的活動を超えたビジネス価値を提供することを確認してください。」

商用またはオープンソースのルートを選択する場合は、AI/ML を取り巻くエコシステムが急速に進化しており、独自の戦略も変化する可能性があるため、将来の柔軟性を確保する必要があります。

「企業はビジネスを 1 つのベンダーに頼るべきではありません」と Reznik 氏はアドバイスします。「ベンダーが提供するソリューションだけでなく、さまざまなオープン ソース ソリューションを使用する必要があります。さまざまなオープン ソース ソリューションは、企業のチームにさらなるイノベーションの可能性をもたらします。」

<<:  IEEE | わずか1秒でドローンは地上で宙返りできる

>>:  AI はコードの内容に基づいて関数名を自動的に生成するため、標準的な方法で名前を付けない同僚について心配する必要がなくなります。

ブログ    
ブログ    
ブログ    

推薦する

...

AIチップとは何ですか?人々が知っておくべきことすべて

[51CTO.com クイック翻訳] 業界の専門家は、音声アシスタント、顔認識カメラ、コンピューター...

人工ニューラルネットワークは、体型を崩すことなく、一瞬で老けたり若返ったりすることができる

ディープラーニングマシンは、人が年をとった後の顔がどのようになるかを示すことができますが、多くの場合...

世界錬金術時代が始まった? MIT、住宅や道路を無制限のバッテリーに変える「カーボンセメント」スーパーキャパシタを開発

おそらく今回、私たちは本当に人類の歴史における特異点に立っているのかもしれない。最近、MIT のカー...

...

単一の画像ガイド、主題を保持し、スタイルを変更する、VCTはそれを簡単に実現するのに役立ちます

近年、画像生成技術は多くの重要な進歩を遂げました。特に、DALLE2やStable Diffusio...

Excelが変わりました! MicrosoftはPythonを搭載しているので、機械学習を直接行うことができます。

素晴らしいニュースです! Microsoft が Excel に Python を導入しました。 E...

AIがプライバシーを尊重しながら優れた顧客体験を生み出す方法

ゼブラテクノロジーズグレーターチャイナのテクニカルディレクター、チェン・ニン氏近年の人工知能(AI)...

...

...

...

ロボット開発者イノベーションデー | Horizo​​n RDK と NodeHub の新製品

7月25日、「Horizo​​n 2023 Robotics Developer Innovatio...

同義千文の720億パラメータモデルがオープンソース化、初の「フルサイズ・フルモード」オープンソース化を実現

12月1日、アリババクラウド同義千文の720億パラメータモデルQwen-72Bがオープンソース化され...

AIoT: 次世代コンバージェンスの利点と用途を理解する

人工知能 (AI) とモノのインターネット (IoT) は、過去 10 年間を定義してきました。ビッ...