コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

[[414746]]

企業はコンテナ内で人工知能や機械学習のワークロードを実行する準備ができているでしょうか? 専門家によると、導入する前にいくつか基本的な質問をする必要があるそうです。

人工知能/機械学習とコンテナは、今日の 2 つの主要な IT トレンドであり、多くの企業にとって大きな話題となっています。企業が AI と機械学習のワークロードをより適切に管理する方法を模索する中で、商用テクノロジーとオープンソーステクノロジーの増加により、それらの連携がますます進んでいます。

「IT リーダーにとって朗報なのは、コンテナ内で大規模な機械学習を実行するためのツールとプロセスがここ数年で劇的に改善されたことです」と ISG のエンタープライズテクノロジーアナリスト、ブレアハンリーフランク氏は述べています。「現在、データサイエンティストや IT チームがこれらのシステムを使い始めるのに役立つオープンソースツール、商用製品、チュートリアルが数多くあります。」

コンテナ内での AI/ML ワークロードの実行: 6 つの重要な事実

IT リーダーとそのチームが AI/ML ワークロードのコンテナ化の基本的な技術的側面を詳しく調べ始める前に、考慮すべき原則がいくつかあります。考慮すべき 6 つの重要なポイントは次のとおりです。

1. AI/MLワークロードはワークフローを表す

Red Hat の CTO である Gordon Haff 氏は、他の多くのワークロードタイプと同様に、AI/ML ワークロードはワークフローとして説明できると述べています。ワークフローの観点から考えると、コンテナ内で AI/ML を実行することに関する基本的な概念が明確になります。

AI/ML では、ワークフローはデータの収集と準備から始める必要があります。「データの収集、クリーニング、処理が完了したら、モデルをトレーニングし、トレーニングデータに基づいてパラメータを調整します」とハフ氏は言います。「モデルのトレーニングが完了したら、ワークフローの次のステップは、それを本番環境にデプロイすることです。最後に、データサイエンティストは、予測とパフォーマンスメトリックを追跡しながら、本番環境でのモデルのパフォーマンスを監視する必要があります。」

Haff 氏は、人、プロセス、環境の面で関与する可能性のある作業量を過小評価することなく、このワークフローについて説明します。コンテナ化により、一貫性と再現性が向上し、この作業が簡素化されます。

「従来、このワークフローでは、異なる環境を使用する異なる人々への 2 回または 3 回のハンドオフが必要になる場合があります」と Haff 氏は言います。「ただし、コンテナプラットフォームに基づくワークフローではセルフサービスが可能になり、データサイエンティストがモデルの開発とアプリケーションへの統合の責任を負うことが増えています。」

2. 他のコンテナ化されたワークロードと同様の利点

Autify の AI および ML 責任者である Nauman Mustafa 氏は、AI/ML ワークフローのコンテキストにおいてコンテナ化には次の 3 つの利点があると考えています。

モジュール性: モデルのトレーニングやデプロイメントなど、ワークフローの重要な部分のモジュール化を可能にします。これは、コンテナ化によって、より広範なソフトウェア開発の世界で、よりモジュール化されたアーキテクチャ、つまりマイクロサービスが可能になった方法に似ています。
スピード: コンテナ化により、開発/展開およびリリースサイクルが高速化されます。
人材管理: コンテナ化により、チーム間の依存関係が軽減され、チームの管理も容易になります。 IT の他の分野と同様に、コンテナ化は、作業が 1 つの機能グループから別の機能グループに移るときに、「引き継いで忘れる」可能性を減らすのに役立ちます。

機械学習モデルには他のアプリケーションやサービスとは異なる技術要件や考慮事項があるかもしれませんが、コンテナ化の潜在的な利点は非常に似ています。

Red Hat のデータサイエンティストである Audrey Reznik 氏は、AI/機械学習のワークロードまたはソリューション (ハイブリッドクラウドなど) の移植性と拡張性の向上を例として挙げました。「コンテナはベアメタルや VM システムよりもシステムリソースの使用量が少ないため、導入のスピードアップに役立ちます」と Reznik 氏は言います。「私は『コーディングの速さが勝負』という言葉をよく使います。コーディングが終われば、コンテナを使ってソリューションを導入できるからです。」

3. チームの連携が必要

ワークフローをよりモジュール化したからといって、チームメンバー全員が協力して作業する必要がなくなるわけではありません。

「コンテナ化された環境で機械学習ワークロードの構築と運用に携わるチームメンバーが協力して作業していることを確認してください」と ISG の Frank 氏は言います。「たとえば、運用エンジニアは Kubernetes の実行には慣れているかもしれませんが、データサイエンスワークロードの具体的なニーズを理解していない可能性があります。一方、データサイエンティストは機械学習モデルの構築と展開のプロセスには慣れていますが、それらをコンテナに移行したり、実行を継続したりするのに支援が必要になる場合があります。」

コンテナ化により一貫性とコラボレーションが向上しますが、このメリットを当然のことと思わないでください。

「結果の再現性が極めて重要な世界では、企業はコンテナを使用して AI/ML テクノロジへのアクセスを民主化し、データサイエンティストが最新の IT および情報セキュリティ標準に準拠しながら実験を簡単に共有および複製できるようにすることができます」と、Red Hat のソフトウェアエンジニアリング担当グローバルディレクターの Sherard Griffin 氏は述べています。

4. 焦点は実際には変わっていない

コンテナ化の利点の多くは AI/ML でも他のワークロードタイプとほぼ同じですが、運用上の重点領域も同様です。他のコンテナ化されたアプリケーションと同様に、注意すべき運用要件の例を 3 つ示します。

リソースの割り当て: ムスタファ氏は、長期にわたってコストとパフォーマンスを最適化するには、適切なリソースの割り当てが依然として重要であると指摘しました。リソースを過剰に割り当てると、時間の経過とともにお金が無駄になり、リソースの割り当てが不足すると、パフォーマンスの問題が発生します。
可観測性: 問題が見えないからといって、それが存在しないということではありません。「マルチコンテナアプリケーションの動作を理解するには、必要な可観測性ソフトウェアを導入しておく必要があります」とフランク氏は言います。
セキュリティ: 「セキュリティの観点から見ると、AI/ML ソリューションの起動は、コンテナ内の他のソリューションの起動と何ら変わりありません」と、Positive Technologies の機械学習エンジニアである Alexandra Murzina 氏は述べています。つまり、最小権限の原則 (ユーザーとコンテナ自体の両方に) を適用する、信頼できる検証済みのコンテナイメージのみを使用する、ランタイム脆弱性スキャン、その他のセキュリティレイヤーなどの戦略が、常に最優先事項である必要があるということです。

5. コンテナはすべての潜在的な問題を解決するわけではない

自動化では欠陥のあるプロセスは改善されないのと同様に (欠陥のあるプロセスをより速く、より頻繁に実行することに役立つだけです)、コンテナ化では AI/ML ワークロードの根本的な問題は解決されません。

たとえば、機械学習モデルにバイアスが組み込まれている場合、そのモデルをコンテナで実行しても、この潜在的に深刻な問題の解決には役立ちません。

コンテナ化には大きな利点があります。これらの利点に惑わされて、コンテナ化がすべての問題の解決策であると考えるべきではありません。これは単にデータの誤りや偏見の問題ではありません。コンテナはワークフローのさまざまな側面を高速化できますが、実際にすべての作業を実行するわけではありません。

キャップジェミニのエンジニアリングおよびテクノロジー担当ディレクター、ラグー・キショア・ヴェンパティ氏は次のように述べています。「コンテナは、AI/ML ワークロードを実行するのに非常に有益です。しかし、AI/ML ワークロードを単にコンテナ化しても、モデルの効率は上がりません。モデルのトレーニングと推論に関連する生産性を向上させる方法を提供するだけです。」

6. 構築と購入を賢く選択する

ほとんどのテクノロジーの選択と同様に、「すべきか、すべきでないか」という疑問がありますが、これは AI/ML ワークロードのコンテナ化に関する決定を下す場合にも当てはまります。ほとんどの重要なテクノロジーの選択と同様に、選択にはコストがかかります。

「機械学習ワークフローのコンテナ化には、小規模チームにとっては負担が大きすぎるコストがかかる可能性がありますが、大規模チームにとってはメリットがコストを上回ります」と、Autifly の Mustafa 氏は述べています。

IT リーダーとそのチームは、明確な目的や理由を持って、単にできるからという理由でこれを行う必要があります。

「すでに複雑な状況をさらに複雑にしないでください」と ISG のフランク氏は言います。「コンテナ化された機械学習ワークロードが、知的活動を超えたビジネス価値を提供することを確認してください。」

商用またはオープンソースのルートを選択する場合は、AI/ML を取り巻くエコシステムが急速に進化しており、独自の戦略も変化する可能性があるため、将来の柔軟性を確保する必要があります。

「企業はビジネスを 1 つのベンダーに頼るべきではありません」と Reznik 氏はアドバイスします。「ベンダーが提供するソリューションだけでなく、さまざまなオープンソースソリューションを使用する必要があります。さまざまなオープンソースソリューションは、企業のチームにさらなるイノベーションの可能性をもたらします。」

<<: IEEE | わずか1秒でドローンは地上で宙返りできる

>>: AI はコードの内容に基づいて関数名を自動的に生成するため、標準的な方法で名前を付けない同僚について心配する必要がなくなります。