機械学習におけるモデル展開とは何ですか?

機械学習におけるモデル展開とは何ですか?

機械学習におけるモデルのデプロイメントとは、機械学習モデルを既存の運用環境に統合し、入力を受け入れて出力を返すプロセスです。目標は、トレーニングされた機械学習モデルの予測を他の人が利用できるようにすることです。

ほとんどのオンライン リソースは、探索的データ分析 (EDA)、モデルの選択、モデルの評価など、機械学習ライフサイクルの初期ステップに重点を置いています。ただし、モデルの展開は複雑になる可能性があるため、ほとんど議論されないトピックのようです。ソフトウェア エンジニアリングや DevOps の経験がない人にとって、デプロイメントを理解するのは困難です。

この記事では、モデルのデプロイメントの概要、モデルの高レベルアーキテクチャ、モデルをデプロイするさまざまな方法、およびデプロイメント方法を決定する際に考慮すべき要素について詳しく説明します。

モデルのデプロイメントとは何ですか?

機械学習モデルのデプロイ (モデル デプロイとも呼ばれます) とは、モデルが入力を受け入れて出力を返すことができる既存の運用環境に機械学習モデルを統合することを意味します。モデルを展開する目的は、他の人 (ユーザー、管理者、または他のシステム) がトレーニングされた機械学習モデルを使用して予測を行えるようにすることです。

モデルの展開は機械学習システム アーキテクチャと密接に関連しており、事前定義された目標を達成するためにシステム内のソフトウェア コンポーネントの配置と相互作用を指します。

モデル展開標準

モデルをデプロイする前に、機械学習モデルがデプロイの準備としていくつかの基準を満たす必要があります。

  • 移植性:これは、ソフトウェアをあるマシンまたはシステムから別のマシンまたはシステムに転送できる能力を指します。ポータブル モデルとは、応答時間が比較的速く、簡単に書き換えることができるモデルです。
  • スケーラビリティ:モデルを拡張できる範囲を指します。スケーラブルなモデルとは、再設計せずにパフォーマンスを維持できるモデルです。

これらはすべて、ソフトウェアやその他の製品が実際に運用され、エンドユーザーが使用する環境を表す用語である実稼働環境で行われます。

モデル展開のための機械学習システムアーキテクチャ

大まかに言えば、機械学習システムには 4 つの主要な部分があります。

  • データ レイヤー: データ レイヤーは、モデルに必要なすべてのデータ ソースへのアクセスを提供します。
  • フィーチャ レイヤー: フィーチャ レイヤーは、透過的かつスケーラブルで使いやすい方法でフィーチャ データを生成する役割を担います。
  • スコアリング レイヤー: スコアリング レイヤーは、特徴を予測に変換します。 Scikit-Learn は最も一般的に使用されており、スコアリングの業界標準です。
  • 評価レイヤー: 評価レイヤーは 2 つのモデルの同等性をチェックし、実稼働モデルを監視するために使用できます。これは、トレーニング予測が実際のトラフィック予測とどの程度一致するかを監視および比較するために使用されます。

知っておくべき3つのモデル展開方法

ML モデルをデプロイするための一般的なアプローチには、ワンショット、バッチ、リアルタイムの 3 つがあります。

1. 1回限り

展開のために機械学習モデルを継続的にトレーニングする必要は必ずしもありません。モデルは一度だけ、または定期的に必要になる場合があります。この場合、モデルは必要に応じてアドホックにトレーニングされ、パフォーマンスが低下して修復が必要になるまで実稼働状態にすることができます。

2. バッチ

バッチトレーニングを使用すると、モデルの最新バージョンを継続的に使用できます。これは、一度にデータのサブサンプルを取得するスケーラブルなアプローチであり、更新ごとに完全なデータセットを使用する必要がなくなります。モデルを一貫して使用するが、必ずしもリアルタイムの予測が必要ない場合には、このアプローチが適しています。

3. リアルタイム

場合によっては、取引が不正であるかどうかを判断するなど、リアルタイムの予測が必要になります。これは、確率的勾配降下法を使用した線形回帰などのオンライン機械学習モデルを使用することで実現できます。

考慮すべき4つのモデル展開要素

機械学習モデルの展開方法を決定する際に考慮すべき要素や影響は数多くあります。これらの要因には次のものが含まれます。

  • 予測が生成される頻度と予測結果がどの程度緊急に必要か。
  • 予測を個別に生成するか、バッチで生成するか。
  • モデルのレイテンシ要件、保有するコンピューティング能力、必要なサービス レベル アグリーメント (SLA)。
  • モデルの導入と維持に必要な運用上の影響とコスト。

これらの要素を理解することで、1 回限り、バッチ、リアルタイムのモデル展開アプローチの中から選択できるようになります。

<<: 

>>:  AIが将来のスマートマスモビリティソリューションへの道を切り開く

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Microsoft のエンジニアが PyTorch を使用してグラフ アテンション ネットワークを実装し、驚くべき視覚効果を実現

最近、グラフアテンションネットワークの視覚化に関するプロジェクトが多くの研究者の関心を集めており、開...

自動運転における機械学習の核となるのはモデルではなくパイプラインである

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

ブロックチェーンコアアルゴリズムのコンセンサスメカニズム

コンセンサス メカニズムは、ブロックチェーン システムで新しいブロックを生成する責任者を決定する役割...

時代の流れに乗り、華麗に変革を遂げる UiPath RPA が上海ノキアベルの新たな航海をサポートします。

上海ノキアベル株式会社(以下、「ノキアベル」)は、ノキアグループと中国保利集団の子会社である華新郵電...

...

2019 年に読むべき 5 つの無料機械学習電子書籍

[51CTO.com クイック翻訳] 現在、機械学習は主要なソフトウェアエンジニアリング分野における...

Adobe、フォトショップで加工された人間の顔を自動検出できるAIツールを開発

偽の動画や画像の拡散に対する懸念は世界中で高まっており、Adobe もその懸念を共有していると述べて...

AIコンピューティングのローカライズのもう一つの可能​​性:CoCoPIEの探究と選択

[51CTO.comからのオリジナル記事]これは、少し前に設立され、シリーズAの資金調達を完了したば...

GPT のプログラミング バージョンは 30,000 スターに急上昇し、AutoGPT は危険にさらされています。

執筆者 | 王 瑞平AutoGPT に続いて、GPT ファミリーに新しいメンバーである GPT-En...

データマイニングにおけるトップ10の古典的なアルゴリズム

国際的に有名な学術組織である IEEE 国際データマイニング会議 (ICDM) は、データマイニング...

ディープラーニングアルゴリズム

ディープラーニングアルゴリズムは、マシンビジョンにおける巧妙な受信機コンバーターのようなものです。柔...

文書翻訳における人工知能: 効率化の新時代

今日、言語を超えた効果的なコミュニケーションはこれまで以上に重要になっています。企業が新しい市場に進...