機械学習におけるモデル展開とは何ですか?

機械学習におけるモデル展開とは何ですか?

機械学習におけるモデルのデプロイメントとは、機械学習モデルを既存の運用環境に統合し、入力を受け入れて出力を返すプロセスです。目標は、トレーニングされた機械学習モデルの予測を他の人が利用できるようにすることです。

ほとんどのオンライン リソースは、探索的データ分析 (EDA)、モデルの選択、モデルの評価など、機械学習ライフサイクルの初期ステップに重点を置いています。ただし、モデルの展開は複雑になる可能性があるため、ほとんど議論されないトピックのようです。ソフトウェア エンジニアリングや DevOps の経験がない人にとって、デプロイメントを理解するのは困難です。

この記事では、モデルのデプロイメントの概要、モデルの高レベルアーキテクチャ、モデルをデプロイするさまざまな方法、およびデプロイメント方法を決定する際に考慮すべき要素について詳しく説明します。

モデルのデプロイメントとは何ですか?

機械学習モデルのデプロイ (モデル デプロイとも呼ばれます) とは、モデルが入力を受け入れて出力を返すことができる既存の運用環境に機械学習モデルを統合することを意味します。モデルを展開する目的は、他の人 (ユーザー、管理者、または他のシステム) がトレーニングされた機械学習モデルを使用して予測を行えるようにすることです。

モデルの展開は機械学習システム アーキテクチャと密接に関連しており、事前定義された目標を達成するためにシステム内のソフトウェア コンポーネントの配置と相互作用を指します。

モデル展開標準

モデルをデプロイする前に、機械学習モデルがデプロイの準備としていくつかの基準を満たす必要があります。

  • 移植性:これは、ソフトウェアをあるマシンまたはシステムから別のマシンまたはシステムに転送できる能力を指します。ポータブル モデルとは、応答時間が比較的速く、簡単に書き換えることができるモデルです。
  • スケーラビリティ:モデルを拡張できる範囲を指します。スケーラブルなモデルとは、再設計せずにパフォーマンスを維持できるモデルです。

これらはすべて、ソフトウェアやその他の製品が実際に運用され、エンドユーザーが使用する環境を表す用語である実稼働環境で行われます。

モデル展開のための機械学習システムアーキテクチャ

大まかに言えば、機械学習システムには 4 つの主要な部分があります。

  • データ レイヤー: データ レイヤーは、モデルに必要なすべてのデータ ソースへのアクセスを提供します。
  • フィーチャ レイヤー: フィーチャ レイヤーは、透過的かつスケーラブルで使いやすい方法でフィーチャ データを生成する役割を担います。
  • スコアリング レイヤー: スコアリング レイヤーは、特徴を予測に変換します。 Scikit-Learn は最も一般的に使用されており、スコアリングの業界標準です。
  • 評価レイヤー: 評価レイヤーは 2 つのモデルの同等性をチェックし、実稼働モデルを監視するために使用できます。これは、トレーニング予測が実際のトラフィック予測とどの程度一致するかを監視および比較するために使用されます。

知っておくべき3つのモデル展開方法

ML モデルをデプロイするための一般的なアプローチには、ワンショット、バッチ、リアルタイムの 3 つがあります。

1. 1回限り

展開のために機械学習モデルを継続的にトレーニングする必要は必ずしもありません。モデルは一度だけ、または定期的に必要になる場合があります。この場合、モデルは必要に応じてアドホックにトレーニングされ、パフォーマンスが低下して修復が必要になるまで実稼働状態にすることができます。

2. バッチ

バッチトレーニングを使用すると、モデルの最新バージョンを継続的に使用できます。これは、一度にデータのサブサンプルを取得するスケーラブルなアプローチであり、更新ごとに完全なデータセットを使用する必要がなくなります。モデルを一貫して使用するが、必ずしもリアルタイムの予測が必要ない場合には、このアプローチが適しています。

3. リアルタイム

場合によっては、取引が不正であるかどうかを判断するなど、リアルタイムの予測が必要になります。これは、確率的勾配降下法を使用した線形回帰などのオンライン機械学習モデルを使用することで実現できます。

考慮すべき4つのモデル展開要素

機械学習モデルの展開方法を決定する際に考慮すべき要素や影響は数多くあります。これらの要因には次のものが含まれます。

  • 予測が生成される頻度と予測結果がどの程度緊急に必要か。
  • 予測を個別に生成するか、バッチで生成するか。
  • モデルのレイテンシ要件、保有するコンピューティング能力、必要なサービス レベル アグリーメント (SLA)。
  • モデルの導入と維持に必要な運用上の影響とコスト。

これらの要素を理解することで、1 回限り、バッチ、リアルタイムのモデル展開アプローチの中から選択できるようになります。

<<: 

>>:  AIが将来のスマートマスモビリティソリューションへの道を切り開く

ブログ    
ブログ    

推薦する

疫病流行中の人間の行動にAIが混乱!データ変更による作業の「異常」は手動での制御が必要

[[327938]]ビッグデータダイジェスト制作著者: 劉俊環半年前に Taobao をオープンした...

16歳の高校生が13,000行以上のコードでC++機械学習ライブラリをゼロから作成した

コンピューターが大好きなティーンエイジャーは、16歳にしてすでに、広東語プログラミング言語の開発、K...

1年間で18本の論文:Google Quantum AI チームの2021年年次概要

量子コンピューティングは、常に次の産業革命の原動力と考えられてきました。さまざまな国やテクノロジー企...

...

...

乱雑なファイルキャビネットとはお別れしましょう! AI ドキュメント管理システムの 7 つのメリット

[[341868]]従来のファイリングキャビネットは、契約書、ベンダー契約書、入社書類、その他の書類...

【WOT2018】蘇寧ドットコム高超:AI技術+短編動画を電子商取引プラットフォームに応用

[51CTO.comより引用] 2013年頃、携帯電話やパソコンに短編動画が大量に登場し、低コスト、...

アルゴリズムの大きな進歩! AIニューラルネットワークは量子システムをシミュレートする

[[269803]]最近、研究者たちはニューラルネットワークに基づく新しいアルゴリズムを使用して量子...

AIが「テクノロジー冬季オリンピック」を支援、UBTECHロボティクスが氷と雪の世界に進出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

STLコンポーネントアルゴリズム

STL は、OOP と従来のプログラミングの両方で使用できる多数のテンプレート クラスと関数を提供し...

Google内部関係者、Bardチャットボットの有用性に疑問

10月12日、ブルームバーグは昨夜、グーグルとDiscordが共同で自社のAIチャットボット「Bar...

人工知能の進化の限界は肉体にある

[[233888]] AIの未来は私たち自身のニューラルネットワークを複製することにある私たちは、チ...