機械学習モデルの導入における課題に対処する方法

機械学習モデルの導入における課題に対処する方法

[[377893]]

[51CTO.com クイック翻訳] データとオープンソースの機械学習フレームワークが利用可能になり、アクセスしやすくなったことで、データ サイエンティストや開発者は AI ベースのソリューションを構築しやすくなります。ただし、モデルの導入と、本番環境レベルのシステムに拡張するための最適な戦略の選択を検討する必要がある場合、プロセスはより複雑になります。

次のセクションでは、機械学習モデルの導入における一般的な課題について説明し、これらの課題のいくつかに対処する方法について説明します。

AI 主導の組織にとって、モデルの展開を成功させることが重要なのはなぜですか?

機械学習モデルの展開は、機械学習アルゴリズムを Web サービスに変換するプロセスです。この変換プロセスは運用化と呼ばれます。機械学習モデルの運用化とは、それを消費可能なサービスに変換し、既存の運用環境に組み込むことを意味します。

モデルのデプロイは、機械学習モデル ワークフローの基本的なステップです。機械学習モデルを導入することで、組織は構築した予測モデルとインテリジェントモデルを最大限に活用し、モデルの結果に基づいてビジネスプラクティスを開発し、人工知能によって駆動される実際のビジネスへと変革することができます。

AI の導入を検討する場合、組織は、データ ソースと取り込み、データ パイプライン、機械学習モデルのトレーニングとテスト、新しい機能の設計方法、モデルの精度を高めるために使用する変数など、機械学習ワークフローの主要コンポーネントに重点を置く必要があります。これらすべてのステップは重要です。ただし、これらのモデルとデータが時間の経過とともにどのように使用されるかを考慮することも、すべての機械学習パイプラインにおいて重要なステップです。モデルが展開され、運用されると、その予測から実際の価値とビジネス上のメリットを引き出すことができます。

モデルの正常な導入は、次の理由から AI 主導の組織にとって非常に重要です。

  • 機械学習モデルを導入することで、チームはそのモデルを使用し、データを送信して予測を取得できるようになります。その後、その予測を機械学習システムに取り込んで、トレーニング データの品質と量を向上させることができます。
  • このプロセスが開始されると、組織はより多くの機械学習モデルを構築し、本番環境に導入し始めます。開発環境からビジネス運用システムにモデルを移行するための信頼性が高く、繰り返し可能な方法を開発できます。

一部の組織がモデルの展開に苦労するのはなぜでしょうか?

多くの組織は、AI の導入をテクノロジーの実践と見なしています。しかし、これは組織内で開始されるビジネス主導の取り組みです。 AI 主導の組織になるためには、現在ビジネスを運営し理解している組織内の人々が、機械学習の展開ワークフローを担当するチームと緊密に連携し始めることが重要です。

機械学習の導入ワークフローの各ステップは、導入を成功させるために使用する必要があるさまざまなツールとサービスに関する具体的な決定に基づいています (モデルのトレーニングと登録からモデルの導入と監視まで)。

AI アプリケーション開発プロセスを開始するときは、機械学習チームがビジネス担当者と連携する必要があります。モデルの展開および使用手順と並行して、モデルの実験プロセスを理解するために、継続的な対話を維持する必要があります。ほとんどの組織は、機械学習の可能性を活用して運用プロセスを最適化し、データ サイエンティスト、アナリスト、ビジネス チームが同じ言語で話せるようにすることに苦労しています。

さらに、機械学習モデルは履歴データに基づいてトレーニングする必要があります。予測データ パイプラインを作成する必要があります。これは、データ処理、機能エンジニアリング、最適化などの複数のタスクを必要とするアクティビティです。データベースのバージョン管理から欠損値の処理まで、すべてのタスクは開発から本番まで正確に複製する必要があります。場合によっては、開発と本番で使用されるテクノロジの違いにより、機械学習モデルの導入が困難になることがあります。

組織は機械学習パイプラインを使用して、機械学習の各段階を結び付けるワークフローを作成および管理できます。たとえば、機械学習パイプラインには、データの準備、モデルのトレーニング、モデルの展開、推論/スコアリングの各段階が含まれる場合があります。各ステージは複数のステップで構成でき、各ステップは人間の介入なしにさまざまなコンピューティング ターゲットで実行できます。パイプライン ステップは再利用可能であり、ステップの出力が変更されていない場合は、後続のステップを再度実行せずに実行できます。機械学習パイプラインを使用すると、データ サイエンティストは機械学習ワークフローのさまざまな領域で作業しながら共同作業を行うこともできます。

モデルを正常に展開するために適切なツールを選択するにはどうすればよいでしょうか?

人工知能を使用して業務を変革しようとしている組織にとって、機械学習モデルの構築、トレーニング、テスト、そして最終的な導入は、面倒なプロセスになることがよくあります。また、数か月の開発期間を経て単一のアルゴリズムに基づく機械学習モデルが完成したとしても、経営陣はデータ サイエンティストが優れたモデルを作成したかどうか、またそのモデルをどのように拡張して運用化すればよいのかを把握していないことがよくあります。

ここでは、組織が展開モデルを成功させるために適切なツールを選択する方法に関するガイドラインを示します。このワークフローは Azure Machine Learning サービスを使用して説明されますが、組織が選択した機械学習製品でも使用できます。

モデル展開ワークフローは、次の 3 つの簡単な手順に基づく必要があります。

1. モデルを登録する

登録されたモデルは、モデルを構成する 1 つ以上のファイルの論理コンテナーです。たとえば、組織に複数のファイルに保存されたモデルがある場合、それらをワークスペースに 1 つのモデルとして登録できます。登録後、登録したモデルをダウンロードまたはデプロイし、登録したすべてのファイルを受信できるようになります。

Azure Machine Learning ワークスペースを作成するときに、機械学習モデルを登録できます。モデルは、Azure Machine Learning または他の場所から取得できます。

2. 展開の準備 (資産、目的、コンピューティング ターゲットを指定する)。

モデルを Web サービスとしてデプロイするには、推論構成とデプロイ構成を作成する必要があります。推論、またはモデル スコアリングは、展開されたモデルが通常は実稼働データに対して予測に使用される段階です。推論構成では、組織はモデルを提供するために必要なスクリプトと依存関係を指定します。デプロイメント構成では、コンピューティング ターゲットでモデルを提供する方法の詳細を指定します。

入力スクリプトは、デプロイされた Web サービスに送信されたデータを受信し、それをモデルに渡します。モデルによって返された応答を取得してクライアントに返すことができます。スクリプトは組織のモデルに固有のものであり、モデルが期待して返すデータを理解する必要があります。

スクリプトには、モデルを読み込んで実行するための 2 つの関数が含まれています。

  • init(): 通常、この関数はモデルをグローバル オブジェクトに読み込みます。この関数は、Web サービスの Docker コンテナが起動されたときに 1 回だけ実行されます。
  • run(input_data): この関数はモデルを使用して、入力データに基づいて値を予測します。実行される入力と出力は通常、JSON を使用してシリアル化および逆シリアル化されます。組織は生のバイナリ データも処理できます。生のバイナリ データは、モデルに送信する前、またはクライアントに返す前に変換できます。

モデルを登録するときは、レジストリでモデルを管理するためにモデル名を指定する必要があります。組織はモデルにこの名前を使用します。 get_model_path() は、ローカル ファイル システム上のモデル ファイルへのパスを取得します。フォルダーまたはファイルのコレクションを登録すると、この API はそれらのファイルを含むディレクトリへのパスを返します。

3. モデルをコンピューティングターゲットにデプロイする

最後に、展開前に、組織は展開構成を定義する必要があります。デプロイメント構成は、Web サービスをホストするコンピューティング ターゲットに固有です。たとえば、ローカルにデプロイする場合は、サービスがリクエストを受け入れるポートを指定する必要があります。

結論は

この記事では、機械学習モデルの導入における一般的な課題をいくつか紹介しました。また、AI の可能性を最大限に引き出すためにモデルを正常に導入することがなぜ重要なのか、組織がモデルを導入する際に直面する困難、モデルを正常に導入するための適切なツールの選択についても説明しました。

原題: ML モデルの導入における課題への取り組み方、著者: Rajasekhar Reddy Polu

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  2020 年の世界トップ 10 AI ガバナンス イベント

>>:  5Gは医療業界に革命を起こす

ブログ    
ブログ    

推薦する

ディープラーニングを使って心臓病を診断する方法

[[204301]]概要: この論文では、心臓磁気共鳴画像 (MRI) データセットからの画像内の右...

大学卒業後、彼はGoogleに入社し、先駆的な作品「Thinking Chain」を執筆した。このOpenAIの新人は、学部生の質問に答えている。

「思考の連鎖(CoT)」の概念を注意深く研究したことがあるなら、おそらく Jason Wei とい...

自動運転の安全性の問題をどう解決するのか?まずは名前を変えてみましょう。

現在、新世代情報技術の急速な発展に伴い、自動運転をはじめとした新興産業がますます台頭しています。世界...

AIプロジェクトが失敗する6つの理由

データの問題は、企業の AI プロジェクトが意図した目標を達成できない主な理由です。しかし、企業が失...

絶えず繰り返されるアルゴリズムとプログラミング技術が若者の発達を促している

人間の進化と発達は、脳の潜在能力を最大限に活用して世界を変えるプロセスです。その中で、インターネット...

Meta がテキストを音声に変換するオープンソースライブラリ AudioCraft をリリース

最近、Meta は Llama シリーズのモデルやすべてを分割する SAM モデルなど、複数の AI...

...

...

農業生産性を最適化するスマート農業監視ソリューション

すべての IoT ソリューションの中で、スマート農業システムは間違いなく際立つでしょう。世界経済の中...

...

すべてのデータ サイエンティストが知っておくべき 19 の機械学習アルゴリズム

【51CTO.com 速訳】機械学習アルゴリズム入門機械学習アルゴリズムの分野では、分類には通常次の...

Gonex CEO ウェン・メンフェイ氏との独占インタビュー: アプリケーションの分野では、モデル自体よりも意図の認識の方が重要です。

ゲスト | ウェン・メンフェイインタビュー&執筆 | Yun Zhao潮が満ちると、何千もの船が動き...

ロボットはどうやってコーヒーを飲みながら心臓手術を行うのでしょうか?

「2、3年前、アメリカの医師たちが手術室の外に座り、コーヒーを片手にしているのを見ました。彼らはリ...

法律分野で初の「1対多」の人間と機械の競争が始まり、AI弁護士が契約書審査で人間を上回る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

百新銀行と百度クラウドAI+銀行金融技術シンクタンク会議が開催、オープンバンキングについて議論

11月19日、北京で「百度銀行&百度クラウドAI+銀行金融技術シンクタンク」が開催されました。カンフ...