企業は機械学習の運用を活用してビジネス上の利益を得ています

企業は機械学習の運用を活用してビジネス上の利益を得ています

企業が初めて AI を導入し、機械学習プロジェクトを開始するときは、理論的なレベルに焦点が当てられることが多いです。必要な結果を提供できるモデルはありますか? そのようなモデルはどのように構築できますか? そのようなモデルはどのようにトレーニングできますか?

しかし、データ サイエンティストがこれらの概念実証を開発するために使用するツールは、多くの場合、実稼働システムにうまく移行できません。その結果、IDC によれば、AI または機械学習ソリューションを導入するには平均 9 か月以上かかります。

「私たちはこれを『モデル速度』と呼んでいます。これはモデルが開始から終了までにかかる時間のことです」とIDCのアナリスト、スリラム・スブラマニアン氏は語った。

ここで MLOps が役立ちます。 MLOps (機械学習オペレーション) は、企業が理論的な概念実証 AI システムを本番環境に導入する際のデータ、モデル、展開、監視などの側面を管理するのに役立つベスト プラクティス、フレームワーク、ツールのセットです。

「MLOps により、モデルの速度が数週間、場合によっては数日に短縮されます」と Subramanian 氏は述べています。 「DevOps を使用してアプリケーションの開発にかかる平均時間を短縮するのと同じように、MLOps も使用する必要があります。」

MLOps を使用することで、企業はより多くのモデルを構築し、より迅速に革新し、より多くのユースケースに対応できるようになると彼は述べました。 「価値提案は非常に明確です」と彼は語った。

IDC は、2024 年までに 60% の企業が MLOps を使用して機械学習ワークフローを実装すると予測しています。スブラマニアン氏は、AI および機械学習テクノロジーの使用で企業が直面する課題について調査したところ、MLOps の欠如がコストに次いで企業による AI および機械学習テクノロジーの導入における主な障壁となっていると述べました。

ここでは、MLOP とは何か、MLOP がどのように進化してきたか、そして AI テクノロジーを実装するためのこの新しいアプローチを活用するために組織が使用し、留意する必要があるものについて説明します。

MLOps の進化

Eugenio Zuccarelli 氏が数年前に機械学習プロジェクトの設計を始めたとき、MLOps は単なるベストプラクティスの集まりでした。それ以来、ズッカレッリ氏はヘルスケアや金融サービス分野を含む複数の企業で AI プロジェクトに携わり、時間の経過とともに MLOps がさまざまなツールやプラットフォームを含むように進化していく様子を目の当たりにしてきました。

現在、CVS Health でイノベーション データ サイエンティストとして働く Zuccarelli 氏は、MLOps は AI テクノロジーを実装するための非常に強力なフレームワークを提供していると述べています。一例として、ズッカレッリ氏は、入院再発や病気の進行といった悪影響を予測できるアプリの開発に取り組んだ過去のプロジェクトについて言及した。

「私たちはデータセットとモデルを調べ、医師と話し合って、最良のモデルの特徴を見つけ出そうとしていました」と彼は語った。 「しかし、これらのモデルを本当に役立つものにするには、実際のユーザーの前に提示する必要があります。」

これは、API 経由で接続されたバックエンドの機械学習システムを備えた、信頼性が高く、高速で安定したモバイル アプリを開発することを意味しました。 「MLOps がなければ、これは実現できなかったでしょう」と彼は言います。

彼のチームは、H2O MLOps プラットフォームとその他のツールを使用して、モデルのヘルスダッシュボードを作成しました。 「モデルが大幅に変わることは望ましくない」と彼は語った。 「偏見を持ち込むことは望ましくありません。このヘルスダッシュボードにより、システムに変化があるかどうかを確認できます。」

MLOps プラットフォームを使用すると、運用システムを更新することもできます。 「アプリケーションを停止せずにファイルを置き換えるのは非常に難しい」とズッカレッリ氏は語った。 「MLOps ツールは、システム自体の中断を最小限に抑えながら、運用中でもシステムに変更を加えることができます。」

MLOps プラットフォームが成熟するにつれて、企業はプロジェクトごとに車輪の再発明をする必要がなくなるため、モデル開発プロセス全体がスピードアップするだろう、と彼は述べた。データ パイプライン管理機能も AI の実装に重要です。

「相互に通信する必要がある複数のデータソースがある場合、MLOps が役立ちます」と彼は言いました。 「機械学習モデルに流入するすべてのデータは、一貫性があり、高品質である必要があります。よく言われるように、ゴミを入れればゴミが出てくるのです。モデルに入力される情報の品質が低ければ、予測も低くなります。」

MLOps の基礎: 動くターゲット

しかし、現在プラットフォームやツールが利用可能であるからといって、MLOps の中核となる原則を無視できると考えないでください。この分野に参入したばかりの企業は、MLOps の本質はデータ サイエンスとデータ エンジニアリングの間に強力なつながりを構築することであるということを覚えておく必要があります。

「MLOps プロジェクトを成功させるには、データ エンジニアとデータ サイエンティストの両方を同じチームに配置する必要があります」と Zuccarelli 氏は言います。

さらに、偏見を防ぎ、透明性を確保し、説明可能性を提供し、倫理的なプラットフォームをサポートするために必要なツールもあるが、これらはまだ開発中であると彼は述べた。 「これは非常に新しい分野なので、間違いなく多くの作業が必要です。」

したがって、完全なターンキー ソリューションがなければ、企業は AI テクノロジーを実装する際に MLOps を効果的にするあらゆる側面を熟知している必要があります。それはあらゆる仕事で専門知識を学ぶことを意味する、と米国テンピのインサイト・テクノロジー・コンサルティングのAIチームの全国ビジネスマネージャー、ミーガン・ジェントリー氏は言う。

MLOps には、データの収集、検証、分析から、マシン リソースの管理、モデルのパフォーマンスの追跡まで、あらゆるものが含まれます。ビジネスを支援するために利用できるツールの一部は、オンプレミス、クラウド、またはエッジに導入できます。これらのツールはオープンソースでも独自のものでもかまいません。

しかし、技術的な知識は解決策の一部にすぎません。 MLOps は開発オペレーション (DevOps) のアジャイル手法と反復開発原則も活用していると Gentry 氏は述べています。さらに、アジャイルのあらゆる事柄と同様に、コミュニケーションが重要です。

「あらゆる役割間のコミュニケーションが重要です」と彼女は語った。 「データ サイエンティストとデータ エンジニア間のコミュニケーション。DevOps とのコミュニケーション、そしてより大きな IT チームとのコミュニケーション。」

MLOps を始めたばかりの企業にとって、MLOps はわかりにくい場合があります。いくつかの一般的な原則がわかります。ベンダーは数十社あり、さらに多くのオープンソース ツールボックスがあります。

「そこに落とし穴がいくつかあるのです」と、キャップジェミニ・アメリカのエンタープライズ・アーキテクチャ担当シニア・マネージャー、ヘレン・リストフ氏は言う。 「こうした落とし穴の多くは開発プロセスにあります。DevOps で見られるような正式なガイドラインはありません。これは新興技術であり、ガイドラインやポリシーの一部が開発されるまでには時間がかかるでしょう。」

リストフ氏は、企業がデータ プラットフォームから MLOps の取り組みを始めることを推奨しています。 「おそらく複数のデータセットを持っているのでしょうが、それらは異なる場所にあり、あまりまとまりのある文脈を持っていません」と彼女は言いました。

彼女は、企業はすべてのデータを 1 つのプラットフォームに移行する必要はないが、アプリケーションによって異なるさまざまなソースからデータを取り込む方法が必要であると述べました。たとえば、データ レイクは、低コストのストレージを必要とし、大量の分析を頻繁に実行する企業に適しています。

MLOps プラットフォームは通常、トレーニング データのさまざまなバージョンを追跡しながらデータ パイプラインを構築および管理するためのツールを提供しますが、それは万能のソリューションではないと彼女は言います。

また、モデルの作成、バージョン管理、ログ記録、機能セットの測定、およびモデル自体の管理のその他の側面も提供します。

「大量のコーディングが必要です」とリストフ氏は述べ、MLOps プラットフォームのセットアップには数か月かかることがあり、プラットフォーム ベンダーは統合作業に関してまだやるべきことがたくさんあると付け加えました。

「さまざまな方向で多くの開発が行われています」と彼女は語った。 「開発されているツールは数多くあり、エコシステムは非常に大きく、人々は必要なものを選んでいるだけです。MLOps はまだ未成熟な段階です。ほとんどの組織は、最適な構成をまだ模索しているところです。」

MLOps の状況を理解する

IDCのスブラマニアン氏は、MLOps市場は2020年の約1億8,500万ドルから2025年までに約7億ドルに成長すると予想していると述べた。しかし、MLOps 製品は大規模なプラットフォームにバンドルされることが多いため、これは大幅に過小評価されている可能性があると彼は述べた。同氏は、市場の実際の規模は2025年までに20億ドルを超える可能性があると述べた。

スブラマニアン氏は、MLOps ベンダーは一般的に 3 つのカテゴリに分類され、まず Amazon Web Services (AWS)、Azure Cloud、Google Cloud などの大手クラウド プロバイダーが MLOps 機能をサービスとして提供していると述べています。

さらに、DataRobot、Dataiku、Iguazio などの機械学習プラットフォーム ベンダーもいくつかあります。

「3番目のカテゴリーは、かつてデータ管理ベンダーと呼ばれていたものです」と彼は語った。 「Cloudera、SAS、DataBricks などの企業です。これらの企業の強みはデータ管理機能とデータ操作にあり、その後、機械学習機能に拡大し、最終的には MLOps 機能にまで拡大しました。」

スブラマニアン氏は、これら 3 つの分野すべてが爆発的な成長を遂げていると述べ、MLOps ベンダーを差別化するのは、オンプレミスとクラウドの両方でモデルの展開をサポートする能力、信頼性が高く責任ある AI を実装する能力、プラグアンドプレイ ソリューションを提供する能力、簡単に拡張できる能力であると付け加えました。 「そこで、異なるベンダー間の違いが出てくるのです」と彼は語った。

最近の IDC の調査によると、責任ある AI を実装するための方法論の欠如は、AI および機械学習テクノロジーの使用における上位 3 つの障壁の 1 つであり、MLOps 自体の欠如と並んで 2 位となっています。

コンサルティング会社ガートナーのAIおよび機械学習技術のリサーチアナリスト、スミット・アガルワル氏は、その主な理由はMLOpsを使用する以外に選択肢がないことだと述べた。

「他の方法は手動です」と彼は言った。 「ですから、他に選択肢はありません。スケールしたいなら、自動化が必要です。コード、データ、モデルの追跡可能性が必要です。」

ガートナー コンサルティングによる最近の調査によると、モデルが概念実証から実稼働に移行するまでにかかる平均時間は 9 か月から 7.3 か月に短縮されました。 「しかし、7.3か月というのはまだ長いサイクルだ」とアガルワル氏は語った。 「組織が MLOps を活用できる機会はたくさんあります。」

組織文化を MLOps へシフト

ジェンパクトのグローバルアナリティクス責任者アマレシュ・トリパシー氏は、MLOps では企業の AI チームの組織文化の転換も必要だと述べています。

「データサイエンティストに対する人々の一般的なイメージは、干し草の山から針を見つけようとするマッドサイエンティストだ」と彼は言う。 「データ サイエンティストは発見者であり探検家であり、部品を大量生産する工場の現場の人間ではありません。しかし、本当に規模を拡大したいときには、そうなる必要があります。」

同氏は、企業は投入する必要のある努力を過小評価しがちだと述べた。

「ソフトウェアエンジニアリングに対する理解が深まりました」と彼は語った。 「ユーザー エクスペリエンスと要件に関するルールはたくさんあります。しかし、モデルを自分でデプロイするときに、同じプロセスを経る必要があるとは考えていないようです。また、テスト環境での作業が得意なデータ サイエンティストなら誰でも自然にモデルをデプロイできる、あるいは数人の IT 担当者を派遣すれば済む、という誤解もあります。何をすべきか理解されていないのです。」

企業がまだ気づいていないのは、MLOps が企業全体に波及効果をもたらし、劇的な変化をもたらす可能性があるということです。

「コールセンターに MLOps を導入することはできますが、単純なタスクの一部は機械や AI によって処理されるのに対し、人間に引き継がれるタスクはより複雑なため、実際には時間がかかるため、平均応答時間は実際には長くなります」と、同氏は述べた。 「ですから、やるべき仕事は何なのか、どんな人材が必要なのか、どんなスキルが必要なのかを再考する必要があるのです。」

現在、組織内の意思決定のうちアルゴリズムによって行われているのは5%未満だが、状況は急速に変化していると彼は述べた。 「今後 5 年以内に、意思決定の 20% ~ 25% がアルゴリズムによって行われるようになると予測しています。私たちが見るすべての統計は、AI が急速に拡大している転換点にあることを示しています。」

MLOps は重要な要素であると彼は述べた。

「100パーセントだ」と彼は言った。 「MLOps がなければ、AI を持続的に使用することはできません。MLOps は、企業における AI の使用を拡大するためのきっかけとなります。」

<<:  AIと機械学習が交通をどのように変えているのか

>>:  医師は偶然、ある秘密を発見しました。DALL-E 2 は独自の言語を作成しましたが、その言語は人間には理解できませんが、特定のイメージを生成することができ、トラブルを引き起こす可能性があります。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

グラフィカルな説明 | RSAアルゴリズムとは

[[339878]]この記事はWeChatパブリックアカウント「Backend Technology...

...

ピュー研究所:アルゴリズム時代の7つの主要テーマとその主な影響

世界的に権威のある調査機関であるピュー研究所は最近、「アルゴリズムの時代」と題する報告書を発表し、1...

...

アルゴリズムだけでは不十分:AIの次のブレークスルーにはハードウェアの再検討が必要

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

VB.NET 暗号化アルゴリズムの基本概念の分析

プログラミング言語の場合、その機能性を評価する上で最も重要な要素の 1 つはセキュリティ評価です。 ...

...

OpenAI GPTストアは来週開始予定

OpenAI は 2024 年に出発する準備が整っているようです。 ChatGPT の背後にある会社...

ロボット工学が建設業界の新時代を告げる

建設業界は現在、デジタル革新が業界の方向性をますます推進する中で、大きな変革期を迎えています。ロボッ...

自動運転テストが重要なのはなぜですか?米国と比較して、中国には4つの大きな利点がある

交通・自動車業界の変革の主流として、自動運転技術の開発は初期の成熟段階に入り、多くの企業が大規模なテ...

人工知能はこれら12の分野に混乱をもたらし、ホワイトカラー労働者も職を失うことになるだろう

[[192649]]人工知能 (AI) は、今日最もエキサイティングで将来有望な最先端技術の 1 つ...

2019年に予想される5つのホットなスタートアップトレンド

最近は大学生があちこちで見かけられ、就職のプレッシャーも高まっています。そのため、多くの人にとって、...

1日で6つの賞を獲得! PATEOの自動車インターネットが高工インテリジェント車両ゴールデングローブ賞を受賞

12月15日から17日まで、2020年(第4回)高工インテリジェント自動車年次大会および高工ゴールデ...

...