概念とそれがビジネス目標に与える影響を学ぶことは非常に重要です。 アルゴリズムの選択 問題の定義を少し変更するだけで、その問題を解決するためにまったく異なるアルゴリズムが必要になるか、少なくとも異なるデータ入力を使用して異なるモデルを構築する必要がある場合があります。ユーザーの写真の種類を識別できる出会い系サイトでは、クラスタリングなどの教師なし学習手法を使用して共通のテーマを識別できます。一方、サイトが特定の人物にデートの相手を推薦したい場合、その人物がすでに見た写真など、その人に固有の入力データに基づく教師あり学習を使用する可能性があります。 特徴選択 機械学習モデルはデータ内のパターンを識別します。モデルに入力されるデータは、特徴 (変数または属性とも呼ばれます) に編成されます。これらは、予測または識別する現象の側面を説明する、関連性のある、ほとんどが独立したデータです。 先ほど述べた、ローン申請者へのアウトリーチを優先したいと考えていた会社の例を見てみましょう。問題を「コンバージョンの可能性に基づいて顧客に優先順位を付ける」と定義すると、会社のさまざまなアウトリーチ キャンペーンに対する同様の顧客の応答率を含む機能が得られます。問題を「ローンを返済する可能性が最も高い顧客を優先する」と定義すると、これらの特徴は顧客の可能性の評価に関連しないため、得られません。 目的関数の選択 目的関数は、最適化する目標、またはモデルが予測しようとしている結果です。たとえば、ユーザーが興味を持ちそうなアイテムを推奨する場合、モデルの出力は、ユーザーがそのアイテムを見たときにクリックする確率、またはユーザーがそのアイテムを購入する確率になる可能性があります。目的関数の選択は、主にビジネス目標によって異なります。この例では、ユーザー エンゲージメント (目的関数はクリック数または滞在時間) と収益 (目的関数は購入数) のどちらに関心がありますか? 考慮すべきもう 1 つの重要な要素は、データの可用性です。アルゴリズムが学習するには、ポジティブ (ユーザーが見てクリックした製品) またはネガティブ (ユーザーが見たがクリックしなかった製品) として「ラベル付け」された大量のデータ ポイントを提供する必要があります。 機械学習モデルを開発するには? 概要: 優れた機械学習モデルの作成は、他の製品の作成と同じです。まず、アイデア出しから始め、解決すべき問題と潜在的な解決策を考えます。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストすることができます。この記事では、その方法を段階的に見ていきましょう。 モデリング手順の概要 大まかに言えば、優れた機械学習モデルを作成することは、他の製品を構築することと同じです。つまり、アイデア創出、つまり解決すべき問題といくつかの潜在的な解決策を考えることから始まります。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストできます。ソリューションが市場に受け入れられるほど良くなるまで、アイデア創出、プロトタイピング、テストを繰り返す必要があります。その時点でソリューションを製品化し、リリースします。それでは、各段階を詳しく見ていきましょう。 データは機械学習の非常に重要な要素であるため、製品開発プロセスの上にデータを重ねる必要があります。そのため、プロセスは次のようになります。
概念 このフェーズの目標は、モデルが解決する主要な問題、目的関数、および潜在的な入力をモデル全体と一致させることです。
データ準備 このフェーズの目標は、生データを収集し、それをプロトタイプ モデルの入力として使用することです。生データを入力データとして使用できるようにするには、生データに対して複雑な変換を実行する必要がある場合があります。たとえば、あなたの特徴の 1 つが、消費者があなたのブランドについてどう思っているかだとします。まず、消費者があなたのブランドについて話している関連ソースを見つける必要があります。ブランド名に一般的な単語(「リンゴ」など)が含まれている場合は、プロトタイプを構築する前に、ブランド名をその一般的な意味(果物に関連)から区別し、感情分析モデルにかける必要があります。すべての機能の構築が複雑というわけではありませんが、一部の機能には多くの作業が必要になる場合があります。 このフェーズに含まれる内容を詳しく見てみましょう。
プロトタイプとテスト このフェーズの目標は、モデルのプロトタイプを取得し、それをテストし、本番環境で使用できるほど優れたモデルが得られるまで反復することです。
製品化 プロトタイプ モデルがビジネス上の問題を十分に解決し、実稼働に移行できるようになったときに、この段階に到達します。まだ完全な製品化の準備ができていない場合は、まずモデルをどの程度まで拡張するかを決定する必要があることに注意してください。たとえば、映画推薦ツールの場合、まず少数のユーザーに推薦サービスを提供して、各ユーザーに完全なユーザー エクスペリエンスを提供する必要があります。この場合、モデルは、各ユーザーとの関連性に応じてデータベース内の各映画をランク付けする必要があります。これは、単にアクション映画を推奨することとは異なる拡張機能の要件です。 それでは、モデルの製品化に関する技術的な詳細をいくつか見ていきましょう。
これまで説明してきたのは概念的なプロセスです。現実には、境界は曖昧であることが多く、異なる段階の間を行ったり来たりする必要があることがよくあります。データの供給に満足できず、最初からやり直すことを検討したり、モデルが製品化された後にモデルがうまく機能しないことがわかり、戻ってプロトタイプを再構築しなければならない場合もあります。 |
<<: 2030年にAIは人間のためにどんな仕事を創出できるでしょうか?
>>: タオバオの顔面を平手打ちして電子商取引を破壊しよう!このファッション会社はアルゴリズムを使って新しい小売業をリードしている
2023年6月16日、「共に立ち上がって無限のイノベーションを」をテーマにした人工知能フレームワーク...
[51CTO.comからのオリジナル記事] 1930年代初頭、フランスの科学者GBアルチュニは翻訳に...
2019年も残り1か月余りとなり、各種年間総括も迫ってまいりました。今年の AI の発展を振り返る...
[[406628]]仮想環境 (ALE、MuJoCo、OpenAI Gym) は、エージェントの制御...
強化学習 (RL) とディープラーニングの組み合わせは、一連の印象的な結果をもたらし、(ディープ) ...
完全情報ゲームでは、すべてのプレイヤーがすべての情報要素を知っています。しかし、不完全情報ゲームは異...
1. はじめにインテリジェント運転とは、一般的には、自動運転や車両のインターネット(IoV)などの技...
[51CTO.com クイック翻訳]職場における支援/拡張現実 (AR) と人工知能 (AI) の潜...
人工知能はここ数年で大きな進歩を遂げました。 AIテクノロジーで生み出されるソリューションは想像を絶...
デジタル経済の時代では、目に見えず、実体のないアルゴリズムが常に消費者の選択に影響を与えます。近年、...
[[408920]]編集部注:人工知能(AI)の発達により、人々は徐々に未来についてより多様な想像...