概念とそれがビジネス目標に与える影響を学ぶことは非常に重要です。 アルゴリズムの選択 問題の定義を少し変更するだけで、その問題を解決するためにまったく異なるアルゴリズムが必要になるか、少なくとも異なるデータ入力を使用して異なるモデルを構築する必要がある場合があります。ユーザーの写真の種類を識別できる出会い系サイトでは、クラスタリングなどの教師なし学習手法を使用して共通のテーマを識別できます。一方、サイトが特定の人物にデートの相手を推薦したい場合、その人物がすでに見た写真など、その人に固有の入力データに基づく教師あり学習を使用する可能性があります。 特徴選択 機械学習モデルはデータ内のパターンを識別します。モデルに入力されるデータは、特徴 (変数または属性とも呼ばれます) に編成されます。これらは、予測または識別する現象の側面を説明する、関連性のある、ほとんどが独立したデータです。 先ほど述べた、ローン申請者へのアウトリーチを優先したいと考えていた会社の例を見てみましょう。問題を「コンバージョンの可能性に基づいて顧客に優先順位を付ける」と定義すると、会社のさまざまなアウトリーチ キャンペーンに対する同様の顧客の応答率を含む機能が得られます。問題を「ローンを返済する可能性が最も高い顧客を優先する」と定義すると、これらの特徴は顧客の可能性の評価に関連しないため、得られません。 目的関数の選択 目的関数は、最適化する目標、またはモデルが予測しようとしている結果です。たとえば、ユーザーが興味を持ちそうなアイテムを推奨する場合、モデルの出力は、ユーザーがそのアイテムを見たときにクリックする確率、またはユーザーがそのアイテムを購入する確率になる可能性があります。目的関数の選択は、主にビジネス目標によって異なります。この例では、ユーザー エンゲージメント (目的関数はクリック数または滞在時間) と収益 (目的関数は購入数) のどちらに関心がありますか? 考慮すべきもう 1 つの重要な要素は、データの可用性です。アルゴリズムが学習するには、ポジティブ (ユーザーが見てクリックした製品) またはネガティブ (ユーザーが見たがクリックしなかった製品) として「ラベル付け」された大量のデータ ポイントを提供する必要があります。 機械学習モデルを開発するには? 概要: 優れた機械学習モデルの作成は、他の製品の作成と同じです。まず、アイデア出しから始め、解決すべき問題と潜在的な解決策を考えます。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストすることができます。この記事では、その方法を段階的に見ていきましょう。 モデリング手順の概要 大まかに言えば、優れた機械学習モデルを作成することは、他の製品を構築することと同じです。つまり、アイデア創出、つまり解決すべき問題といくつかの潜在的な解決策を考えることから始まります。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストできます。ソリューションが市場に受け入れられるほど良くなるまで、アイデア創出、プロトタイピング、テストを繰り返す必要があります。その時点でソリューションを製品化し、リリースします。それでは、各段階を詳しく見ていきましょう。 データは機械学習の非常に重要な要素であるため、製品開発プロセスの上にデータを重ねる必要があります。そのため、プロセスは次のようになります。
概念 このフェーズの目標は、モデルが解決する主要な問題、目的関数、および潜在的な入力をモデル全体と一致させることです。
データ準備 このフェーズの目標は、生データを収集し、それをプロトタイプ モデルの入力として使用することです。生データを入力データとして使用できるようにするには、生データに対して複雑な変換を実行する必要がある場合があります。たとえば、あなたの特徴の 1 つが、消費者があなたのブランドについてどう思っているかだとします。まず、消費者があなたのブランドについて話している関連ソースを見つける必要があります。ブランド名に一般的な単語(「リンゴ」など)が含まれている場合は、プロトタイプを構築する前に、ブランド名をその一般的な意味(果物に関連)から区別し、感情分析モデルにかける必要があります。すべての機能の構築が複雑というわけではありませんが、一部の機能には多くの作業が必要になる場合があります。 このフェーズに含まれる内容を詳しく見てみましょう。
プロトタイプとテスト このフェーズの目標は、モデルのプロトタイプを取得し、それをテストし、本番環境で使用できるほど優れたモデルが得られるまで反復することです。
製品化 プロトタイプ モデルがビジネス上の問題を十分に解決し、実稼働に移行できるようになったときに、この段階に到達します。まだ完全な製品化の準備ができていない場合は、まずモデルをどの程度まで拡張するかを決定する必要があることに注意してください。たとえば、映画推薦ツールの場合、まず少数のユーザーに推薦サービスを提供して、各ユーザーに完全なユーザー エクスペリエンスを提供する必要があります。この場合、モデルは、各ユーザーとの関連性に応じてデータベース内の各映画をランク付けする必要があります。これは、単にアクション映画を推奨することとは異なる拡張機能の要件です。 それでは、モデルの製品化に関する技術的な詳細をいくつか見ていきましょう。
これまで説明してきたのは概念的なプロセスです。現実には、境界は曖昧であることが多く、異なる段階の間を行ったり来たりする必要があることがよくあります。データの供給に満足できず、最初からやり直すことを検討したり、モデルが製品化された後にモデルがうまく機能しないことがわかり、戻ってプロトタイプを再構築しなければならない場合もあります。 |
<<: 2030年にAIは人間のためにどんな仕事を創出できるでしょうか?
>>: タオバオの顔面を平手打ちして電子商取引を破壊しよう!このファッション会社はアルゴリズムを使って新しい小売業をリードしている
クイズ番組「ジェパディ」の優勝者や囲碁の名人から、広告に関連した不名誉な人種プロファイリングまで、私...
人工知能といえば、映画「アイアンマン」に登場する賢い執事ジャービスを思い浮かべる人もいるかもしれませ...
どの企業もある程度はテクノロジーを取り入れる必要があったため、こうした急成長の仕事にもその傾向が反映...
AI 生成コンテンツは、現在の人工知能分野で最もホットなトピックの 1 つとなっており、この分野の最...
315 Gala で摘発された企業は、業界内ではほんの少数派です。ユーザーのプライバシーを侵害するア...
[[339371]] AIが人間の学習方法を模倣したら何が起こるでしょうか? 8月26日、アリババD...
本日は、Google Research とプリンストン大学の研究者グループが言語モデルにおける推論と...
伝統的な教育方法は、過去 1 世紀か 2 世紀の間にあまり変わっていません。通常、生徒は教室で教師の...
モバイルインターネット時代の到来により、AIは前例のない成果を達成し、人々の生活のあらゆる側面に入り...
[[376593]] 1月18日の光明日報によると、近年、中国の製造業は「機械が人間に取って代わる」...
[[121972]]基本的なプログラミングアルゴリズム(I)基本的なプログラミングアルゴリズム(I...
[[342735]] [51CTO.com クイック翻訳] 人工知能(AI)が今日、さまざまな業界で...
人工知能の進歩は2024年まで大きな原動力となる可能性が高く、ビッグデータの課題、つまりそれをどのよ...