この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。 重要なプロジェクトを作成するときは、他の人から学んだことや仕事で気づいたことすべてを文書化します。これは私にとって必須です。プロジェクトでは処理すべきことが非常に多く(議論、準備、質問、モックアップ、微調整など)、忘れてしまいやすいからです。 タスク リストは、開発者が次のステップを完了できるようにガイドし、各タスクが正常に実行されたかどうかを確認するように促します。出発点を見つけるのが難しい場合もありますが、タスク リストは開発者が適切なソースから適切な情報 (データ) を取得し、関係を構築して関連する洞察を明らかにするのに役立ちます。 ベストプラクティスは、プロジェクトのあらゆる部分をチェックすることです。アトゥル・ガワンデは『チェックリスト宣言』の中でこう述べています。「私たちが知っていることの量と複雑さは、そのメリットを正確に、安全に、そして確実に伝える私たちの能力を上回っています。」 したがって、この簡潔で明確なプロジェクト タスク リストを確認してください。作業負荷を軽減し、成果を向上させるのに役立ちます。 機械学習プロジェクトのチェックリスト ほぼすべての機械学習プロジェクトで実行する必要がある 8 ~ 10 のステップがあり、そのうちのいくつかは順番に交互に実行できます。 1. 問題を大まかに定義する 問題のビジネス ロジックを理解して明確にするには、タスク リストで次の情報を提供する必要があります。
2. データソースを特定し、データを取得する ほとんどの場合、データがあり、受信したデータをより有効に活用するために関連する質問を定義する場合は、最初のステップの前にこのステップを実行できます。 問題の定義に基づいて、データベース、データ リポジトリ、センサーなどのデータのソースを決定する必要があります。アプリケーションを本番環境にデプロイするには、受信データがシステムに流れ続けるようにデータ パイプラインを開発して、この手順を自動化する必要があります。
画像ソース: unsplash 3. データの初期調査 このステップでは、研究結果、予測、目標に影響を与えるすべてのデータ機能が検出されます。膨大なデータ ブロックがある場合は、この手順でサンプリングして、分析をより管理しやすくします。以下の手順に従ってください。
4. データを準備するための探索的データ分析 次は、データ変換、クリーニング、機能選択/設計、スケーリングの機能を定義して、前のステップで得られた結果を実装します。
5. ベースラインモデルを開発し、他のモデルを検討して最適なモデルを選択する 他のすべての複雑な機械学習モデルのベースラインとして機能する非常に基本的なモデルを作成します。次の手順に従ってください。
6. 選ばれたモデルを微調整し、アンサンブル法をチェックする これは、最終的な解決策に近づくための重要なステップの 1 つです。主な手順は次のとおりです。
7. コードを文書化し、解決策を伝える コミュニケーション プロセスは多面的であるため、常に既存および潜在的なすべての利害関係者を念頭に置いてください。主な手順は次のとおりです。
8. モデルとモニターを本番環境にデプロイする プロジェクトでライブ データでのデプロイメントのテストが必要な場合は、すべてのプラットフォーム (Web、Android、iOS) で使用される Web アプリケーションまたは REST API を作成する必要があります。主な手順(プロジェクトによって異なります)は次のとおりです。
単にスクリプトに従うのではなく、プロジェクトの複雑さに合わせてチェックリストをカスタマイズできます。これを基盤として、完璧な機械学習プロジェクトが間もなく完成します。 |
<<: Sentinel のコールドスタート電流制限アルゴリズム
車線は高レベルのセマンティクスを備えた交通標識であり、視覚ナビゲーション システムでは特に重要です。...
[[434146]]ビジネス インテリジェンス テクノロジーが推進する市場において、人工知能は企業に...
[[201461]] 2016年の英国の電力構成は過去60年間で最もクリーンとなり、主に風力と太陽光...
[[286539]]ビッグデータダイジェスト制作著者: 張大毓如、陳若夢春節が近づいてきました!叔母...
著者: Sun Yue、所属部署: 中国移動 (杭州) 情報技術有限公司 | 中国移動杭州 R&am...
DeepMind がまた別の「悪役」を生み出しました! [[428779]]これらの小人たちは、ア...
スマート病院とは何ですか?最も伝統的な病院でさえ、人、プロセス、資産の広大なネットワークを持つ複雑な...
ビッグデータダイジェスト制作出典: lambdalabs編纂者:張秋月ディープラーニング モデルが強...
AI は、モノのインターネットやプライベート 5G ネットワークなど、複数の用途をサポートするために...
ロボットの学習方法を開発する際に、大規模で多様なデータセットを統合し、強力で表現力豊かなモデル (T...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[248753]]児童市場は非常に特殊で、この層は購買力がないにもかかわらず、消費市場の価値は数...
人工知能の発展を理解したい場合、または人工知能の基本的な応用を理解したい場合は、まずいくつかの基本的...