この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。 重要なプロジェクトを作成するときは、他の人から学んだことや仕事で気づいたことすべてを文書化します。これは私にとって必須です。プロジェクトでは処理すべきことが非常に多く(議論、準備、質問、モックアップ、微調整など)、忘れてしまいやすいからです。 タスク リストは、開発者が次のステップを完了できるようにガイドし、各タスクが正常に実行されたかどうかを確認するように促します。出発点を見つけるのが難しい場合もありますが、タスク リストは開発者が適切なソースから適切な情報 (データ) を取得し、関係を構築して関連する洞察を明らかにするのに役立ちます。 ベストプラクティスは、プロジェクトのあらゆる部分をチェックすることです。アトゥル・ガワンデは『チェックリスト宣言』の中でこう述べています。「私たちが知っていることの量と複雑さは、そのメリットを正確に、安全に、そして確実に伝える私たちの能力を上回っています。」 したがって、この簡潔で明確なプロジェクト タスク リストを確認してください。作業負荷を軽減し、成果を向上させるのに役立ちます。 機械学習プロジェクトのチェックリスト ほぼすべての機械学習プロジェクトで実行する必要がある 8 ~ 10 のステップがあり、そのうちのいくつかは順番に交互に実行できます。 1. 問題を大まかに定義する 問題のビジネス ロジックを理解して明確にするには、タスク リストで次の情報を提供する必要があります。
2. データソースを特定し、データを取得する ほとんどの場合、データがあり、受信したデータをより有効に活用するために関連する質問を定義する場合は、最初のステップの前にこのステップを実行できます。 問題の定義に基づいて、データベース、データ リポジトリ、センサーなどのデータのソースを決定する必要があります。アプリケーションを本番環境にデプロイするには、受信データがシステムに流れ続けるようにデータ パイプラインを開発して、この手順を自動化する必要があります。
画像ソース: unsplash 3. データの初期調査 このステップでは、研究結果、予測、目標に影響を与えるすべてのデータ機能が検出されます。膨大なデータ ブロックがある場合は、この手順でサンプリングして、分析をより管理しやすくします。以下の手順に従ってください。
4. データを準備するための探索的データ分析 次は、データ変換、クリーニング、機能選択/設計、スケーリングの機能を定義して、前のステップで得られた結果を実装します。
5. ベースラインモデルを開発し、他のモデルを検討して最適なモデルを選択する 他のすべての複雑な機械学習モデルのベースラインとして機能する非常に基本的なモデルを作成します。次の手順に従ってください。
6. 選ばれたモデルを微調整し、アンサンブル法をチェックする これは、最終的な解決策に近づくための重要なステップの 1 つです。主な手順は次のとおりです。
7. コードを文書化し、解決策を伝える コミュニケーション プロセスは多面的であるため、常に既存および潜在的なすべての利害関係者を念頭に置いてください。主な手順は次のとおりです。
8. モデルとモニターを本番環境にデプロイする プロジェクトでライブ データでのデプロイメントのテストが必要な場合は、すべてのプラットフォーム (Web、Android、iOS) で使用される Web アプリケーションまたは REST API を作成する必要があります。主な手順(プロジェクトによって異なります)は次のとおりです。
単にスクリプトに従うのではなく、プロジェクトの複雑さに合わせてチェックリストをカスタマイズできます。これを基盤として、完璧な機械学習プロジェクトが間もなく完成します。 |
<<: Sentinel のコールドスタート電流制限アルゴリズム
[51CTO.com からのオリジナル記事] キーワードマッチングと手動で記述された応答ルールに基づ...
[[377047]] [51CTO.com からのオリジナル記事] データマイニングと機械学習は、今...
[[199775]]現在、人工知能はますます人気が高まっている分野となっています。普通のプログラマ...
UiPath は、世界的なロボティック プロセス オートメーション (RPA) 分野の主要プラットフ...
アラブ首長国連邦(UAE)の企業がほぼ全面的にクラウドに移行する前に、政府はすでに大規模なデジタル変...
人工知能の分野では、大規模なモデルを使用してインテリジェントエージェントを制御することは避けられない...
[[255694]]プロフェッショナルソフトウェア開発における人工知能 (AI) の急速な発展により...
AMD のソフトウェアおよびハードウェア システムは、GPT-3.5 レベルで大規模なモデルをトレ...
「小都小都」、「私はここにいます」 - 数百万の家族と小都の間の日常会話のシーンがCCTVニュースス...
上海ノキアベル株式会社(以下、「ノキアベル」)は、ノキアグループと中国保利集団の子会社である華新郵電...