今日、機械学習は組織の複数の事業部門にわたって重要な機能になりつつあります。機械学習プログラムはデータに基づいて実行され、よく整備されたエンジンのように、機械をトレーニングするには大量のデータが必要です。ただし、望ましい最終結果を達成するには、大量のデータよりも、優れたデータ品質が重要です。 データ管理はデータの品質を扱い、分析アプリケーションによって提供される出力を信頼できるものにします。分析アプリケーションにより、企業は業界内での自社の位置を把握できます。テクノロジー業界で現在行われている分析の進歩は目覚ましいものですが、データ品質の点では、まだ標準に達しておらず、機械学習プログラムに依存する企業にとって有害となる可能性があります。
よりクリーンなデータ 機械学習システムにはさらに多くのデータが必要ですが、そのデータはどこにあるのでしょうか? 小売業界を例にとると、データは何年も収集できます。データが抽出され収集されたら、その品質を判断する必要があります。機械学習エンジニアの仕事は、まさにそれを実行し、ビジネスの観点からデータを理解可能なコンテキストに配置することです。 機械学習エンジニアの責任 エンジニアの第一の責任は、顧客と顧客ベースのニーズを理解することです。つまり、企業はまず、機械学習を特定のビジネス モデルに適合させる方法について指導してくれる機械学習コンサルタントと協力する必要があります。次に、機械学習エンジニアはドメイン専門家の協力を得てシステムからのデータの処理を開始し、データにラベルを付けて分類します。それが問題なのです。ほとんどの機械学習プロジェクトは、ドメインの専門家なしで実施されます。これにより、データの誤分類、オペレーターのエラー、または機械学習システムによる出力に関する誤った仮定が発生する可能性があります。 機械学習エンジニアは、最初からデータの分類にほとんどの時間を費やすため、機械学習製品に最初から不適切なデータが与えられると、そこからエラーが悪化します。これにより、教師なし機械学習が実現しました。 教師ありおよび教師なし機械学習 教師あり機械学習は、入力/出力ペアの例を使用して、関数を対応する用語にマッピングするプロセスです。このようなモデルを使用すると、データ エラーなしで最初からパフォーマンスを測定できます。 教師なし機械学習はこれに矛盾します。ラベル付けされたデータがなく、アルゴリズムのパフォーマンスを測定する実用的な方法がありません。このようなプログラムの目的は、データの基礎となる構造を見つけ出し、それをさまざまなカテゴリに分類することです。しかし、教師なし機械学習には利点があります。これらのアルゴリズムは、人間には馴染みのないデータのパターンを認識することができます。したがって、機械学習のアプローチを選択するときは、ビジネスにおけるその使用方法を理解することが重要です。 機械学習ではデータの品質が重要です。必要なデータ品質がビジネス要件を満たしていない場合、教師なし機械学習が救世主となります。 AI ベースのプログラムでデータを評価することで、正確なビジネス洞察を提供できます。しかし、ビジネスに万能な解決策は存在しません。 |
<<: 自動運転の 6 つのレベル: 真の無人運転までどれくらいの距離があるのでしょうか?
この記事では、さまざまな活性化関数を紹介し、活性化関数の長所と短所を比較します。この記事は、人工ニュ...
最近、マスク氏の伝記「イーロン・マスク:伝記」が国内外でベストセラーとなった。この本には、マスク氏の...
[[423663]] 2021-22シーズンのイングランド・プレミアリーグが開幕し、初日にアーセナ...
データセンターは現代生活に欠かせないものです。あらゆるものがインターネットでつながっているこの時代に...
近い将来、人間はロボットにやり方を一度見せるだけで、タスクの実行方法を教えることができるようになるか...
「スマートシティ」という概念は何十年も前から存在していたが、その最新版では、住民の生活を向上させるた...
2023年杭州雲奇大会において、アリババクラウド最高技術責任者の周景仁氏は、数千億のパラメータを持つ...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
エヌビディアは木曜日、同社の高速コンピューティングプラットフォームを使用して、世界最速のAIスーパー...
クルーズ社の自動運転意思決定計画および制御部門の責任者であるブランドン・バッソ氏は、コロンビア大学で...
ナレッジグラフ|データの価値を活かすのは「グラフ」ナレッジグラフは、応用数学、グラフィックス、情...