機械学習アプリケーションが増加するにつれて、多くの人が機械学習トレーニング データを使用する利点を理解する必要があります。
機械学習をベースにしたシステムを使用する場合は、トレーニング データに関する知識が必要です。データをモデルトレーニング用に AI モデルにロードする前に、データが正しくフォーマットされ、その正確性が確保されている必要があります。 パブリック クラウドで一般的な機械学習システムを使用して不正検出エンジンを作成しているとします。まず、モデルをトレーニングするためのデータセットを作成する必要があります。この場合は、不正とマークされた何百万もの取引記録です。このようにして、モデルはどれが不正である可能性があり、どれがそうでないかを学習できます。もちろん、トレーニング データにはさまざまな種類があり、ラベル付きのものもあれば、ラベルなしのものもあります。 一度トレーニングすると、モデルは経験を通して学習するのではなく、起こりうる不正行為について学習することでトレーニングを継続できます。ユーザーに時間があれば、人間や他のシステムによって不正とフラグが付けられた取引を監視することで、モデルが自らトレーニングすることができます。 この AI トレーニング方法の印象的な点は、ユーザーが完全なトレーニング データセットを必要とすることです。場合によっては、トレーニング データはパブリック プロキシまたは独自のプロキシから取得できます。ほとんどの場合、ユーザーは機械学習モデルのトレーニング用に独自のデータをフォーマットできます。しかし、いつでもどこでもトレーニングできる機械学習モデルはあるのでしょうか? この考えは新しいものではありません。 AIが登場して以来、人々はAIエンジンが別のAIエンジンを教える、つまりトレーニングデータを共有することを望んできました。あるいは、自動化された直接的なやり取りを通じて知識と経験を共有するのがさらに良いでしょう。あるいは、AI エンジン メンターを通じて外部の経験を提供し、AI モデルの価値と効果を高めます。 これは言うのは簡単ですが、実行するのは難しいです。機械学習エンジンは、同じソフトウェアを使用している場合でも、通常は相互に通信しません。独立した学習者向けに、また AI 以外のシステムや人間と対話できるように、ゼロから設計する必要があります。ただし、ほとんどのベンダーは AI エンジン間のトレーニングを行っています。 近い将来、ゲームチェンジャーとなる可能性のあるいくつかの大きなトレンドが見られるでしょう。
私がこのことを取り上げる理由は、機械学習やディープラーニングを含む AI からより多くの価値を得たいのであれば、ほとんどの企業がこれらのトレンドを理解する必要があるからです。さらに、多くの企業は、機械学習を適切に機能させるのに十分なトレーニングデータがないことに苦労しています。これは両方の問題に対する良い解決策となるかもしれません。 |
<<: RPA大手UiPath独占インタビュー:やがて「1人1台ロボット」の時代が到来
>>: 景気後退は大きな不確実性をもたらします。AIに投資する際に理解すべき重要なポイントは何でしょうか?
人工知能 (AI) は、デジタル顧客サービス アシスタント、自動運転車、無人倉庫のロボットなど、多く...
モノのインターネット (IoT) は、接続デバイスの数の急増により、10 年以上にわたって着実に成長...
新たな調査によると、従業員の15%がChatGPTに会社のデータを頻繁にアップロードしており、そのデ...
大型模型の分野におけるトランスフォーマーの地位は揺るぎない。しかし、モデルのサイズが拡大し、処理する...
人工知能 (AI) と機械学習 (ML) は成長サイクルのピークにあるかもしれませんが、だからといっ...
運輸省によると、運輸省はこのほど「自動運転とインテリジェント船舶の試験運用を組織することに関する通知...
7月19日、「新バージョンの文心易言の性能はChatGPT 3.5を上回り、これは我が国の関連技術作...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
今日、言語を超えた効果的なコミュニケーションはこれまで以上に重要になっています。企業が新しい市場に進...
機械学習 (ML) とディープラーニング (DL) の技術を包括する用語である人工知能 (AI) は...
[[195357]]パーソナライズされた推奨はビッグデータ時代に欠かせない技術であり、電子商取引、情...