機械学習アプリケーションが増加するにつれて、多くの人が機械学習トレーニング データを使用する利点を理解する必要があります。
機械学習をベースにしたシステムを使用する場合は、トレーニング データに関する知識が必要です。データをモデルトレーニング用に AI モデルにロードする前に、データが正しくフォーマットされ、その正確性が確保されている必要があります。 パブリック クラウドで一般的な機械学習システムを使用して不正検出エンジンを作成しているとします。まず、モデルをトレーニングするためのデータセットを作成する必要があります。この場合は、不正とマークされた何百万もの取引記録です。このようにして、モデルはどれが不正である可能性があり、どれがそうでないかを学習できます。もちろん、トレーニング データにはさまざまな種類があり、ラベル付きのものもあれば、ラベルなしのものもあります。 一度トレーニングすると、モデルは経験を通して学習するのではなく、起こりうる不正行為について学習することでトレーニングを継続できます。ユーザーに時間があれば、人間や他のシステムによって不正とフラグが付けられた取引を監視することで、モデルが自らトレーニングすることができます。 この AI トレーニング方法の印象的な点は、ユーザーが完全なトレーニング データセットを必要とすることです。場合によっては、トレーニング データはパブリック プロキシまたは独自のプロキシから取得できます。ほとんどの場合、ユーザーは機械学習モデルのトレーニング用に独自のデータをフォーマットできます。しかし、いつでもどこでもトレーニングできる機械学習モデルはあるのでしょうか? この考えは新しいものではありません。 AIが登場して以来、人々はAIエンジンが別のAIエンジンを教える、つまりトレーニングデータを共有することを望んできました。あるいは、自動化された直接的なやり取りを通じて知識と経験を共有するのがさらに良いでしょう。あるいは、AI エンジン メンターを通じて外部の経験を提供し、AI モデルの価値と効果を高めます。 これは言うのは簡単ですが、実行するのは難しいです。機械学習エンジンは、同じソフトウェアを使用している場合でも、通常は相互に通信しません。独立した学習者向けに、また AI 以外のシステムや人間と対話できるように、ゼロから設計する必要があります。ただし、ほとんどのベンダーは AI エンジン間のトレーニングを行っています。 近い将来、ゲームチェンジャーとなる可能性のあるいくつかの大きなトレンドが見られるでしょう。
私がこのことを取り上げる理由は、機械学習やディープラーニングを含む AI からより多くの価値を得たいのであれば、ほとんどの企業がこれらのトレンドを理解する必要があるからです。さらに、多くの企業は、機械学習を適切に機能させるのに十分なトレーニングデータがないことに苦労しています。これは両方の問題に対する良い解決策となるかもしれません。 |
<<: RPA大手UiPath独占インタビュー:やがて「1人1台ロボット」の時代が到来
>>: 景気後退は大きな不確実性をもたらします。AIに投資する際に理解すべき重要なポイントは何でしょうか?
これは大問題だ! Google が大きな動きを見せました!昨日、フェイフェイ・リーとジェフ・ディーン...
2019年10月25日、人工知能の新興企業OpenAIが非営利団体から「営利企業」へと転換した際、シ...
今日では、かつてないほど多くのデータが生成されています。データ分析ツールの発達により、あらゆる分野の...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
近年、インターネットの急速な発展に伴い、通信ニーズが継続的に高まり始めており、通信保証能力がますます...
すごいですね、ボストン・ダイナミクスのロボット犬が直接話せるようになりました。そして、Siriの「人...
この記事では、まず初心者が知っておくべき機械学習 (ML) アルゴリズムのトップ 10 を紹介し、い...
OpenAIの共同創設者であるヴォイチェフ・ザレンバ氏はポッドキャストで、OpenAIがロボット工学...
最近、米国の市場調査機関であるナビガントリサーチが、自動運転の競争力に関する新たなランキングを発表し...
人工知能と新型コロナウイルスには共通点がないように思えますが、本質的には同じものです。 [[4391...
私はアークティック・モンキーズが大好きですが、彼らはもう何年も新しいシングルをリリースしていません。...
1. 要件の説明Linux システムの複数のディレクトリに、同じプレフィックスとサフィックスを持つフ...