データ拡張とは何ですか?

データ拡張とは何ですか?

十分なトレーニング データがあれば、機械学習モデルは非常に優れたパフォーマンスを発揮します。残念ながら、多くのアプリケーションでは、高品質なデータへのアクセスが依然として障壁となっています。

この問題に対する 1 つのアプローチは、「データ拡張」、つまり既存のトレーニング例から新しいトレーニング例を生成する手法です。データ拡張は、データに制約のある環境下で機械学習モデルのパフォーマンスと精度を向上させる低コストで効果的な方法です。

機械学習モデルの過剰適合

機械学習モデルが限られた数の例でトレーニングされると、「過剰適合」する傾向があります。 「オーバーフィッティング」は、機械学習モデルがトレーニング例に対して正確に機能するが、未知のデータに対して一般化できない場合に発生します。

機械学習における「過剰適合」を回避するには、別のアルゴリズムを選択したり、モデルの構造を変更したり、パラメータを調整したりするなど、いくつかの方法があります。しかし、最終的には、「過剰適合」の主な解決策は、トレーニング データセットにさらに高品質のデータを追加することです。

たとえば、画像分類タスクに特に適した機械学習アーキテクチャである畳み込みニューラル ネットワーク (CNN) を考えてみましょう。大規模で多様なトレーニング例がなければ、CNN は最終的に現実世界の画像を誤分類することになります。一方、さまざまな角度やさまざまな照明条件での物体の画像で CNN をトレーニングすると、現実世界の物体を認識する能力が大幅に強化されます。

ただし、追加のトレーニング例を収集するには、コストがかかり、時間がかかり、場合によっては不可能になることもあります。この課題は、教師あり学習アプリケーションではさらに困難になります。なぜなら、トレーニング例には人間の専門家がラベルを付ける必要があるからです。

データ拡張

トレーニング データセットの多様性を高める 1 つの方法は、既存のデータのコピーを作成し、それに小さな変更を加えることです。これを「データ拡張」と呼びます。

たとえば、画像分類データセットにアヒルの画像が 20 枚あるとします。アヒルの画像のコピーを作成し、水平方向に反転することで、「アヒル」クラスのトレーニング例の数が 2 倍になりました。回転、せん断、拡大縮小、移動などの他の変換も使用できます。これらの変換を組み合わせて、独自のトレーニング例のセットをさらに拡張することもできます。

データ拡張は幾何学的演算に限定される必要はありません。ノイズを追加したり、色設定を変更したり、ぼかしフィルターやシャープフィルターなどの他の効果を適用したりすることで、既存のトレーニング例を新しいデータとして使用することもできます。

データ拡張の例

データ拡張は、すでにラベルがあり、新しい例に注釈を付ける追加の作業が必要ないため、教師あり学習に特に役立ちます。データ拡張は、教師なし学習、対照学習、生成モデルなど、他の種類の機械学習アルゴリズムにも役立ちます。

データ拡張は、コンピューター ビジョン アプリケーション用の機械学習モデルのトレーニングにおける標準的な方法となっています。一般的な機械学習およびディープラーニング プログラミング ライブラリには、データ拡張を機械学習トレーニング パイプラインに統合するための使いやすい機能があります。

データ拡張は画像に限定されず、他の種類のデータにも適用できます。テキスト データセットの場合、名詞と動詞を同義語に置き換えることができます。オーディオ データでは、ノイズを追加したり再生速度を変更したりすることでトレーニング例を変更できます。

データ拡張の限界

データ拡張は、すべてのデータの問題に対する万能薬ではありません。これは、機械学習モデルの無料パフォーマンス向上ツールと考えることができます。ターゲット アプリケーションに基づいて、十分な例を含むかなり大きなトレーニング データセットが必要になります。

アプリケーションによっては、トレーニング データが限られているため、データ拡張が役に立たない場合があります。このような場合、データ拡張を使用する前に、最小しきい値に達するまでさらにデータを収集する必要があります。場合によっては、転移学習を使用できます。転移学習では、一般的なデータセット (ImageNet など) で機械学習モデルをトレーニングし、その後、ターゲット アプリケーションの限定されたデータで上位層を微調整して再利用します。

データ拡張では、トレーニング データセットのバイアスなどの他の問題にも対処しません。クラスの不均衡などの他の潜在的な問題に対処するために、データ拡張プロセスも調整する必要があります。

正しく使用すれば、データ管理は機械学習エンジニアのツールボックスにおける強力なツールとなり得ます。

<<:  OpenAI が GPT-3 の微調整機能を公開、コマンド 1 行で実現可能!精度は最大4倍に向上します

>>:  AIoT: IoTと人工知能の完璧な組み合わせ

ブログ    
ブログ    
ブログ    

推薦する

新しいインフラストラクチャの何が新しいのでしょうか?

「新インフラ」と呼ばれる新しいインフラは、今年の両会で国家計画となって以来、ホットな言葉になってい...

科学データ研究のための人工知能アシスタントMATAが特許を取得

サザンメソジスト大学(SMU)とNASAの研究者らは、科学的データに関する質問に答えることができる人...

人工知能は政治的安全保障と密接に関係している

習総書記は「人工知能の発展における潜在的リスクの評価と予防を強化し、国民の利益と国家の安全を守り、人...

NvidiaはAIを使用してGPU演算回路を設計します。これは最先端のEDAよりも25%小さく、より高速で効率的です。

膨大な数の演算回路を搭載した NVIDIA GPU により、AI、高性能コンピューティング、コンピュ...

Huang 氏の最新インタビュー: 30 年前に戻れるなら、私は NVIDIA を立ち上げることはなかったでしょう!

ベルサイユの中国人起業家サークルに、ジェンセン・フアンというもう一人の大物が加わった。最近の公開イン...

トヨタのAIの旅:車だけにとどまらない

今日の自動車メーカーは、市場での地位を今後も維持したいのであれば、強力な自動運転技術を確立しなければ...

Rosetta はプライバシー コンピューティングと AI をどのように結び付けるのでしょうか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ディープラーニングに加えて、これらの開発の方向性も理解する必要があります

[[214266]] AI の究極の未来は人間の知能に到達し、それを上回ることであることに疑いの余地...

Ali Wensheng ビデオが Gen-2 と Pika に挑戦、1280×720 の解像度で圧迫感なし、3500 万のテキスト ビデオ表示効果

ヴィンセントのビデオはどの程度詳細にできますか?最近、アリババの調査により、1280×720 の解像...

この病院のAI看護師は、人間の看護師の作業負荷を30%削減するためにオンライン化されました

[[270607]]看護師は医療現場を問わず需要が高いです。米国労働統計局の報告によると、看護師の求...

...

AIとIoTがサプライチェーンにもたらす効果

サプライ チェーン管理は経済の生命線であり、コストを最適化し、無駄を最小限に抑えながら、適切な製品を...