人間の学習を模倣した、データセット拡張の新しいパラダイム GIF フレームワークが登場

人間の学習を模倣した、データセット拡張の新しいパラダイム GIF フレームワークが登場


  • 論文リンク: https://browse.arxiv.org/pdf/2211.13976.pdf
  • GitHub: https://github.com/Vanint/DatasetExpansion

周知のとおり、ディープ ニューラル ネットワークのパフォーマンスはトレーニング データの量と品質に大きく依存するため、ディープラーニングを小規模なデータ タスクに広く適用することは困難です。たとえば、医療などの分野における小規模なデータ応用シナリオでは、大規模なデータセットを手動で収集してラベル付けすることは、多くの場合、時間がかかり、労力がかかります。このデータ不足の問題に対処し、データ収集のコストを最小限に抑えるために、本論文では、新しいデータを自動的に生成して、対象タスクの小さなデータセットをより大きく、より情報量の多いデータセットに拡張することを目的とした、データセット拡張の新しいパラダイムを検討します。これらの拡張データセットは、モデルのパフォーマンスと一般化能力の向上を目的としており、さまざまなネットワーク構造のトレーニングに使用できます。

この研究では、既存の方法を使用するだけではデータセットを効果的に拡張できないことが判明しました。 (1)ランダムデータ拡張は主に画像の表面的な視覚的特徴を変化させるものであり、新たな物体内容を持つ画像を作成することはできない(例えば、下図の蓮はそのままであり、新たな蓮は生成されない)。そのため、導入される情報量は限られている。さらに深刻なのは、ランダムなデータ拡張によって医療画像の病変(変異)の位置が切り取られ、サンプルの重要な情報が削減されたり、ノイズの多いデータが生成されたりすることです。 (2)事前学習済みの生成(拡散)モデルを直接使用してデータセットを拡張しても、対象タスクにおけるモデルのパフォーマンスを効果的に向上させることはできない。これは、これらの生成モデルの事前トレーニング データは、ターゲット データとの分布の差が大きいことが多く、生成したデータとターゲット タスクの間に一定の分布とカテゴリのギャップが生じ、生成されたサンプルに正しいカテゴリ ラベルが付いていて、モデルのトレーニングに有益であることを保証できないためです。

データセットをより効果的に拡張するために、この研究では人間の連想学習を調査しています。つまり、ある物体が与えられると、人間は蓄積された事前知識を使用して、その物体のさまざまなバリエーション(下の写真の犬など)をさまざまなタイプ、色、形、背景で簡単に想像することができます。この想像力豊かな学習プロセスは、単に写真内の動物の外観を変えるだけでなく、豊富な事前知識を適用して新しい情報を含むさまざまな写真を作成するため、データセットの拡張に非常に役立ちます。

しかし、データ想像力のための事前モデルとして人間を直接モデル化することはできません。幸いなことに、最近の生成モデル (Stable Diffusion、DALL-E2 など) は、大規模なデータセットの分布に適合し、豊かでリアルな画像を生成する優れた能力を実証しています。この論文では、事前にトレーニングされた生成モデルを事前モデルとして使用し、その強力な事前知識を活用して、小さなデータセットを効率的に関連付けて増幅するというアイデアが生まれました。

上記のアイデアに基づいて、この研究では新しいガイド付き想像力フレームワーク (GIF) を提案します。この方法は、自然画像や医療画像タスクにおけるディープニューラルネットワークの分類性能と一般化能力を効果的に向上させ、手動によるデータ収集とラベル付けによって生じる膨大なコストを大幅に削減します。同時に、拡張されたデータセットは、モデルの転移学習を促進し、ロングテールの問題を軽減するのにも役立ちます。

次に、データセット拡張のこの新しいパラダイムがどのように設計されているかを見てみましょう。

方法

データセット拡張の課題とガイドラインデータセット拡張方法を設計する上で、2つの重要な課題があります。(1) 生成されたサンプルに正しいカテゴリラベルを付けるにはどうすればよいか? (2)生成されたサンプルにモデルのトレーニングを容易にするための新しい情報が含まれていることをどのように確認するか?これら2つの課題に対処するため、本研究では広範な実験を通じて、(1)カテゴリー一貫性情報の強化、および(2)サンプル多様性の向上という2つの増幅ガイダンス基準を発見しました。

方法論的枠組み発見された増幅ガイダンス基準に基づいて、この研究ではガイド付き想像力増幅フレームワーク (GIF) を提案します。各入力シードサンプル x に対して、GIF はまず前世代モデルの特徴抽出器を使用してサンプル特徴 f を抽出し、次に特徴に対してノイズ摂動を実行します。ノイズ (z, b) を設定する最も簡単な方法はガウスランダムノイズを使用することですが、生成されたサンプルに正しいカテゴリラベルが付けられ、より多くの情報が得られることを保証することはできません。したがって、効果的なデータセット拡張のために、GIF は発見された拡張ガイダンス基準に基づいてノイズ摂動を最適化します


使用された増幅ガイダンス基準は次のように実装されました。クラス一貫性情報インデックス: ; サンプル多様性インデックス: 。これら 2 つの指標を最大化することで、GIF はノイズの摂動を効果的に最適化し、カテゴリの一貫性を維持し、より多くの情報をもたらすサンプルを生成できます。

実験

拡張された有効性GIF はより強力な拡張有効性を備えています。GIF-SD は、6 つの自然データセットで分類精度を平均 36.9% 向上させ、3 つの医療データセットで分類精度を平均 13.5% 向上させます。

拡張効率GIF はより強力な増幅効率を備えています。Cars および DTD データセットでは、GIF-SD を使用した 5 倍の増幅の効果は、ランダム データ拡張を使用した 20 倍の増幅の効果を上回ります。

視覚化の結果既存のデータ拡張方法では新しい画像コンテンツを生成できませんが、GIF では新しいコンテンツを含むサンプルをより適切に生成できます。

既存の強調方法では、医療画像の病変の位置まで切り取られ、サンプル情報やノイズが減少する結果になりますが、GIF ではカテゴリの意味をより適切に保持できます。

計算コストと時間コスト手動によるデータ収集と注釈付けと比較して、GIF を使用するとデータセット拡張の時間とコストを大幅に削減できます。

拡張データの汎用性拡張されたデータセットは、さまざまなニューラル ネットワーク モデル構造のトレーニングに直接使用できます。

モデルの一般化能力の向上GIF は、モデルの分布外一般化パフォーマンス (OOD 一般化) の向上に役立ちます。

ロングテール問題の緩和GIF はロングテール問題の緩和に役立ちます。

セキュリティチェックGIF 生成された画像は安全で無害です。

上記の実験結果に基づいて、人間の類推と想像力の学習をシミュレートすることにより、本論文で設計された方法は、小さなデータセットを効果的に拡張し、それによって小さなデータタスクシナリオでのディープニューラルネットワークの実装とアプリケーションを改善できると信じる理由があります。

<<:  コンピューティング要件が 1% 削減されました。 清華大学が初めて「二値化スペクトル再構成アルゴリズム」を提案、コードは完全オープンソース|NeurIPS 2023

>>:  「3D ガウス」バージョンですべてをセグメント化: ミリ秒単位で 3D セグメンテーション、1,000 倍高速

ブログ    
ブログ    
ブログ    

推薦する

...

エンタープライズITがAIを実際に適用できる場所

人工知能は、さまざまなエンタープライズ システム、特に分析や異常検出のユース ケースで実際に応用され...

ディープラーニングの19の格闘技を見てください。絶滅危惧動物の保護にも役立ちます

絶滅危惧動物を研究する上で最大の課題の一つは、その数を正確に推定することであり、各個体を追跡して詳細...

将来、AIは人類を脅かすと思いますか?人工知能の未来はどうなるのでしょうか?

AIは現在どのように発展しているのでしょうか?テクノロジーの発展があまりにも速く、人工知能があらゆ...

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...

2年半の訓練を経て、テスラのヒューマノイドロボット「オプティマス2」がオンラインになった。

何の前触れもなく、テスラのヒューマノイドロボット「オプティマス」の第2世代が登場しました。 12月1...

【慎重に応募】今後10年間で消滅する可能性が最も高く、代替される可能性が最も低い22の職業

[[373618]] 5Gの商用利用、人工知能、スマートシティ、スマートホーム、自動運転車、無人スー...

AIを活用して都市の建物の特性を識別し、地震などの災害に対するリスクを予測する

人工知能は、ビジネスから工業デザイン、エンターテインメントまで、さまざまな分野で新たな機会を提供して...

...

農業生産性を最適化するスマート農業監視ソリューション

すべての IoT ソリューションの中で、スマート農業システムは間違いなく際立つでしょう。世界経済の中...

人工知能の仮想火災は死体の山を残した

ハリウッドのSF大作では、人工知能は常に、将来の人類の生存を脅かす自己認識機械として定義されています...

AI主導のサイバーセキュリティチームが人間の能力拡張に取り組む

サイバー脅威の範囲は、企業資産や選挙から健康データや物理インフラまで拡大しており、新興技術の予期せぬ...

2024年に向けて誰もが準備すべきAIトレンドトップ10

2024年には、AI技術を取り巻くより困難な問題のいくつかを解決するための進歩が見られることを期待...