事前トレーニングにより、下流のタスクのパフォーマンスが大幅に向上することが示されています。従来の方法では、モデルの教師あり事前トレーニングに大規模な画像注釈付き分類データセット (ImageNet など) がよく使用されます。近年、自己教師あり学習法の出現により、事前トレーニング タスクで高価な手動ラベル付けが不要になりました。ただし、ほとんどの方法は画像分類用に設計され、最適化されています。ただし、画像レベルの予測と領域レベル/ピクセルレベルの予測には違いがあるため、下流の高密度予測タスクにおけるこれらの事前トレーニング済みモデルのパフォーマンスは最適ではない可能性があります。 これを基に、アデレード大学、同済大学、ByteDance の研究者らは、高価な手動の高密度ラベルを必要とせずに下流の高密度予測タスクで優れたパフォーマンスを達成できる、シンプルで効果的な高密度自己教師学習法を設計しました。この論文はCVPR 2021に採択されました。 論文の宛先: コードアドレス: 方法本研究で提案された新しい手法DenseCL(Dense Contrastive Learning)は、局所特徴間の対応を考慮し、入力画像の2つのビュー間のピクセル(または領域)特徴のペアワイズコントラスト(非類似度)損失を直接最適化することにより、高密度の自己教師あり学習を実現します。 表現学習のための 2 つの対照的な学習パラダイムの概念的描写。 既存の自己教師ありフレームワークでは、同じ画像の異なるデータ拡張を正のサンプルのペアとして使用し、残りの画像のデータ拡張を負のサンプルとして使用して、正のサンプルと負のサンプルのペアを構築し、グローバルな対照学習を実現しますが、多くの場合、ローカルな特徴の接続性と違いは無視されます。これを踏まえて、本研究で提案する方法では、同じ画像内の最も類似した 2 つのピクセル (領域) 特徴を正のサンプルのペアとして、残りのすべてのピクセル (領域) 特徴を負のサンプルとして、高密度コントラスト学習を実現します。 具体的には、この方法では、既存の自己教師学習フレームワークのグローバル プーリング層を削除し、そのグローバル マッピング層を高密度マッピング層の実装に置き換えます。マッチング戦略の選択に関しては、最大類似性マッチングとランダム類似性マッチングは最終的な精度にほとんど影響を与えないことを研究者らは発見しました。ベースライン手法MoCo-v2[1]と比較すると、DenseCLは計算オーバーヘッドがごくわずか(1%未満遅い)ですが、オブジェクト検出やセマンティックセグメンテーションなどの下流の密なタスクに移行するときに優れたパフォーマンスを示します。 DenseCL の全体的な損失関数は次のとおりです。 モデルのパフォーマンスこの研究では、マッチング戦略が下流のタスクのパフォーマンスに与える影響を評価するためにアブレーション実験を実施しました。結果を次の表に示します。 別の一連のアブレーション実験では、事前トレーニング領域の数が下流タスクのパフォーマンスに与える影響を評価しました。結果を次の表に示します。 次の図は、下流の集中タスクに移行する場合のこの方法のパフォーマンス向上を示しています。 この研究ではさらに、トレーニング時間が長くなるにつれてベースラインとの視覚的な比較が提供され、DenseCL が一貫して MoCo-v2 よりも少なくとも 2% 優れていることが示されています。 DenseCL と MoCo-v2 の事前トレーニング時間の消費量の比較は次のとおりです。 次の図は、ローカルな意味的特徴間の対応関係を説明するために、類似度の高い一致を視覚化したものです。 下の図に示すように、ランダム初期化による対応のほとんどは間違っています。図から、トレーニング時間の変化に応じて対応が変化することがわかります。 [1] 運動量対照学習によるベースラインの改善。Chen, Xinlei、Fan, Haoqi、Girshick, Ross、He, Kaiming |
<<: 人工知能のこれら 5 つのトレンドは世界にどのような影響を与えるでしょうか?
>>: 自動化プロジェクトの成功は、ビジネスとITの高度な連携にかかっています。
2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開...
[[422426]]近年、ニューラル ネットワークは自然言語、画像、音声、その他のデータで大きな進歩...
1寝耳に水! 11月15日、国からビッグニュースが発表されました!科学技術部は、新世代人工知能開発...
[51CTO.comより引用] 海外のデータサイエンス市場に詳しい人なら誰でも、2017年に海外のデ...
12月5日、Googleの研究者グループは、OpenAIの人工知能チャットボットChatGPTのトレ...
[[326623]] TensorFlow 2.x は、モデルの構築と全体的な使用において多くの利便...
ニューラルネットワークは人間の脳を模倣するために開発されました。まだ実現されていないものの、ニューラ...
企業がより多くの機械学習や人工知能モデルを本番環境に導入するにつれて、システム内の偏りに対する認識が...
AIの助けを借りれば、月に10万元、年に100万元稼ぐことができます。想像できますか?信じないでく...
[[209375]]単一画像の超解像度では、品質の低下を最小限に抑えながら小さな画像のサイズを拡大...
[[205875]]まず第一に、今日ビジネスを始めようと決めたなら、インターネットよりも人工知能に重...
専門家や業界関係者は、人工知能がさまざまな業界や分野に広く浸透するにつれ、現場の応用に重点を置き基礎...
MITテクノロジーレビューは2001年以来、毎年その年の「トップ10ブレークスルーテクノロジー」を選...