2020CVPR 受理論文「Deep Face Super-Resolution with Iterative Collaboration between Attentive Recovery and Landmark Estimation」を共有します。この論文では、反復的なコラボレーションに基づく顔の超解像アルゴリズムを提案しています。 この方法は、16x16 の低解像度画像を 128x128 に超解像度化し、CelebA データセットと Helen データセットでそれぞれ27.37 と 26.69の PSNR 指標を達成し、既存の顔超解像度アルゴリズムを上回ります。 コードは現在オープンソースです: https://github.com/Maclory/Deep-Iterative-Collaboration (現在72個の星があります) 論文著者情報: 著者は、清華大学オートメーション学院、国家インテリジェント技術・システム重点実験室、北京国家情報科学技術研究センター、清華大学深圳国際大学院に所属しています。 01 モチベーション これまでの顔の超解像アルゴリズムでは、顔のキーポイントなどの顔の事前情報が通常導入され、ネットワークがよりリアルな超解像画像を生成できるように支援していました。しかし、これらの方法には 2 つの問題があります。
上記の 2 つの問題を解決するために、著者らは反復協力に基づく顔超解像アルゴリズムDICを提案しました。また、生成された画像をよりリアルにするために、ネットワークの GAN バージョンであるDICGANも提案しました。 02 方法 ネットワーク構造図からわかるように、事前ネットワークが粗いSRから正確な事前情報を取得できない問題を解決するために、著者はフィードバック反復ネットワークを設計しました。これにより、生成された超解像画像は実際の画像にますます近づき、より現実的な画像は事前ネットワークを通じてより正確な事前情報を抽出して画像の品質をさらに向上させることができます。 下の図は、この反復メカニズムの利点を示しています。反復回数が増えるにつれて、キーポイントの予測はますます正確になり、生成される画像の品質もますます向上します。著者はまた、反復回数が 3 を超えるとネットワーク パフォーマンスの向上が制限されることを実験によって証明しました。 一方、顔の事前情報を最大限に活用するために、著者は次の図に示すように Attentive Fusion モジュールを提案しました。 顔のキーポイント予測ネットワーク(ネットワーク構造図の Face Alignment モジュール)によって出力された特徴マップを、左目、右目、口、鼻、顔の輪郭の 5 つのグループに分割していることがわかります。次に、各グループの特徴マップをソフトマックス後に合計して、各注意行列を取得します。 これら 5 つの注意行列を使用して、ネットワーク内の 5 つのブランチの特徴マップをそれぞれ再重み付けし、それらを合計して融合された特徴を取得します。では、キーポイント予測ネットワークによって出力された特徴マップのどのチャネルが左目用で、どのチャネルが右目用であるかを、著者はどのようにして判断するのでしょうか。作者のオープンソースコードからは、32番目から41番目のチャネルが左目のキーポイントであると規定するなど、これらのチャネルが手動で指定されていることがわかります。
上記は、この論文の最も重要な 2 つの革新です。ネットワーク全体の動作原理を理解すると、ネットワーク損失関数は簡単に理解できます。 03 結果 次の図は、DIC/DICGAN の結果と他の方法の結果を比較したものです。 DIC/DICGAN によって生成された画像は、より多くの詳細を復元し、よりリアルであることがわかります。 DICGAN は GAN ベースの手法であるため、PSNR 方式の FSRNet よりもインデックスは若干低くなりますが、生成される画像はよりリアルです。これは、現在の超解像タスクでも問題になっています。GAN ベースの方法で生成された画像は視覚的な品質は優れていますが、PSNR インジケーターは低くなります。 04 リソース
|
<<: ロボットが仕事を独占するなら、私たちの仕事は誰が守ってくれるのでしょうか?
よく見てください、ここはメカスーツまで多種多様な展示品がある「魔法博物館」です...魔法の鏡、クリス...
2017年と比べると、最近の人工知能分野のニュースは人々を怒らせることはほとんどないようだ。おそら...
スマート シティは、接続性とデジタル イノベーションの未来として注目されています。 英国だけでも、全...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
常に進化するテクノロジーの世界では、企業、政府、個人にとって、常に最先端を行くことが重要です。このダ...
[[276909]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
Perplexity AIは本日、シリーズBの資金調達で7,360万ドルを調達し、評価額は5億2,0...
ドローン分野へと私たちを導いた技術開発はそこで止まりませんでした。ドローンが軍事目的以外の目的で使用...
Microsoft Research は、消費者の手に握られたスマートフォンのカメラを使用して、遠隔...
[[216406]]新しい技術の出現は、それに関わる人々の仕事を常に変えていきます。メインフレームコ...
近年、人工知能は急速に発展し、家庭、金融、交通、医療などさまざまな分野に深く融合し、人々の生活はより...
ボビー・アリン編纂者 | Yan Zheng幸いなことに、Google はこの技術を公開しませんでし...
最近、数年間業界で働いているスタンフォード大学の AI 卒業生が、AI と機械学習のキャリアのために...
序文現在インターンシップをしており、仕事量はそれほど多くないので、空き時間を利用してPATのウェブサ...
[[358363]] RPA(ロボティック・プロセス・オートメーション)は、企業の業務効率と生産性を...