テンセントの古い写真修復アルゴリズムはオープンソースで、髪の毛まで詳細に再現されており、3つの事前トレーニング済みモデルがダウンロード可能

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

古い写真を細部まで復元できるGFPGANを覚えていますか？

現在、そのコードは正式にオープンソースになっています。

公式はGitHubに3つの学習済みモデルをアップロードしています。3つのバージョンの効果は以下のとおりです。

その中で、V1.3は最も最近に更新されたバージョンであり、修復効果はより自然です。同時に、低品質の入力でも高品質の結果を出力できます。

GFPGAN はリリース以来、GitHub で17,000 を超えるスターを獲得し、ホットリストのトップにもなりました。

Twitter 上では試用プレイの熱狂の波も巻き起こしました。

このプロジェクトはTencent PCG ARC Laboratoryによって提案され、関連論文がCVPR2021に掲載されました。

3つの事前トレーニング済みモデルから選択可能

オープンソースコードは、主に事前トレーニングとトレーニングの 2 つの部分に分かれています。

事前トレーニングでは、GFPGAN の V1.3 バージョンを例として取り上げ、事前トレーニング済みモデルのダウンロードアドレスを示します。

 wget https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth -P Experiments/pretrained_models

次に、たった 1 行のコードで事前トレーニング済みモデルの推論を開始できます。

 python inference_gfpgan.py - i 入力/ whole_imgs - o 結果- v 1.3 - s 2

詳細は以下の通りです。

 使用方法: python inference_gfpgan.py - i inputs / whole_imgs - o results - v 1.3 - s 2 [ options ] ...

 -h このヘルプを表示
-i input 入力画像またはフォルダ。 デフォルト: inputs / whole_imgs
 -o output 出力フォルダ。 デフォルト: results
 -v version GFPGAN モデルのバージョン。 オプション: 1 | 1.2 | 1.3 。 デフォルト: 1.3
 -s アップスケール画像の最終的なアップサンプリングスケール。 デフォルト: 2
 - bg_upsampler 背景アップサンプラー。 デフォルト: realesrgan
 - bg_tile 背景サンプラーのタイルのサイズ。 テスト中にタイルがない場合は0 です。 デフォルト: 400
 -suffix 復元された面の接尾辞
-only_center_face 中心面のみを復元します
- 整列入力は整列面です
-ext 画像拡張子。 オプション: auto | jpg | png 、 auto は入力と同じ拡張子を使用することを意味します。 デフォルト: auto

ここで、公式は 3 つの事前トレーニング済みモデル間の違いも示しています。

初期バージョンと比較すると、後者の 2 つのバージョンでは復元精度が大幅に向上しました。

V1.2ではシャープネスがより顕著になり、美容効果も加わったため、場合によっては不自然に見えてしまいます。

バージョン 1.3 ではこの問題は明らかに解決されており、出力がより自然になり、二次修復も可能になりました。ただし、欠点としては、顔の特徴が変わることがあることです (下の写真のアン・ハサウェイの例など)。

つまり、V1.3 は V1.2 よりも完全に優れているわけではなく、必要に応じて適切なモデルを選択できます。

次はトレーニングの部分です。

まず、選択されたデータセットは FFHQ です。

次に、ダウンロードした事前トレーニング済みモデルとその他のデータを experiments/pretrained_models フォルダーに配置します。

その他のデータは次のとおりです:

事前トレーニング済みの StyleGAN2 モデル、FFHQ 顔位置合わせモデルファイル、ArcFace モデル。

次に、対応する構成ファイル options/train_gfpgan_v1.yml を変更します。

ここでは、顔の位置合わせオプションのないシンプルなバージョン (train_gfpgan_v1_simple.yml) を試すこともできます。

ついにトレーニングを開始できます。

 python -m torch.distributed.launch --nproc_per_node = 4 --master_port = 22021 gfpgan /train.py -opt options /train_gfpgan_v1.yml --launcher pytorch また、 公式には2つの注意事項があります。