HDに検閲済み!デューク大学が開発したAIが1秒でモザイクを復元

HDに検閲済み!デューク大学が開発したAIが1秒でモザイクを復元

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ピクセルが足りない場合は、後の写真編集で補いますか?

Zhihuで低ピクセルの写真編集を検索すると、ヘルプ投稿が多すぎて、すべてを読み終えることができませんでした。また、PSテクニック、プラグインツール、さまざまな写真編集アプリに関するチュートリアルも多すぎて目が回ってしまうほどでした。重要な点は、効果がどうなるかまったくわからないことです。

しかし、デューク大学の研究チームは最近、低ピクセルの問題をすべて解決できるPULSEと呼ばれるAI写真編集技術を開発しました。画像の元の解像度を64倍に拡大できるとされており、どんなに画質の悪い画像でも数秒で高精細でリアルな画像に変えることができます。モザイク状の顔画像や毛穴、シワ、髪の毛までも鮮明に復元できます。

モザイクが数秒で高解像度の肖像画に変わる

PULSE は、潜在空間探索によって写真をサンプリングする新しい超解像度アルゴリズムです。従来の方法では最大 8 倍しか拡大できなかったのに対し、16 x 16 ピクセルの低解像度 (Low Resolution、LR) を 1024 x 1024 ピクセルの高解像度 (High Resolution、HR) に数秒で 64 倍に拡大できます。

まずは一例を見てみましょう。写真編集業界で最も加工が難しいとされるLRヘッドショットも、PULSEを使えばわずか数秒で高精細かつ繊細な画像に生まれ変わります。

さらに重要なのは、PULSE は顔の主要な特徴を特定し、より高い解像度で同様の詳細セットを生成できることです。写真に写っている肖像画はぼやけていますが、PULSE は眉毛、まつげ、髪の毛、顔の形などの顔の細部も「想像」して、高精細でリアルな肖像画を作成できます。

しかし、過度なぼかしによって生成されたポートレートは、単なる仮想の新しい顔であり、実際には存在しません。したがって、この技術は個人の識別には使用できません。たとえば、監視カメラで撮影されたピントが合っていない、認識できない画像は、PULSE を通じて実際のポートレートに復元することはできません。

「実在しない、本物のように見える新しい顔を生成できるほどの超高解像度の画像が生成されたことはこれまでなかった」とデューク大学のチームに所属するコンピューター科学者、シンシア・ルーディン氏は語った。

同時に、この研究で使用された技術は、医学、顕微鏡、天文学、衛星画像などの分野で広く活用できると付け加えた。また、研究チームは論文をプレプリントライブラリarVixに公開しており、IEEE国際コンピュータービジョンおよびパターン認識会議(CVPR 2020)にも掲載されています。

従来の写真編集を超えた「ロスカット」

LR 画像の場合、HR 解像度部分を LR 画像に一致させて超高解像度 (SR) を得るという従来の方法では、HR 画像の感度が低下したり、画像にムラができたり、画像が歪んだりすることがよくあります。

この研究では、デューク大学の研究チームが新たなアイデアを模索し、新しい超解像アルゴリズムPULSEを提案しました。LR画像をトラバースして詳細をゆっくりと追加するのではなく、HRに対応するLRを見つけて、「損失を減らす」ことでSR画像を取得します。

オリジナルLR(最初の行)、PULSE出力HR(真ん中の行)、HR対応LR(最後の行)

PULSE は生成的敵対的ネットワーク (GAN) を使用します。これは、名前が示すように、敵対的なゲームプレイを通じてターゲット トレーニングを実行するトレーニング モデルです。その主な構造には、ジェネレーターとディスクリミネーターが含まれます。同じ写真トレーニング セットで、1 つは受信した画像をトレーニングして出力することを担当し、もう 1 つは出力を受信して​​十分にリアルかどうかを確認することを担当します。

元の画像と比較した後のテスト結果は次のとおりです。

図中、1 行目は元の画像、2 行目は「損失を低減」して得られた HR に対応する LR、3 行目は PULSE によって得られた HR です。元の画像とはまだ若干の違いがありますが、復元度はすでに非常に高いことがわかります。

論文によると、SRにおけるPULSEの利点を検証するために、デューク大学の研究チームは4つの異なる画像スケーリング方法を使用して比較研究を実施した。この研究では、CelebA HQデータセットから1440枚の画像を使用し、LR顔画像、特に目、唇、髪などの詳細について、スケール係数x8およびx64で実験を実施しました。

PULSE は、特に X64 解像度で明らかな利点を示し、特に目や唇などの細部でぼやけたポートレートが完全に復元されます。これは他の方法ではほぼ不可能です。

また、テスト結果については、研究者らは知覚的超解像でよく使われるMOSテスト方法を使用し、5人の評価者に画像結果を1~5のスケールで採点してもらいました。その結果、HRソースの高解像度画像解像度は3.74点だったのに対し、PULSEは3.60点に達し、その差はわずか0.14で、実際の高品質画像のレベルにほぼ達したと言えます。

しかし、研究者たちはPULSEがまだ完璧ではないことを認めている。生成される高解像度の画像は、プロのオリジナル画像とは多少異なります。しかし、テクノロジーとツールが進歩するにつれて、このテクノロジーも少しずつ改善されていきます。

現在、研究チームは PULSE を Github オープンソース プラットフォームにリリースし、569 個のスターを獲得しています。写真編集に困っている友達はインストールして試してみてください〜(Githubアドレス:https://github.com/adamian98/pulse)

<<:  AIを使用するための実践的な方法論:次の5つのステップに従ってください

>>:  コンピュータービジョン技術によって変革が期待できる3つの業界

ブログ    

推薦する

ロボット開発で人気の言語:不滅のJava、不滅のC/C++、そして新興のPython

プログラミング言語は流行ったり廃れたりするものですが、Java と C/C++ は変わりません。 [...

...

自動運転の国家基準が導入される。2021年はレベル3自動運転車元年となるか?

自動運転は間違いなく自動車の究極の開発トレンドとなるため、多くのメーカーが現在、自動運転車の開発に多...

年末総括:セキュリティ業界は2020年にCOVID-19パンデミックの課題に対処するのに貢献した

新型コロナウイルス感染症のパンデミックは、セキュリティ業界を含む世界中のあらゆる業界のあらゆる側面に...

ディープラーニングツール:スマート端末におけるTensorFlowの応用

[[204425]]序文ディープラーニングは、画像処理、音声認識、自然言語処理の分野で大きな成功を収...

...

5Gヘルスケアの7つの未来

病院が導入する医療機器やモバイルデバイスが増えるにつれて、医療システムの IT インフラストラクチャ...

中国チームが世界初のAI全自動設計CPU「Enlightenment 1」を発表:人間の介入なし、性能は486に匹敵

6月30日、「半導体産業展望」の報道によると、中国科学院計算技術研究所などの機関がAI技術を活用し、...

IDC: 欧州の人工知能への支出は2022年に220億ドルに達する

インターナショナル・データ・コーポレーション(IDC)の新しい世界人工知能支出ガイドでは、ヨーロッパ...

デジタル変革の波の中で、車の購入もアルゴリズムの最適化に頼ることができるのでしょうか?

近年、デジタル変革の波に牽引され、自動車業界は着実な変革、アップグレード、ビジネスの再編を遂げていま...

ロボット警察がファンタジーを現実に変える

人工知能、コンピュータービジョン、モノのインターネット、その他の先進技術を備えたロボット警察は、法と...

...

ビジネスコミュニケーションで機械学習を活用する9つの方法

人工知能 (AI) と機械学習 (ML) は、職場でも家庭でも、私たちの生活に欠かせないものになりつ...

自動運転車がコーナーを「見通し」できるようにする

自動運転車がその名に恥じない性能を発揮するには、満たすべき要件が数多くありますが、環境の認識と理解が...