この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 顔が変わるのはよく見かけますが、体が変わるのは見たことがありますか? 顔を指定すると、衣服、体型、肌の色に PS の痕跡を残さずに、下半身を自動的に変更できます。 コアテクノロジーは、もちろん私たちがよく知っている GAN ですが、違いは、体のあらゆる部分をフォトショップで加工できるようになったことです。 顔、肌の色、服装、髪、その他の体の部位、さらには体の動きまで、自由にデザインして組み合わせ、最終的に1024 × 1024の解像度の全身写真に「つなぎ合わせる」ことができます。 そして、この「ステッチされたモンスター」には、スプライシング動作によって生じた影や境界線がありません。 上記の顔は、影の境界がほとんどない新しい方法で生成されています。 これはどうやって行うのですか?人体のさまざまな部分を生成するために使用される GANを組み合わせます。 これは、Adobe チームが提案した、複数の事前トレーニング済み GAN を組み合わせて画像を生成する新しい方法です。この論文は CVPR 2022 に採択されました。 次に、彼らがそれをどのように達成したかを見てみましょう。 PSを使用して人体を生成する冒頭で述べたように、これは複数の GAN をつなぎ合わせる手法であり、研究チームはこれをInsetGAN と呼んでいます。 GAN には 2 つの種類があります。
これら 2 種類の GAN が連携して動作する方法は Photoshop に似ています。つまり、フルボディ GAN はベースラインが既に存在するキャンバスであり、部分的な GAN はその上に積み重ねられたレイヤーです。 ただし、境界が異なる「レイヤー」をキャンバス上に重ねると、必ず位置合わせの問題が発生してしまいます。 たとえば、体に顔を追加すると、肌の色の一貫性、衣服の境界、髪の毛の流れの自然さなどの詳細が歪んだり失われたり、アーティファクトが発生したりすることがあります。 複数の GAN をより適切に調整して、一貫したピクセルを生成するにはどうすればよいでしょうか? 研究チームは次のようなアーキテクチャを設計しました。 彼らはまず境界ボックス検出器を導入し、基礎となるキャンバス内で部分GANによって生成された特定領域、つまり全身GANによって生成された領域の位置を検出し、切り取って特定領域を埋め込みました。 このプロセスは、2 つの領域間のランダムな潜在コードを見つけることと同じです。 (潜在コード)選択領域の境界が埋め込み領域と一致し、シームレスな合成が実現されるようにします。 同時に、これら 2 つの領域をダウンサンプリングして、画像ピクセル コンテンツの一貫性をさらに高めます。 この方法に基づいて、InsetGAN はトレーニング後に複数の完全なポートレートを生成し、肌の色、髪、関連する姿勢をそれに応じて調整できます。 研究チームは、人間の体の左側に基づいて顔を置き換える、全身ポートレートを生成する従来の方法である CoModGAN とも比較しました。明らかに、InsetGAN によって生成された顔の方が自然です。 △上がInsetGAN、下がCoModGAN 著者についてこの論文の著者は 6 名で、そのうち 5 名は Adobe Research から、1 名はキング アブドラ科学技術大学 (KAUST) からである。 その中には、Adobe の主任科学者であり、PS 2020 のスマート ポートレート、スキン スムージング、カラーリング、ニューラル スタイライゼーションなどのフィルターの主要なアルゴリズム貢献者であり、RealBrush ブラシ シンセサイザーの開発者である Jingwan Lu もいます。 彼女が現在率いるチームは、ビッグデータと生成 AI (GAN など) を使用してビジュアル コンテンツを作成することに重点を置いています。 では、家を離れずに体を変える準備はできていますか? (手動犬頭) 論文の宛先: https://arxiv.org/abs/2203.07293 |
>>: このレーシングAIはもはや短期的な楽しみを求めるのではなく、長期的な戦略を考慮することを学んだ。
オープンソースライセンスは進化すべきだと思いますか? 2023年は人工知能(AI)の登場とともに新年...
生成型人工知能 (AIGC) は、ソフトウェア開発者の生産性を向上させる大きな可能性を秘めています。...
言語モデルを定義するときは通常、基本的な単語分割方法を使用して文を単語、サブワード、または文字に分割...
I. はじめに1. 2022年末に人気が高まったOpenAIとAIGC 2022年はAIの歴史におい...
概要スイス政府コンピュータ緊急対応センター (GovCERT) は最近、Tofsee ボットネット ...
サーセイ・ラニスターの策略やサー・ジョラー・モーモントの父親のような保護をもってしても、攻撃者が H...
[51CTO.com クイック翻訳]経済社会の発展に伴い、テクノロジーはますます複雑になっています...
企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する...
[[388190]] • 食糧需要が増加するにつれて、世界は水の使用を管理する必要があります。 • ...
近年、インターネットは急速に発展しすぎていると言わざるを得ません。最後に銀行に行ってお金を引き出した...
新しいルールが登場します。 今回公布された「オンライン音声・動画情報サービス管理規則」では、ディープ...
AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...