このAIはマスクをハゲにし、テスラの設計を手伝った

このAIはマスクをハゲにし、テスラの設計を手伝った

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

若い頃のマスク氏が女性の服を着たときの姿はこんな感じです。

なんて可愛い女の子なんだろう〜

しかし、ひげを加えると、すぐに別の「味」が生まれます。

数年後にマスク氏が禿げ頭になったらどんな姿になるかも見ることができます。 (手動犬頭)

まあ、マスク氏は依然としてマスク氏であり、依然として「地球上で最も裕福な新人」だ。

これは、指定された条件に従って顔を生成できる StyleGAN2 - StyleFlowをベースにした新しいテクノロジーを使用して実現されます。

女性の服を着替える、ハゲになる、ヒゲを描くなどの上記機能に加え、姿勢を変える、照明を調整する、表情を変えるなどのエフェクトも統合されており、車内でも使用できます。

条件に基づいて顔を生成する

1 つの属性条件を編集すると、GAN 潜在空間内での相互作用により、他の属性に不要な変更が簡単に発生する可能性があることがわかっています。この背景に基づいて、本論文では StyleFlow を提案します。

具体的には、属性条件付きサンプリングと属性制御編集という 2 つの側面を検討します。

まず、属性条件付きサンプリングを行います。特定の特性を持つ高品質の実画像をサンプリングします。

次に、プロパティは編集を制御します。特定の画像は、ソース画像の特性を最大限に保持しながら、編集後の画像がターゲット プロパティを持つように編集されます。

StyleFlow によって推測されるパスは入力画像に基づいているため、各顔の独自性に適応できます。

まず、ソース イメージから始まる逆方向推論を使用し、次に一連の CNF ブロックを通じて順方向推論を実行して、属性条件編集をサポートします。

図中、zは事前分布の変数を表し、wはStyleGANの中間重みベクトルを表します。

また、後方および前方推論は、時間変数の CNF 関数を評価する ODE ソルバーによって実装されることにも注意してください。

その中で、属性ベクトルは条件学習機能の鍵となり、順方向推論と逆方向推論の両方に使用できます。

次に、StyleFlow の属性条件付きサンプリングを使用して、Z0 を再サンプリングして属性を定義します。

最後に、StyleGAN の顔と車の潜在空間を使用してアプローチを評価し、実際の写真と StyleGAN で生成された画像の両方で、さまざまな属性に沿った編集のきめ細かい分離を示します。

たとえば、人間の顔の場合、カメラのポーズ、照明の変化、表情、顔の毛、性別、年齢はさまざまでした。

1対多のバッチ操作も可能です。

[[375383]]

最後に、研究者らは、多数の定性的および定量的比較、ならびに既存の技術との比較を通じて、StyleFlow の優位性を実証しました。

その背後にいるチーム

この技術はキング・アブドラ科学技術大学(KAUST)とAdobeが共同で開発し、第一著者はKAUSTのRameen Abdal氏です。

R&D チームにはもう 1 人の中国人がいます。Zhu Peihaoです。

[[375384]]

彼はノースイースタン大学でオートメーションの学士号を取得し、その後中国科学院大学に進学してコンピューターサイエンスを学びました。

修士号を取得した後、彼はキング・アブドラ科学技術大学のコンピュテーショナル・ビジョン・センターに入学し、博士号を取得しました。

顔を生成するだけでなく、車も作れるのでしょうか?

最後に、この技術が「クルマづくり」に及ぼす影響についてお話ししますね〜

色を変更します。

任意の角度に回転します。

普通の車が数秒でSUVに変身します〜

これらのデモにはテスラ効果はありませんが、それでも私は尋ねなければなりません:

それで、マスク氏は興味があるのでしょうか? (手動犬頭)

GitHub:
https://github.com/RameenAbdal/StyleFlow
デモビデオ:
https://www.youtube.com/watch?v=LRAUJUn3EqQ&feature=youtu.be
論文の宛先:
出典: http://arxiv.org/pdf/2008.02401.pdf
プロジェクトアドレス:
https://rameenabdal.github.io/StyleFlow/

<<:  AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

>>:  強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

推薦する

...

中小企業はデータセンターの自動化によってもたらされる課題にどのように対処するのでしょうか?

デジタル変革の時代において、データセンターは現代の企業のバックボーンを支える上で重要な役割を果たしま...

ノキア、ネットワーク自動化におけるAI推進のためドバイに「イノベーションラボ」を開設すると発表

9月26日、海外メディアETテレコムによると、ノキアは中東とアフリカでの技術革新を促進し、ネットワー...

CPP アルゴリズム問題のための共通コンテナ技術

[[413003]]アルゴリズムの問​​題を解決するときに CPP でよく使用されるコンテナ テクニ...

マイクロソフトCEOナデラ氏:AIはルールを変えるインターネットの波のようなもの

8月18日、マイクロソフトが人工知能(AI)技術の研究開発に注力し、OpenAIに100億ドル以上を...

AIスタートアップで2年間働いて学んだ7つのこと

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

LeCun の最新インタビュー: 物理世界が最終的に LLM の「アキレス腱」となるのはなぜでしょうか?

人工知能の分野では、65歳になってもソーシャルメディアで活発に活動しているヤン・ルカンのような学者は...

Pythonを全く知らなかった私がAIエンジニアになるまでに2年かかりました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

放射線科医は再び危機に陥っている!海外の主要5機関が共同で最新の「胸部X線」ベンチマークを発表

胸部X線(CXR)検査は、さまざまな病気のスクリーニングや診断に広く使用されている臨床画像診断法です...

...

AIは機械設計にどのような影響を与えるのでしょうか?

人工知能は現在、ますます広く利用されるようになっています。ほとんどの場合、堅牢で適応性の高い AI ...

Fast.ai の 10,000 ワードの記事: AI の安全性と光の終焉

ビッグデータダイジェスト制作最近、AI規制に関する意見は「新たな高み」に達し、AI専門家のグループが...

自然言語処理シーケンスモデル - CRF 条件付きランダムフィールド

シーケンスモデルにおけるHMM(隠れマルコフモデル)を習得した後は、別のシーケンスモデルであるCRF...

人工知能が教育に力を与え、「ゼロポイント革命」が到来

[[266892]]中国共産党第19回全国代表大会の最新報告は、教育の近代化と教育の情報化の流れに対...