このAIはマスクをハゲにし、テスラの設計を手伝った

このAIはマスクをハゲにし、テスラの設計を手伝った

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

若い頃のマスク氏が女性の服を着たときの姿はこんな感じです。

なんて可愛い女の子なんだろう〜

しかし、ひげを加えると、すぐに別の「味」が生まれます。

数年後にマスク氏が禿げ頭になったらどんな姿になるかも見ることができます。 (手動犬頭)

まあ、マスク氏は依然としてマスク氏であり、依然として「地球上で最も裕福な新人」だ。

これは、指定された条件に従って顔を生成できる StyleGAN2 - StyleFlowをベースにした新しいテクノロジーを使用して実現されます。

女性の服を着替える、ハゲになる、ヒゲを描くなどの上記機能に加え、姿勢を変える、照明を調整する、表情を変えるなどのエフェクトも統合されており、車内でも使用できます。

条件に基づいて顔を生成する

1 つの属性条件を編集すると、GAN 潜在空間内での相互作用により、他の属性に不要な変更が簡単に発生する可能性があることがわかっています。この背景に基づいて、本論文では StyleFlow を提案します。

具体的には、属性条件付きサンプリングと属性制御編集という 2 つの側面を検討します。

まず、属性条件付きサンプリングを行います。特定の特性を持つ高品質の実画像をサンプリングします。

次に、プロパティは編集を制御します。特定の画像は、ソース画像の特性を最大限に保持しながら、編集後の画像がターゲット プロパティを持つように編集されます。

StyleFlow によって推測されるパスは入力画像に基づいているため、各顔の独自性に適応できます。

まず、ソース イメージから始まる逆方向推論を使用し、次に一連の CNF ブロックを通じて順方向推論を実行して、属性条件編集をサポートします。

図中、zは事前分布の変数を表し、wはStyleGANの中間重みベクトルを表します。

また、後方および前方推論は、時間変数の CNF 関数を評価する ODE ソルバーによって実装されることにも注意してください。

その中で、属性ベクトルは条件学習機能の鍵となり、順方向推論と逆方向推論の両方に使用できます。

次に、StyleFlow の属性条件付きサンプリングを使用して、Z0 を再サンプリングして属性を定義します。

最後に、StyleGAN の顔と車の潜在空間を使用してアプローチを評価し、実際の写真と StyleGAN で生成された画像の両方で、さまざまな属性に沿った編集のきめ細かい分離を示します。

たとえば、人間の顔の場合、カメラのポーズ、照明の変化、表情、顔の毛、性別、年齢はさまざまでした。

1対多のバッチ操作も可能です。

[[375383]]

最後に、研究者らは、多数の定性的および定量的比較、ならびに既存の技術との比較を通じて、StyleFlow の優位性を実証しました。

その背後にいるチーム

この技術はキング・アブドラ科学技術大学(KAUST)とAdobeが共同で開発し、第一著者はKAUSTのRameen Abdal氏です。

R&D チームにはもう 1 人の中国人がいます。Zhu Peihaoです。

[[375384]]

彼はノースイースタン大学でオートメーションの学士号を取得し、その後中国科学院大学に進学してコンピューターサイエンスを学びました。

修士号を取得した後、彼はキング・アブドラ科学技術大学のコンピュテーショナル・ビジョン・センターに入学し、博士号を取得しました。

顔を生成するだけでなく、車も作れるのでしょうか?

最後に、この技術が「クルマづくり」に及ぼす影響についてお話ししますね〜

色を変更します。

任意の角度に回転します。

普通の車が数秒でSUVに変身します〜

これらのデモにはテスラ効果はありませんが、それでも私は尋ねなければなりません:

それで、マスク氏は興味があるのでしょうか? (手動犬頭)

GitHub:
https://github.com/RameenAbdal/StyleFlow
デモビデオ:
https://www.youtube.com/watch?v=LRAUJUn3EqQ&feature=youtu.be
論文の宛先:
出典: http://arxiv.org/pdf/2008.02401.pdf
プロジェクトアドレス:
https://rameenabdal.github.io/StyleFlow/

<<:  AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

>>:  強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

ブログ    
ブログ    

推薦する

eMule プロトコル スライス選択アルゴリズムの分析

ダウンロードはデータの送信であることはご存じのとおりです。この点に関しては、すでに合意内容について多...

AI誇大宣伝はサイバーセキュリティのデフレにおけるバブルなのか?

人工知能は、その概念が最初の電子メールウイルスと同じくらい古いにもかかわらず、「ネットワークにおける...

プログラミングアルゴリズムと人生の選択

毎年、就職活動の時期になると、どうやって内定を選んだらいいのか、テンセントに行くべきか豆板に行くべき...

ディープラーニングは限界に達したのか?

[[255738]]ビッグデータダイジェスト制作編集者: Xiao Jiang、lvy、Wang ...

河南省鄭州市:自動運転オンライン配車サービス車両が一般公開

[[408894]]河南省鄭州市では7月1日、鄭東新区で自動運転バスと自動運転乗用車が運用開始され、...

「あなたは私の中にいて、私はあなたの中にいる」人工知能はビッグデータと恋愛関係になりたい!

最近では、「ビッグデータ」や「人工知能」ほどよく使われる流行語はほとんどありません。多くのデータ分析...

Meta が言語認識システムをオープンソース化、6 言語でのリップ リーディング翻訳モデル認識、誰でもローカル展開可能

今年初めにネットで人気を博した反ギャングドラマ「光弗」をまだ覚えているだろうか。最後の数話で監督がス...

張宏江:AIは開発を支配する次の法則になるかもしれない

9月11日午前、北京人工知能研究院会長の張宏江博士がHICOOL 2021グローバル起業家サミットに...

...

機械学習の改善: ナレッジグラフがデータに深い意味を与える方法

コンピレーション | ブガッティ編集者 | 薛燕澤[51CTO.com クイック翻訳]多くの企業は、...

デジタルヘルスと医療AIベンチャーキャピタル投資は2021年第1四半期に42億ドルに達した

CB Insightsのデータによると、遠隔医療は2021年第1四半期に139件の取引で過去最高の4...

人工知能(AI)とスポーツスタジアムの融合

新型コロナウイルスCOVID-19の影響は今も続いており、世界中の多くのスポーツスタジアムが麻痺状態...

自然言語処理のためのオープンソースツール12選

[[316046]]独自の NLP アプリケーションで使用できる 12 個のツールを見てみましょう。...

...

快手が1兆ドル規模のパラメータ推奨ランキングモデルを発表

正確な推奨システム モデルは、多くのインターネット製品の中核的な競争力です。パーソナライズされた推奨...