この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「公式だよ、公式だよ、私の彼氏はハンサムだよね?」昨日は520インターネットバレンタインデーで、何万人もの人がKuaishouで独身ではないことを宣言しました。彼らはどうやってそれを実現したのでしょうか?結局、快手は独身者が瞬時に素敵なクローンを手に入れ、「独身から抜け出す道を見つける」ことができるビデオ特殊効果をリリースしたことが判明した。これは、Kuaishou がユーザー向けに用意した 520 種類の特殊効果シリーズの 1 つであり、ユーザーの間で人気があります。 「快手が彼氏を送ってくれてありがとう、すごくイケメン!」「二人は長く一緒にいるとどんどん似てくるって聞いたけど、私の彼氏は私によく似ている」「公式発表、公式発表、パートナーが発表された」。 「チェンジカップル」アプリがリリースされて以来、快手ユーザーはパートナーとハートの形を作ったり、手をつないだり、フィンガーダンスをしたり、一緒にミルクティーを飲んだりするなど、さまざまなアバターを考案した。この特殊効果を使って赤ちゃんのビデオを撮影し、瞬く間に男の子と女の子の双子が生まれる母親もいます。 快手が発売した520シリーズの魔法時計には、「男神に変身」や「女神に変身」などの特殊効果もあり、性別を変える効果が得られます。 「男神に変身」では、女性ユーザーが男神に変身し、変身後のハンサムなヘアスタイルを鑑賞することができます。 「女神に変身」の特殊効果により、男性ユーザーは一瞬にして色白で美しい女性に変身することができます。 GAN 生成的敵対ネットワークが独身者の独身脱出を支援 このような楽しく斬新な体験の裏には、どんなハイテクが使われているのでしょうか?Kuaishou Y-techのアルゴリズムエンジニアによると、この効果の背後にあるコアテクノロジーはGAN(Generative Adversarial Network)です。 GAN はユーザーのオリジナル画像に基づいてリアルな画像を生成することができ、これらの画像を注意深く調べても偽造の兆候が見つからない場合があります。 生成的敵対ネットワーク 携帯電話でリアルタイムの性転換効果を実現するには、次の 3 つの主要な問題を解決する必要があります。 まず、GAN によって生成される顔の特徴は、ユーザーの性別とは明らかに正反対である必要がありますが、同時に、ユーザーに非常に似ていて、血縁関係が近いものでなければなりません。女の子を男の子に変えた後、男性的な特徴が非常に顕著である場合、ユーザーのID情報の一部が失われ、ユーザーが自分とは違って見えるようになり、必然的に楽しさが減少します。したがって、GAN モデルでは、性別特性の変更とユーザー ID の保持の間でバランスを取る必要があります。 2 番目に、GAN は対象の性別に一致する髪を生成しますが、生成された髪はリアルタイム撮影中のユーザーの姿勢に関係なく安定して連続している必要があります。生成されたヘアスタイルを制御するという目的を達成するために、Kuaishou Y-techのアルゴリズムエンジニアはGANとグラフィックスを組み合わせ、グラフィックスの3D理論とGANのテクスチャ学習能力を最大限に活用しました。最終的な効果は、ユーザーに斬新で素晴らしい体験をもたらします。 髪の毛は、人の性別を判断する上で非常に重要な役割を果たします。生成された髪の毛がリアルでない場合、ユーザーはすぐに効果が良くないと考えます。人間の顔とは異なり、髪の毛は自由度が高いです。髪の毛の形、色、方向は、人によって、あるいは同じ人の間でも大きく異なります。 GANはAI技術として、データに基づいて一定の分布を学習するため、データ内の多様な髪を利用して髪の固定パターンを学習し、すべてのユーザーに対して安定した継続的な特定のヘアスタイルを生成する必要があります。 第三に、性別の変更は、さまざまなモデルやコンピューティング機能を備えた携帯電話でリアルタイムに実現される必要があります。 GAN モデルは一般に多くの計算作業を必要としますが、Kuaishou のユーザーベースは広く、ユーザーが使用する携帯電話の計算能力は大きく異なります。すべてのユーザーが新しいテクノロジーのメリットを体験できるように、Kuaishou Y-tech は体系的なソリューションを採用しました。基盤となるエンジンの加速からモデルの圧縮、そして後処理の最適化まで、各部分には大きな課題と能力が伴います。 快手Yテックは、性転換以外にも、若返りや老化などの他の生成技術においても豊富な経験を積んできました。 2019年8月、快手は「ベビーフェイス」特殊効果を発表しました。これは中国初の端末向けリアルタイムGANであるだけでなく、世界初のiOSとAndroidの全モデルと複数のプラットフォームをカバーする動画向けリアルタイムGANでもあります。 |
<<: 機械学習アルゴリズムのコレクション: ベイズ学習からディープラーニングまで、それぞれの長所と短所
>>: TFserving によるディープラーニング モデルの導入
[[440742]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
業界における人工知能(AI)の応用シナリオは増え続けており(日常的なスマート製品から大規模なイノベー...
はじめに: AI 開発についてさらに詳しく知りたいですか? この記事では、AIプログラムを作成する際...
最近、グラフアテンションネットワークの視覚化に関するプロジェクトが多くの研究者の関心を集めており、開...
現代のスポーツ競技は、アスリート同士のタイム競争であるだけでなく、舞台裏でのさまざまなハイテクノロジ...
[[412393]]人工知能を受け入れ、導入する企業が増えており、人工知能の応用が加速する兆しが見え...
マンハッタンのファストカジュアルチェーン「ダルプ・モダン・インディアン」にあるドーサを自動で作る機械...
[[197022]]新しく購入した水冷なしのパブリック版GPUの温度は、フル負荷で稼働すると室温から...
Google DeepMind の最新の成果が再び Nature に掲載され、大規模なモデルを使用し...
[[270991]]人工知能技術の復活は、ここ数年の IT に代表される計算能力の大幅な向上が主な要...
「陸地が3つ、海が7つ」。広大な海には数え切れないほどの謎が隠されている。深海探査は工学技術分野で常...
こんなことは今まで見たことがありません。AIの巨人たちが袖をまくり上げて、オンラインで「戦い」始めま...