この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「公式だよ、公式だよ、私の彼氏はハンサムだよね?」昨日は520インターネットバレンタインデーで、何万人もの人がKuaishouで独身ではないことを宣言しました。彼らはどうやってそれを実現したのでしょうか?結局、快手は独身者が瞬時に素敵なクローンを手に入れ、「独身から抜け出す道を見つける」ことができるビデオ特殊効果をリリースしたことが判明した。これは、Kuaishou がユーザー向けに用意した 520 種類の特殊効果シリーズの 1 つであり、ユーザーの間で人気があります。 「快手が彼氏を送ってくれてありがとう、すごくイケメン!」「二人は長く一緒にいるとどんどん似てくるって聞いたけど、私の彼氏は私によく似ている」「公式発表、公式発表、パートナーが発表された」。 「チェンジカップル」アプリがリリースされて以来、快手ユーザーはパートナーとハートの形を作ったり、手をつないだり、フィンガーダンスをしたり、一緒にミルクティーを飲んだりするなど、さまざまなアバターを考案した。この特殊効果を使って赤ちゃんのビデオを撮影し、瞬く間に男の子と女の子の双子が生まれる母親もいます。 快手が発売した520シリーズの魔法時計には、「男神に変身」や「女神に変身」などの特殊効果もあり、性別を変える効果が得られます。 「男神に変身」では、女性ユーザーが男神に変身し、変身後のハンサムなヘアスタイルを鑑賞することができます。 「女神に変身」の特殊効果により、男性ユーザーは一瞬にして色白で美しい女性に変身することができます。 GAN 生成的敵対ネットワークが独身者の独身脱出を支援 このような楽しく斬新な体験の裏には、どんなハイテクが使われているのでしょうか?Kuaishou Y-techのアルゴリズムエンジニアによると、この効果の背後にあるコアテクノロジーはGAN(Generative Adversarial Network)です。 GAN はユーザーのオリジナル画像に基づいてリアルな画像を生成することができ、これらの画像を注意深く調べても偽造の兆候が見つからない場合があります。 生成的敵対ネットワーク 携帯電話でリアルタイムの性転換効果を実現するには、次の 3 つの主要な問題を解決する必要があります。 まず、GAN によって生成される顔の特徴は、ユーザーの性別とは明らかに正反対である必要がありますが、同時に、ユーザーに非常に似ていて、血縁関係が近いものでなければなりません。女の子を男の子に変えた後、男性的な特徴が非常に顕著である場合、ユーザーのID情報の一部が失われ、ユーザーが自分とは違って見えるようになり、必然的に楽しさが減少します。したがって、GAN モデルでは、性別特性の変更とユーザー ID の保持の間でバランスを取る必要があります。 2 番目に、GAN は対象の性別に一致する髪を生成しますが、生成された髪はリアルタイム撮影中のユーザーの姿勢に関係なく安定して連続している必要があります。生成されたヘアスタイルを制御するという目的を達成するために、Kuaishou Y-techのアルゴリズムエンジニアはGANとグラフィックスを組み合わせ、グラフィックスの3D理論とGANのテクスチャ学習能力を最大限に活用しました。最終的な効果は、ユーザーに斬新で素晴らしい体験をもたらします。 髪の毛は、人の性別を判断する上で非常に重要な役割を果たします。生成された髪の毛がリアルでない場合、ユーザーはすぐに効果が良くないと考えます。人間の顔とは異なり、髪の毛は自由度が高いです。髪の毛の形、色、方向は、人によって、あるいは同じ人の間でも大きく異なります。 GANはAI技術として、データに基づいて一定の分布を学習するため、データ内の多様な髪を利用して髪の固定パターンを学習し、すべてのユーザーに対して安定した継続的な特定のヘアスタイルを生成する必要があります。 第三に、性別の変更は、さまざまなモデルやコンピューティング機能を備えた携帯電話でリアルタイムに実現される必要があります。 GAN モデルは一般に多くの計算作業を必要としますが、Kuaishou のユーザーベースは広く、ユーザーが使用する携帯電話の計算能力は大きく異なります。すべてのユーザーが新しいテクノロジーのメリットを体験できるように、Kuaishou Y-tech は体系的なソリューションを採用しました。基盤となるエンジンの加速からモデルの圧縮、そして後処理の最適化まで、各部分には大きな課題と能力が伴います。 快手Yテックは、性転換以外にも、若返りや老化などの他の生成技術においても豊富な経験を積んできました。 2019年8月、快手は「ベビーフェイス」特殊効果を発表しました。これは中国初の端末向けリアルタイムGANであるだけでなく、世界初のiOSとAndroidの全モデルと複数のプラットフォームをカバーする動画向けリアルタイムGANでもあります。 |
<<: 機械学習アルゴリズムのコレクション: ベイズ学習からディープラーニングまで、それぞれの長所と短所
>>: TFserving によるディープラーニング モデルの導入
EmTech MIT では、専門家が、生成 AI モデルのオープンソース化の長所と短所を含め、企業で...
これは日本の東京国際展示場にあるデンソーの双腕協働ロボットの写真です。写真提供:新華社記者 華毅国連...
[[425432]]この記事は、ソリューションの選択から再現の試みなど、軽量な人間の姿勢推定モデルを...
人工知能技術は急速に発展し、人々の生活に微妙な影響を与えています。掃除ロボット、調理ロボット、配達ロ...
サム・アルトマンのブログ記事全文は次のとおりです。 OpenAI での私の仕事は、ほとんどの人が認識...
前回の記事では、写真に写っている顔を検出し、顔の特徴(鼻、目、眉毛など)をマークしました。この記事で...
動的プログラミング基本的に、それは次のことを意味します。女の子を追いかけるときは、彼女の親しい友達全...
データサイエンス、機械学習、人工知能は、ヘルスケア業界に大きな変革をもたらす可能性があります。このイ...
制作:ビッグデータダイジェスト編集部長い間待ち望まれていた『ゲーム・オブ・スローンズ』の最終シーズン...
現在、特定の NLP タスクのパフォーマンスを最適化するための最善のアプローチは、事前トレーニング済...