このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

人間のロールプレイングへの熱意は決して衰えることがなく、だからこそ AI による顔の変形が人気を博しているのです。

3か月前、SyncedはAvatarifyと呼ばれる顔を変えるプロジェクトを発表しました。この技術により、自分の顔を他の人の顔にリアルタイムで置き換えることができるため、ビデオ会議でのパフォーマンスが非常にスムーズになります。これまでのところ、このプロジェクトは GitHub で 8.5k 個のスターを獲得しています。

このプロジェクトは、主に今年3月に発表されたarXiv論文「First Order Motion」に基づいています。対象画像に対する事前のトレーニングなしで、自分の画像を他の人のビデオに置き換えることができます。

Avatarify を使用する場合、アルゴリズムは、ディープフェイクなどの他の顔交換技術を使用して、交換する顔画像でトレーニングされます。対象画像の類似カテゴリでアルゴリズムをトレーニングすることにより、モデルはリアルタイムの顔交換操作を可能にします。

一次運動モデルの全体的な枠組み

具体的な操作手順も非常に簡単です。

まず静止画像をインポートすると、眉を上げる、瞬きする、話すなど、ビデオ内の実際の人物の動作に応じて写真の顔の特徴が変化し、別の人が会議に参加しているように見えます。

さらに便利なのは、開発者がすでにアプリ化しており、現在 Apple Store からダウンロードできるということです。

Avatarify は現在 APP Store で入手可能です。

このアプリの使い方は非常に簡単です。アプリで写真を選択し、表情を操作するだけで、最終的に希望する顔のビデオが作成されます。

トランプ大統領が、友人に「お誕生日おめでとう、ジョー!」と誕生日のお祝いを個人的に送れるような家庭環境がどんなものなのか、私にはわかりません。

[[336425]]

あなたは人間になることを選ぶことも、人間であることを諦めることもできます。

そして、変顔の世界で最も人気の高いモナ・リザは、

モナリザ:「私の笑顔が好きですか?」

裁判効果

当社は責任を持って製品をテストしました。次の画像は、特殊効果なしの実際の効果を示しています。アイコンタクトと笑顔の弧がうまく捉えられていることがわかります。

アプリが提供する画像に加えて、ターゲットアバターをカスタマイズすることもできますが、ターゲットアバターを正方形にトリミングし、距離が遠すぎたり近すぎたりしないように注意する必要があります。復元の歪みを最小限に抑えるには、単一の背景を選択するのが最適です。

多くのユーザーがソーシャルプラットフォーム上でトライアル結果を示しました。顔の特徴は正確にキャプチャされますが、ユーザーが見上げるなどの動きを加えると、生成された結果は依然として歪んでしまいます。

下の写真では、マスク氏の顔の下半分が少しずれています。

もちろん、これはユーザーのアクションにも左右されます。表情をコントロールする能力が強ければ強いほど、よりリアルになります。

プロジェクト作成から製品発売まで3か月

GitHub プロジェクトの紹介によると、このプロジェクトは作成以来継続的に更新されており、具体的なスケジュールは次のとおりです。

2020.04.13: Windowsサポートを追加しました。

2020.04.15: StyleGAN (ThisPersonDoesNotExist) で生成されたアバターを追加しました。 Q キーを押すと、存在しない人物の画像が表示されます。ワンクリックで簡単にアバターを変更できます。

2020.04.17: Slackコミュニティを作成しました。

2020.04.24: Windowsインストールチュートリアルを追加しました。

2020.05.07: すべてのプラットフォームにリモート GPU サポートが追加されました。

2020.05.22: Google Colab モードが追加され、ユーザーは GPU のないコンピューターでも Avatarify を実行できるようになりました。

2020.07.11: Docker サポートが追加され、ユーザーは Linux 上で Docker を使用して Avatarify を実行できるようになりました。

数日前、Avatarify アプリが Apple APP Store でリリースされました。

Avatarify の作者は、プロジェクトの作成からソフトウェアの商品化まで、わずか 3 か月強を要しました。

おそらく、退屈こそが生産力の原動力なのでしょう。

参考リンク:

https://github.com/alievk/avatarify#configure-video-meeting-app

<<:  2020年のAI目視検査の応用価値

>>:  アルゴリズム博士の平均月収は4万元、データ可視化スキルは世界中で需要が高い

ブログ    
ブログ    

推薦する

...

...

AIがセキュリティの自動化、分析、対応にどのように役立つか

人工知能 (AI) は、チャットボットから自動運転車まで、あらゆるものを説明するために使用できる幅広...

...

UCenter パスワードアルゴリズムのルールと生成方法

Discuz、UCHome、Supesite を含む Kangsheng の一連の製品は、同じユーザ...

敵対的 AI とは何ですか?なぜそれが重要なのでしょうか?

[[250514]] [51CTO.com クイック翻訳] 人工知能 (AI) は、政府、企業、国...

Daguan Data: NLP の概要と自動テキスト分類アルゴリズムの詳細な説明

自然言語処理は人工知能の分野で常に重要なトピックであり、2018年も話題となりました。大量のテキスト...

...

大きなモデルに「深呼吸して一歩ずつ進んでください」と指示すると、驚くほど効果があります。DeepMindは、モデルに指示を与える最も効果的な方法を見つけました。

最適化はあらゆる分野で重要です。一部の最適化は初期化から始まり、その後ソリューションを繰り返し更新し...

2020 年の機械学習向け Python ライブラリ トップ 6!

[[328842]] 【51CTO.com クイック翻訳】世の中にはさまざまな種類の Python...

新しい近似注意メカニズム HyperAttention: 長いコンテキストに適しており、LLM 推論が 50% 高速化します

トランスフォーマーは、自然言語処理、コンピューター ビジョン、時系列予測などの分野におけるさまざまな...

神州太悦:インテリジェントセマンティック産業プラットフォームが正式に開始、無料かつオープンなセマンティック基本サービス

諺にあるように、森の中で目立ち、評判の良い木は、多くの貪欲な人々を引き付けます。認知知能は、業界では...

企業はアルゴリズムやデータを通じて、どのようにより深い堀を築くのでしょうか?

[51CTO.com からのオリジナル記事] データは今最もホットなものです。当時は「紙は洛陽と同...

...