写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

最近、動画サイトをよく見ている人は、とても不思議でワクワクするものを見たことがあるかもしれません。具体的には、以下の動画のように、孫悟空やモナリザなどのさまざまなキャラクターが実際に歌い始めました。

[[343106]]

このビデオはオリジナルのものではない、明らかに加工されている。それで、このビデオはどのように作られたのでしょうか?

実際、これは「Yanderify」と呼ばれるオープンソースの AI プロジェクトを使用しています。これは、Yanderify プロジェクト ページにあるこのアニメーション画像で示されているように、ビデオと写真を組み合わせて、ビデオ内の顔と同じ表情で写真を動かすことができる魔法のプロジェクトです。

[[343107]]

左から、元の写真、元のビデオ、合成ビデオです。では、Yanderify はどのように機能するのでしょうか?今日はそれについてお話ししましょう!

まず、Yanderify は Python ベースのプロジェクトなので、まず Python をインストールする必要があります。以下のリンクをクリックして Python の公式サイトにアクセスし、ダウンロードしてインストールしてください。

Python公式サイト: https://www.python.org

オペレーティング システムが 64 ビットの場合は、64 ビット Python をダウンロードするのが最適です。 Windows システムを例にとると、Python 公式サイトのダウンロード ボタンでは、デフォルトで 32 ビットのインストール パッケージが提供される場合があります。この場合、Download-Windows ページに移動して、ダウンロードする 64 ビットのインストール パッケージを見つけることができます。

次に、Yanderify の GitHub ページに移動します。

ヤンデリファイ: https://github.com/dunnousername/yanderifier

「リリース」リンクを見つけて、最新のリリースされた Zip パッケージをダウンロードします。

Yanderify はインストールしなくても実行できます。解凍後、「Start Yanderify」をダブルクリックしてください。

「Yanderifyを開始」を実行します

Yanderify のインターフェースは非常にシンプルで、コマンドライン ウィンドウとシンプルな GUI で構成されています。必要なのは、画像素材とビデオ素材を選択し、出力パスを設定することだけです。さらに、Yanderify にはいくつかのハードウェア要件があります。

Yanderify は N カードの GPU アクセラレーションをサポートしていますが、モデルは GTX750 より高く、ビデオ メモリが 2G 以上である必要があります。A カードを使用している場合、Yanderify は GPU アクセラレーションを使用できないため、「CPU を使用する」オプションをオンにする必要があります。

Yanderifyのインターフェース

素材としてビデオまたは写真を選択してください

素材を選択する際は、解像度が高すぎる画像や動画を選択しないように注意してください。解像度が高すぎると、ソフトウェアがクラッシュする可能性があります。

「Go」をクリックすると、Yanderify が映像の合成を開始します。ただし、Yanderify を初めて使用する場合は、最初に 2 つのファイルがダウンロードされます。これら 2 つのファイルのダウンロード速度は比較的遅いです。これら 2 つのファイルのダウンロード アドレスは次のとおりです。ダウンロード ツールを使用してダウンロードできます。

初めて使う場合は2つのファイルをダウンロードする必要があり、時間がかかります

https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth

https://www.adrianbulat.com/downloads/python-fan/2DFAN4-11f355bf06.pth.tar

ダウンロード後、Yanderify を閉じて、2 つのファイルを次のディレクトリに配置します。

C:\Users\ユーザー名\.torch\models

これら2つのファイルを手動でダウンロードし、対応するフォルダに置くことができます。

その後、Yanderify をオンにすると、通常どおり使用できるようになります。

作曲中...

この時点で合成は完了する

Yanderify はどれくらい効果的ですか?作者は参考のために短いビデオを合成しただけです...

[[343108]]

[[343109]]

オリジナル画像と合成

さて、チュートリアルはこれで終わりです。このAIの原理は、機械学習を使用してビデオや画像内の顔の動きを識別し、ビデオに応じて写真をアニメーションに処理することです。

楽しいと思ったら、自分でもやってみたらいいでしょう。友達にいたずらをするのは楽しいですが、偽の情報を広めるために使用しないでください。

<<:  AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

>>:  髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

ブログ    
ブログ    

推薦する

機械学習の錬金術の理論的根拠はどれほど強固なのでしょうか?

機械学習の分野は近年急速に発展しています。しかし、機械学習理論に対する理解は依然として非常に限られて...

アルゴリズムはあなたが次に何をするかを知っている

[[113040]]コンピューターがまだ十分に機能していない分野がいくつかあります。たとえば、顔認識...

デジタル時代のパフォーマンス管理:現実と未来

デジタルパフォーマンス管理の変革デジタル目標設定パフォーマンス計画は、企業の繁栄戦略と業務を結び付け...

人工知能はスポーツや芸術教育における革新的な発展をどのように促進できるのでしょうか?

[[407981]]著者テンセント研究所の上級研究員、周丹氏趙雲傑 テンセント研究所 研究助手20...

これでブリッジで腹筋運動ができるようになりました!中国初の3Dプリント橋が上海で公開

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

TensorFlow でトレーニングしたモデルを保存および復元する方法

ディープ ニューラル ネットワーク モデルの複雑さが非常に高い場合、保有するデータの量、モデルを実行...

企業が AIoT に細心の注意を払うべきなのはなぜでしょうか?

[[401594]]過去 100 年間の最大の技術革新を思い起こすと、すぐに何が思い浮かびますか?...

Rosetta はプライバシー コンピューティングと AI をどのように結び付けるのでしょうか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIのトップ研究者からのアドバイス:あなたもAIに取り組んでいると聞きましたが、この4つの落とし穴にはまらないように!

人工知能の人気が高まってきており、人工知能分野でビジネスを始めたい人も増えてきています。しかし、人工...

...

なぜRLの一般化は難しいのか:バークレーの博士が認知POMDPと暗黙の部分観測性から説明する

[[437395]]今日の強化学習 (RL) には、収束性が低いなど多くの問題があります。比較的弱い...

Python でよく使われるアルゴリズム - 貪欲アルゴリズム (別名 greedy algorithm) をご存知ですか?

貪欲アルゴリズム (または貪欲アルゴリズム) とは、問題を解決するときに、その時点で適切と思われる選...

GPT-4Vを試した後、マイクロソフトは166ページに及ぶ評価レポートを作成した。業界関係者:上級ユーザー必読

1週間前、ChatGPTはメジャーアップデートを受けました。GPT-4とGPT-3.5の両モデルは、...