こんにちは、みんな。 短い動画を見ているときに、こんな動画を見たことはありませんか?動画の中で、人物の静止画が、首を傾げたり、瞬きをしたりと、動いていることがあります。 次のような効果に類似 一番左の図が本来の動作で、上の図が静止画です。 AI技術により、一番左のキャラクターの動きを上の静止画に適用し、すべての画像で同じ動きを実現できます。 この技術は、一般的に GAN (生成的敵対的ネットワーク) に基づいて実装されます。今日は、上記の効果を再現できるオープンソース プロジェクトを紹介します。興味深いプロジェクトを実行したり、古い友人を思い出したりすることができます。 1. プロジェクトを実行するプロジェクトアドレス: https://github.com/AliaksandrSiarohin/first-order-model まず、git clone はプロジェクトをローカル コンピューターにダウンロードし、プロジェクトに入って依存関係をインストールします。 git クローン https://github.com/AliaksandrSiarohin/first-order-model.git 次に、プロジェクトのホームページの「事前トレーニング済みチェックポイント」の見出しの下にあるモデルのダウンロード リンクを見つけて、モデル ファイルをダウンロードします。モデルは多数あります。私は vox-adv-cpk.pth.tar を使用しました。 モデルファイルを準備したら、プロジェクトのルートディレクトリで以下のコマンドを実行します。 python デモ.py \ パラメータを説明します。
実行が完了すると、次の入力が表示されます。 このプロジェクトは PyTorch を使用してニューラル ネットワークを構築し、GPU と CPU の操作をサポートしているため、コンピューターに CPU しかない場合は実行速度が遅くなります。 CPU で実行しています。上の図からわかるように、 driving_video には 31 フレームしかありません。 CPU でも実行している場合は、 driving_video ビデオの継続時間を制御するのが最適です。そうしないと、実行時間が長くなります。 このプロジェクトでは、自分で興味深い試みをいくつか行うことができます。 2. Python API上記では、公式 Web サイトに従って、コマンド ラインでプロジェクトを実行する方法を説明しています。 友人の中には、これを Python プロジェクトで呼び出したい人もいるかもしれないので、demo.py のコア コードを抽出し、Python API をカプセル化しました。 困っている友人は、このファイルをダウンロードし、first-order-model と同じディレクトリに置き、次のコードに従って呼び出すことができます。 フォム = FOM() |
>>: 電子鼻のウイスキー識別精度は96%にも達する。ネットユーザー:茅台酒にも作ってみよう
Technavioが発表した「世界のスマートポール市場2020-2024」レポートデータによると、2...
[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...
AIがますます普及するにつれて、倫理的な問題をどのように解決できるでしょうか? AIという言葉は近...
現在、医療分野における人工知能の応用には、医用画像診断、健康管理、医療研究が含まれます。最近、国立神...
テクノロジーリーダーにとって、今は刺激的でもあり、不安でもある時代です。急速に進化するデジタルテクノ...
中国政府は人工知能を国家戦略のレベルにまで高めた。 2017年7月、国務院は「次世代人工知能発展計画...
近年、高所から物が投げられたり落下したりして負傷する事故が多発しています。水のボトル、スイカの皮、缶...
Markets and Marketsの人工知能サイバーセキュリティ予測レポートによると、AIサイバ...
AI テクノロジーの台頭により、ソーシャル メディアは人間や人間のグループでは得られない洞察を提供...
[[285696]]最近、「ブロックチェーン」や「フェデレーテッドラーニング」などの概念がかつてな...
[[374390]]人工知能 (AI) は、組織によって競争上の優位性を獲得するための重要なテクノロ...
人々の印象では、AIは「多数派」に属する技術カテゴリーであると私は信じています。いわゆる多数とは、第...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...