カメラを開くと、2Dイラストがリアルタイムでアニメーション化されます。中国のプログラマーが制作し、デモはオンラインで入手できます。

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

アライグマを描いて、「代金を徴収」するクローズアップを撮るには、何ステップ必要ですか？

必要なのは、Tom Nook にスケルトンを添付し、エクスポートした SVG ファイルをブラウザにドラッグするだけです。

ちょうどこのように、トム・ヌークはカメラの前であなたが動くのと同じように動きます。

この TensorFlow.js プロジェクトは Pose Animator と呼ばれています。デモがリリースされるとすぐに、ネットユーザーたちは大喜びしました。

たとえば、デザイナーの Julia Jaskólska は、ダンスとイラストを完璧に組み合わせています。

身体を鍛えるだけでなく、新たな創造の可能性も開きます。

彼女は楽しそうにこうコメントした。

自分のイラストをアニメーション化するのがこんなに簡単だとは思っていませんでした！

実装の詳細

では、イラストはどのようにして生まれるのでしょうか?

Pose Animatorは、PoseNetとFaceMeshという2つのTensorFlow.jsモデルの認識結果に基づいて、2Dベクター画像とそのスケルトンのリアルタイムアニメーション処理を実行することを紹介しました。

その中で、コンピュータグラフィックスにおけるスケルタルアニメーションの考え方が借用され、ベクターキャラクターに適用されています。

スケルタルアニメーションでは、キャラクターは 2 つの部分で構成されます。

1 つ目はモデルを描画するためのスキン、2 つ目は動きを制御する鍵となるスケルトンです。

Pose Animator では、スキンは入力 SVG ファイル内の 2D ベクターパスによって定義されます。

さらに、Pose Animator は、PoseNet と FaceMesh に基づいたプリセットのボーン階層表現を提供します。

スケルトン構造の初期ポーズは、入力 SVG ファイルでユーザーによって指定されます。

その後、機械学習モデルの認識結果に基づいて、リアルタイムの骨の位置が更新されます。

現在、作者は 2 つの Web デモを公開しています。

レンズで撮影した画像に基づいてリアルタイムで動く 2D 画像。

もう 1 つは静止画像用です。

したがって、興味がある場合は、コンピューターの Chrome と iOS Safari の 2 つのブラウザーでプレイできます。

さらに、QuantumBit はテスト済みで、Android フォンの Chrome でも利用できます。

中国のプログラマーが制作

Pose Animator の作者は、Google のクリエイティブテクノロジーの専門家である Shan Huang です。

[[325571]]

Shan Huang はカーネギーメロン大学を卒業し、コンピュータサイエンスの学士号とヒューマンコンピュータインタラクションの副専攻を取得しました。 2014年にGoogle（上海）に入社。

当時インターネット上で流行していた絵当てソング企画も彼女が始めたもの。

ポータル

GitHub プロジェクト: https://github.com/yemount/pose-animator

カメラキャプチャデモ: https://pose-animator-demo.firebaseapp.com/camera.html

画像バージョンデモ: https://pose-animator-demo.firebaseapp.com/static_image.html

<<: エッジインテリジェンス: AIの次の波

>>: ニューラルネットワークを構築する超簡単な方法、あなたにもできます!

ブログ

神々の中年の戦いが始まった。どの国内大型モデルが華山の頂上を勝ち取ることができるのか？

ブログ

ネット全体が「被験者3」を真似し、メッシ、アイアンマン、二次元の女の子が即勝利

ブログ

Github ホットリスト: 2021 年の最もクールな AI 論文 33 件をレビュー!多くの中国人作家が選ばれた

ブログ

人工知能に基づく顔認識技術と評価システムの研究

ブログ

大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

ブログ

あなたはまだ自分が特別だと思っていますか?人工知能はあなたにノーと言うでしょう

ブログ

AIがメディア業界を変革、フェニックスTVがAIデータトラックに参入

ブログ

この記事では、人工知能がクラウドコンピューティングをどのように変え、私たちの生活にどのような影響を与えるかを説明します。

ブログ

カメラを開くと、2Dイラストがリアルタイムでアニメーション化されます。中国のプログラマーが制作し、デモはオンラインで入手できます。

神々の中年の戦いが始まった。どの国内大型モデルが華山の頂上を勝ち取ることができるのか？

ネット全体が「被験者3」を真似し、メッシ、アイアンマン、二次元の女の子が即勝利

Github ホットリスト: 2021 年の最もクールな AI 論文 33 件をレビュー!多くの中国人作家が選ばれた

人工知能に基づく顔認識技術と評価システムの研究

大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

あなたはまだ自分が特別だと思っていますか?人工知能はあなたにノーと言うでしょう

AIがメディア業界を変革、フェニックスTVがAIデータトラックに参入

この記事では、人工知能がクラウドコンピューティングをどのように変え、私たちの生活にどのような影響を与えるかを説明します。

推薦する

「AI＋コンピューティングパワー」が海外企業に「活力」を与えた

TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

専門家が使用する 15 個の機械学習ツール

AIが産業のデジタル変革をどのように促進するか

1760億のパラメータを持つBLOOMZの推論、パフォーマンスレイテンシはわずか3.7秒

精度が 20% 未満なので、GPT-4V/Gemini はコミックを理解できません。最初の画像シーケンスベンチマークがリリースされました

MD5 アルゴリズムを誤解している可能性があります。

600以上のベーキングレシピを分析し、機械学習を使用して新製品を開発しました

化粧品は顔認識技術を騙せるのか？