英国人映画監督が人工知能(AI)を使って外国映画の鑑賞方法に革命をもたらそうとしている。俳優の顔をデジタル編集し、吹き替えの言語を話しているように見せるのだ。
スコット・マン監督は、ロバート・デ・ニーロ主演の2015年のスリラー映画『オルタード』を監督したが、同映画の吹き替え版に衝撃を受けた。彼は自分自身のスタートアップを立ち上げようという意欲に駆られました。 マン氏は、顔画像をデジタルで再生する研究を行っているドイツのマックス・プランク情報科学研究所にインスピレーションを受けた。この研究がきっかけで彼は会社を設立した。同社は、俳優の頭、首、口の動きの微妙な変化を何百万回も研究し、すべてのフレームから知識を蓄積する人工知能システムを使用している。 この人工知能ツールは、映画から俳優の 2D 顔画像を抽出し、3D 画像に再現します。新しい頭部の画像には、映画の中で吹き替えられた言語を使用するときに人々の口がどのように動くかについての既存の知識が組み込まれています。このツールは、特定の言語を話す俳優の口の動きを計算し、フレームごとに新しい 3D 頭部モデルを作成します。 これが完了すると、声優の録音がシステムに取り込まれ、画像が 2D に再変換されます。その後の仕上げ作業は特殊効果チームに引き継がれた。同社が公開した映像では、映画「フォレスト・ガンプ」の映像でトム・ハンクスの唇の動きが日本語、スペイン語、ドイツ語の吹き替えのセリフとシームレスに一致している。 AIシステムは映画のすべてのフレームをスキャンし、俳優が話しているときの頭、首、口の動きを観察します。システムは俳優の独特な話し方を学習した後、俳優の頭部の 3D モデルを作成します。 次に、エンジニアは、吹き替え言語を話す人の典型的な口の動きを認識し、その特定の言語を話すときの俳優の独特な口の動きを計算できるプログラムを実行します。 新しい言語を話す声優の録音がシステムに入力されます。次に、システムは俳優の口と顔の動きが新しい言語に同期されたすべてのフレームに対して俳優の頭の新しい 3D モデルを作成し、俳優が話しているすべてのカメラアングルがカバーされるようにします。これらの画像は実写版の上に重ねられ、特殊効果チームによって最終仕上げが施されます。 |
>>: 10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました
上級数学の試験で悪い成績を取ることは、多くの人にとって悪夢です。高度な数学は AI ほど得意ではない...
[[414048]]この記事では、面接の質問と面接のシナリオを使用して、再帰アルゴリズムの時間計算量...
AI 戦略を導入する前に、企業はプライバシーを保護し、セキュリティ標準への準拠を確保するために新しい...
[[262283]]時代の進歩とさまざまな技術の継続的な発展により、私たちの日常生活は大きな変化を遂...
科学技術の急速な発展に伴い、人工知能(AI)はさまざまな分野にますます統合されつつあり、農業分野も例...
[[402949]]顔認識技術の向上が進む一方で、その技術を取り巻くプライバシーに関する懸念も浮上し...
著者 | 崔昊レビュー | Chonglouまとめこの記事では、情報検索とテキスト生成の最新の進歩に...
[[279290]] [51CTO.com クイック翻訳] 大学はどのようにして、個人の教育キャリ...
U+のレポートによると、風力発電所などの他のクリーンエネルギー源と組み合わせて人工知能を使用すると...
分布の不一致を避けるために、強化学習のトレーニングはオンラインで環境と対話する必要がありますか? G...
「Qwen-72Bモデルは11月30日に発売されます。」数日前、Xプラットフォームのネットユーザー...