比類のない美しさ! AIが90年前の梅蘭芳を復元:目と眉毛が感情を伝え、生きているかのよう

比類のない美しさ! AIが90年前の梅蘭芳を復元:目と眉毛が感情を伝え、生きているかのよう

[[407844]]

約 100 年前の白黒画像にカラーを施すと、歴史的な意味がさらに増すのでしょうか?

最近、AI を使って崑曲オペラの一部が復元されました。

この映画は、1930年にアメリカで梅蘭芳が崑曲のオペラ「刺虎」を上演した際に制作されたものである。ブロガーは、100年前の旧北京のオリジナルサウンドトラックを復元したアップブロガーの@大谷Spitzerさんです。今回もAIを活用して、着色、フレームの塗りつぶし、ノイズ低減などの工程を完了し、90年前の梅蘭芳氏のスタイルを復元しました!

それを見たネットユーザーは「すごい!」と絶賛した。とても美しい!

貴重な映像が復元され、カラー化され、梅蘭芳を再び自分の目で見ることができる

映画の冒頭で、ハリウッドの中国人女優スー・ヨンは「梅蘭芳さんは女性役を演じましたが、文字通り女性の真似をしたわけではありません。実際の女性を真似しようとしたのではなく、セリフや動作を通して理想的な女性像を作り出そうとしたのです」と紹介した。

彼女の声には色が宿る!

すると、梅蘭芳さんの映像が映し出されました。

彼は「将軍は比類なき英雄、王朝の柱である…」と歌った。眉をひそめたり笑ったり、言葉や声色のひとつひとつが美しく、ドラマチックだった。

当時36歳だった梅蘭芳は、公演のためにアメリカへ渡った。これは彼の初期の舞台での唯一のビデオ映像であり、中国の京劇がアメリカに上陸した初めての機会でもあった。

色鮮やかな写真を見ていると、まるで1930年代にタイムスリップして、梅蘭芳氏の優雅さを自分の目で目撃したかのような気分になります。

古いため、このビデオ映像の音声付きビデオは 1 分間のみ残っており、サウスカロライナ大学のフィルム画像ライブラリに保存されています。

熱狂的なファンはこう語った。「オリジナルのビデオを100回以上見てきましたが、今回ようやく復元版を見ました!」

ブロガーの@大谷Spitzerに感謝の意を表す人もいました。

それで、今回大谷はどうやったんですか?

複数のオープンソースツール、RIFE + 中国プロジェクト GPEN が 1930 年に戻る

大谷氏は「前号の技術プロセスを引き継ぎ、RIFEやDeep-Exemplar-based-Video-Colorizationなどの一連の人工知能プロジェクトを使用しました。手描きと組み合わせて、この抜粋の修復を完了しました」と紹介しました。

その中でも、RIFE は古い画像の高いフレーム レート要件を満たすことができるリアルタイム ビデオ補間ソリューションです。

さらに、大谷さんがよく使うもう一つのフレーム埋めプロジェクトがDAINです。

彼が言及した2番目のプロジェクトは次の通りです。
ディープエグザンプラベースのビデオカラー化。

これは、画像検索と画像の色付けを組み合わせたモデルから生まれます。このモデルは、まず多数の参照画像からグレースケール画像に類似した画像を取得し、次に参照画像の配色をグレースケール画像に転送することで、非常に優れたカラー化効果を実現します。

「今回は、AI技術を使って音からノイズを除去し、元の音よりもクリアな音に仕上げました。同時に、新しいオープンソースAIプロジェクトGPENを試し、高解像度の顔面補正も行いました。」

GPEN(GAN事前埋め込みネットワーク)は、2021年に新しく登場したオープンソースプロジェクトです。中国人によって作成され、アジア人の肖像画の復元に優れた効果を発揮します。

結果は、最先端の盲人顔復元方法を大幅に上回る性能であることを示しています。

こうして、一連の手術を経て、梅蘭芳さんの素晴らしいオペラ公演が完成しました!

「90年代以降のフルスタックアーティスト」大谷がAIを使って時空を超えて旅する

大谷氏は1991年(30歳)北京生まれ、ニューヨークのスクール・オブ・ビジュアル・アーツでコンピューターアートの修士号を取得。アーティスト、ミュージシャン、プログラマー、そして独立系ゲームデザイナーとして、私の生産性は爆発的に向上しました。

Steam ゲーム、オリジナルのゲーム音楽、手描きスケッチ、アニメーションなど、彼の作品をぜひ体験してください。

フルスタックエンジニアについてはよく耳にしたことがあるかもしれませんが、フルスタックアーティストについてはご存知ですか?彼はゲーム、コミック、3D、VR、音楽に精通しています。もちろん、オープンソースに基づくいくつかの AI モデルを実行することも簡単です。

大谷氏は、これらのオープンソースのAIモデルを使用するだけでなく、優れたポストプロダクション技術と組み合わせることで、100年前の北京の古い生活や上海のファッションショーを人々の前に鮮やかに再現しました。

次回は誰が復帰すると予想しますか?

<<:  AIが高性能鋼材の設計を支援:破壊強度と破壊寿命を正確に予測

>>:  空飛ぶ脳?ヒントン氏のツイートは白熱した議論を引き起こした。ニューラルネットワークは鳥が飛ぶための「羽」なのか?

推薦する

初のオープンソースMoE大型モデル公開! 7Bx8の専門家、GPT-4に最も近いエピソード

「今夜の予定は全部キャンセル!」多くのAI開発者は寝ないことを決意しました。最初のオープンソース M...

人工知能の急速な発展により、私たちは職を失うことになるのでしょうか?

音声制御システムから今日のいくつかの無人技術まで、人工知能は徐々に成熟しています。ビッグデータセンタ...

畳み込みニューラルネットワークの簡単な説明

畳み込みニューラルネットワークネットワーク構造図図2 畳み込みニューラルネットワークの構造図畳み込み...

JavaScript における一般的なソートアルゴリズムの詳細な説明

諺にこうあります:雷鋒が雷鋒塔を倒し、Java が JavaScript を実装します。 Java ...

マイクロソフト、クラウド移行のための企業向けビジネス管理ツールを提供するAIMプログラムを開始

Microsoft は最近、顧客がローカル ERP および CRM アプリケーションをクラウドに移行...

2018年に人工知能はどのように発展するでしょうか?ここに8つの予測があります

編集者注:PwCは、2018年の人工知能の開発動向を調査し、8つの予測を行ったレポートを発表しました...

...

2021 年の人工知能、データ サイエンス、機械学習のトレンドの概要

人工知能とデータサイエンス、機械学習のトレンドとデータ分析AIはますますあらゆるビジネス戦略の一部に...

人工知能と教育の未来: 教師の関与を刺激する

要点: 教育における AI システムの開発者は現在、教師を支援するために取り組んでいます。信頼できる...

自動配送物流における人工知能の応用

[[406604]]コロナウイルスの流行を受けて、企業はサプライチェーンの複雑性と労働力不足の課題を...

...

ディープラーニングのためのヘテロジニアス アクセラレーション テクノロジー (パート 2): カタツムリの殻の中に道場を構築する

1. 概要記事「ディープラーニング向けヘテロジニアスアクセラレーションテクノロジー(パート1)」で説...

無線ルーターのさまざまな暗号化アルゴリズムの包括的な説明

ワイヤレス ルーターは、ワイヤレス ネットワークの開発において非常に重要な役割を果たします。ここでは...

...