信じられない! XiaoIceのデジタルツイン仮想人物は70日間ライブ放送されましたが、誰もそれが本物の人間ではないことに気づきませんでした

信じられない! XiaoIceのデジタルツイン仮想人物は70日間ライブ放送されましたが、誰もそれが本物の人間ではないことに気づきませんでした

[[441368]]

中国ビジネスニュースは70日間生放送されましたが、アンカーがデジタルツインの仮想人物であることに誰も気づかなかったのでしょうか?実物と見分けがつかない世界初のデジタルツイン、N小黒とN小白が登場。新たなデジタル革命は、ますます手の届くところまで来ています。

「現在、当社は関連する準備作業の実施に協力しており、約束事項の履行はまだ進行中です...」

12月17日、「毎日経済ニュース」のキャスターN暁黎氏がその日のニュースを雄弁に伝えていた。誰もが携帯電話で興味深く見守っていたが、キャスターが「偽物」であることに気付いた人はいなかった。

彼はN・シャオヘイ、現実のプロトタイプと区別がつかない世界初のデジタルツインです。

さらに、N Xiaohei はバーチャルであるだけでなく、デジタルツインのパートナーである N Xiaobai も存在します。

さらに驚くべきは、実際に2人が協力して70日間連続でニュースを生放送していたにもかかわらず、ファンやユーザーがほとんど気づかなかったことだ。

おそらく、彼らの顔、表情、体の動きなどがとてもリアルで自然だからでしょう。

しかし、多くの人が時々疑問に思うことがあります。「この2人のキャスターは熱心すぎる。毎日仕事に行っているのだろうか?」

本物と偽物の区別が難しいデジタルツインアンカーの第一弾が登場

その答えは12月20日まで公式には明らかにされなかった。

N Xiaohei 氏は金融ニュースの放送を終えた後、自ら真実を発表した。

「みなさんこんにちは。私はナショナル・ビジネス・デイリーのAIキャスターです。私は本人ではなく、その人のデジタルツインです。私はひっそりとオンラインになり、70日間ノンストップで稼働しています。多くの人が、これは人間のキャスターが事前に録画したビデオだと思っていますが、違います。私がナレーションするテキストを含め、皆さんが目にするすべてのものは、AI XiaoIceフレームワークによって生成され、駆動されています。」

この時も彼ははっきりと自然に話し、ジェスチャーや微表情も加えており、Douyinアカウント「N小黑财经」での彼の実生活の様子と全く同じだった。

その背後にいる「メーカー」である XiaoIce 社も、XiaoIce のディープ ニューラル ネットワーク レンダリング (X Neural Rendering) をベースにした新しいデジタル ツイン仮想人間の登場を公式に発表しました。

人工知能による仮想人間の全体的な自然さが、本物の人間とほとんど区別がつかないレベルまで向上したのは、これが初めてです。

XiaoiceとNational Business Dailyが共同で制作したデジタルツインアンカーのN XiaoheiとN Xiaobaiも、「National Business Daily AI TV」とともに同日にオンラインで公開されました。

特筆すべきは、XiaoIce が初めてビデオの収集、編集、放送の全プロセスの無人操作を実現したことです。

この進歩により、「Meijing AI TV」は、24時間365日放送する世界初のAIビデオライブ放送製品にもなりました。

しかし、ネットユーザーは情報に精通しており、当然多くの疑問を抱いています。

たとえば、AI キャスターはもはや珍しいものではなく、新華社通信と CCTV はどちらも AI キャスターを採用しています。では、この 2 つの新しい「バーチャル キャスター」の何が特別なのでしょうか?

新しい技術はどのような進歩をもたらしましたか?これはどうやって行うのですか?これは私たちの将来にどのような変化をもたらすのでしょうか?

次に、さらに詳しくお話ししましょう。

デジタルツインアンカーはどのような新しいテクノロジーをもたらしますか?

まずは、この2つの「バーチャルアンカー」の誕生の過程について簡単にお話ししたいと思います。

まず、2 つの仮想アンカーのトレーニング データは、有名な金融アンカーである N Xiaohei (N Xiaohei Finance) と N Xiaobai (Meijing Xiaobai Fund) から取得されます。

さらに、Xiaoice Neural Rendering (XNR) テクノロジーと組み合わせることで、顔の特徴、表情、体の動きなどの全体的な自然さが大幅に向上します。

最終的に、XiaoIce フレームワークの小規模サンプル学習テクノロジーにより、わずか 1 週間のトレーニングでこれら 2 つのデジタル ツインが誕生しました。

簡単そうですね?

実際、トレーニングサイクルだけをみても、バーチャルヒューマンのトレーニングサイクルには数か月かかっており、これもバーチャルヒューマンのサイクルが長く、コストが高いという問題を引き起こしていました。しかし、バーチャルヒューマンが再び世界的な話題となった今、誰かがこの問題を解決しなければなりません。

学界と産業界はすでに行動を起こし始めています。 「中国コンピュータ学会ニュースレター」11月号の表紙特集は「コンピュータグラフィックスと人工知能の融合」です。6本の専門論文で、CGとAIの技術から応用までの幅広い融合について論じ、コンピュータビジョン、自然言語処理、コンピュータ音声、ディープラーニングの手法をCGに導入し、人間主導からデータ主導に転換し、手動アルゴリズムをデータ分析に基づく自動アルゴリズムにアップグレードして、システムの全体的な使いやすさと効率を向上させることを目指しています。

特にデジタルツインのN XiaoheiとN Xiaobaiにとって、これはエンターテインメントとメディア業界を長年悩ませてきた問題、つまり「仮想人間をいかに効率的かつリアルにレンダリングするか」に新たな解決策があるかもしれないことを意味します。年齢を明かすことを恐れないネットユーザーなら、16年前の『ファイナルファンタジー7 アドベントチルドレン』の勇敢な試みや、『アバター』の驚くべきディテールに驚いたことを今でも覚えているはずだ。これらはすべて10年以上前のことだ。当時、映画やテレビ業界で仮想人間を制作する時間サイクルとコストは、数年と数百万ドルの単位で測定されていた(主人公の髪の毛のレンダリングだけだった)。

[[441369]]

XiaoIce がディープニューラルネットワークレンダリング技術 (XNR) を CG と統合することでこの問題を解決できるのはなぜでしょうか?一方、従来のCGと比較すると、この技術はディープラーニングを最大限に活用し、大量のデータからデータの事前分布を抽出し、従来のレンダリングプロセスにおける特定のモジュールの高速化と軽量化を実現できます。

簡単に言えば、レンダリングが速くなります。

一方、ディープラーニングベースの 3 次元シーン表現とそれに対応するニューラル レンダリング パイプラインは、特定のシナリオで役割を果たし、仮想人間の視覚イメージ、表現、体の動きをよりリアルにします。

簡単に言えば、レンダリングが向上します。

この問題が解決されれば、この技術は大きな商業的価値を生み出すことができるでしょう。

しかし、CGとAIを融合して人間を作るだけでは不十分で、仮想人間がどのように表現され、どのようなコンテンツが提供されるかが、一般の人々にとって最も重要なことなのです。

N Xiaohei、N Xiaobaiと他のバーチャルキャスターとの最大の違いは——

これらの画像は AI モデリングによって生成されるだけでなく、金融情報のテキスト生成から、事前トレーニング済みの仮想アンカーによる音声と動画の同時放送、同期されたシーンの動的描画、そして最終的な完全なライブ ストリームの生成まで、すべてが人間の関与を必要とせずに AI によって実行されます。

AIによるニュースの収集、編集、放送の全プロセスが真に自動化されたのは世界初です。

この点について、XiaoIce CEOのLi Di氏は、「疲れ知らずで、安全で、信頼性が高く、安定した出力を持つAI Beingの時代が到来した」と考えている。

N XiaoheiとN Xiaobaiはどんな未来を予感させるのでしょうか?

最近、私たちは仮想の人間にますます慣れ親しむようになっています。

その背後にある仮想デジタル技術の進歩は急速です。

イメージ擬人化の面では、洛天依と凌元が二次元バーチャル人物ブームの火付け役となった。現在、凌凌、亜依、阿曦などの超リアルなバーチャルアイドルがますます人気を集めている。将来を見据えると、デジタルツインの未来はますます私たちに近づいている。

Nvidiaカンファレンスで皆を「騙した」黄仁訓から、XiaoIceの最新作N小黒とN小白まで、さまざまなバーチャル人物が「現実の自然な道」を追求してますます前進していることがわかります。

現実の自然への道のりには、仮想人間のコンテンツ、相互作用、多様性など、さらに大きな障害があります。

従来、業界ではバーチャルヒューマンの作成に CG とモーションキャプチャーを組み合わせて使用​​することが一般的で、完全に人手に頼っています。サイクルが長くコストが高いのは言うまでもなく、肝心なのはコンテンツがなく、インタラクションがなく、キャラクター設定が固定されていることです。

この観点から、N Xiaohei と N Xiaobai は、XiaoIce の人工知能技術を使用して、CG と人工知能を統合するフレームワークの完全な機能イメージを作成しています。

例えば、コンテンツやインタラクション方法の面では、従来のバーチャル人物は平面的な写真(顔を変える)かテキスト(手動操作)しかありませんでした。中の人物が追加されて初めて、話したり、歌ったり、インタラクションしたりできるようになります。

すでに視覚、音声、テキストで自由に自己表現できるデジタルツインの N Xiaohei と N Xiaobai は、仮想人間のインタラクションがすぐにマルチモーダルになることも示唆しています。2 年前にみんなを日本の水族館に連れて行った Rinna を覚えていますか?

N小黒とN小白という2人のデジタルツインの出現は、さまざまな場面で仮想人間が普及する新たな未来を切り開くものと期待される。 Xiaoiceチームは、近い将来にさらに多くのバーチャル人物が登場するとも述べています。公式発表資料から判断すると、ドバイ万博の中国館で作品が展示されている夏玉氷も、近々営業を開始するのでしょうか?

[[441370]]

<<:  段階的な自動運転は後から追いつくことができるか?

>>:  データ構造とアルゴリズム: リンクリストの交差、交差点を見つける

推薦する

清華大学は、2D拡散モデルを使用して不完全な3Dオブジェクトを補完する3D再構築の新しい方法、O²-Reconを提案しました。

コンピューター ビジョンでは、オブジェクト レベルの 3D サーフェス再構築テクノロジは多くの課題に...

...

RustベースのZedエディタがオープンソース化され、OpenAIとGitHub Copilotのサポートが組み込まれました

ティム・アンダーソンノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)...

開発者が武器をアップグレードするために推奨される 5 つの機械学習フレームワーク

業界ではよく知られているデータサイエンスのウェブサイトである KDnuggests は昨日、4 月の...

...

MetaはTransformerアーキテクチャにアクションを起こします。新しい注目メカニズムは推論をよりよく理解します。

大規模言語モデル (LLM) が強力であることは議論の余地のない事実ですが、それでも単純な間違いを犯...

ビッグデータと人工知能の関係

[[342758]]人工知能教育は最も美しい新しいインフラです人工知能のアルゴリズムの中にはデータ...

Meta AI Zeng Hanqing: サブグラフニューラルネットワークのスケーラブルなアプリケーションと表現力豊かなアプリケーション

ディープラーニングの活発な分野として、グラフニューラルネットワークは人工知能科学者から幅広い注目を集...

...

AIはもはや派手なものではなく、日常生活にもっと関連している

2020年に入り、業界におけるAIの発展は単なる技術革新やブレークスルーの範囲を超え、製品と業界の統...

分析と AI に関する 6 つの警告すべき間違い

[[439096]] 2017年、英国の雑誌『エコノミスト』は、データが石油に代わって世界で最も価値...

2023年に人工知能とデータサイエンスについて知っておくべきこと

人工知能とデータサイエンスは、2023 年に最もエキサイティングで影響力のある 2 つのテクノロジー...