世界初の3D AI合成キャスターがデビューし、2つのセッションの取材にも参加。ネットユーザー：キャスターは失業中

[[327147]]

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

みなさんこんにちは。私はAI合成アンカーファミリーの新メンバー、Xin Xiaoweiです。

きちんとした髪と青いスーツを着た「新小微」はニュースデスクの前に座り、真剣な表情で話した。

AI合成アンカーは珍しくないが、「Xin Xiaowei」は歩行、ジェスチャー、着替えができる世界初の3D AIアンカーだ。

「辛小薇」は就任後すぐに、今年の全国人民代表大会と中国人民政治協商会議のニュース・情報放送に参加することになった。

中小企業が新規採用

「新小微」は、AIによって駆動され、3D技術で表現されるニュース業界初のAI合成キャスターです。その原型は新華社通信の趙万微記者です。

これまでのAI合成キャスターと比べ、「新小微」の最大の違いは3D特性にあり、放送フォーマットを豊かにし、さまざまな角度から総合的に表現できる。

[[327148]]

従来の単一被写界深度

[[327149]]

Leifeng.com 注記: 「新小微」がバーチャルスタジオに登場 (写真提供: 新華社)

これまでのAI合成アナウンサーは主に特定の姿勢で座ってニュースを放送していたのに対し、「新小微」は歩く、回るなどの体の動きもできることがわかります。

それだけでなく、「新小微」の表情もより多様化しており、もはや単なる「プロの作り笑顔」ではなく、より多くの微細な表情を持っています。

[[327150]]

Leifeng.com 注: 画像出典: 新華社通信

AI 合成アンカーはますます人間に似てきていると言わざるを得ません。

「新小威」は立体感や重層感の向上に加え、インテリジェンス面でも新たな改良が施されている。「新小威」プロジェクトリーダーは、人工知能のリアルタイム駆動により、3DバージョンのAI合成アンカーは機能の継続的な自己更新を実現できると述べた。

例えば、「メイク・衣装」の面では、「新小薇」はこれまでのAIキャスターよりも「美しい」と言えます。彼女の髪型やメイクは、さまざまなシーンやさまざまなニュース報道のニーズに合わせて変えることができます。

さらに、「新小微」のメイクは毛穴まで見えるほど細かい。

前述の通り、「新小衛」は両会期中に正式に就任し、定量的なニュース放送ビデオの制作を行う。

新華社によると、「新小微」は対応するテキストコンテンツを機械に入力するだけで、ニュースを放送したり、さまざまな意味に基づいて表情情報や体の動きを生成したりできるという。

「新小薇」はますます賢くなり、継続的な反復を経て、「新小薇」の舞台はスタジオだけではありません。関係者はこう語った。

3Dバーチャルシーンが拡大し続けるにつれ、「新小微」はスタジオの外へ出て、さまざまなシナリオでのニュースプレゼンテーションの多様なニーズによりよく応えるようになります。

十分な実力があれば、スタジオから出て行くことも夢ではないようです。

ネットユーザーが職を失うかもしれないと嘆くのも不思議ではない。

[[327151]]

AIアンカーが3D時代へ

パフォーマンスの面から見ると、表情の情報、体の動き、メイクの変化、あるいはニュースを報道する専門的な能力など、どの点でも「新しい小微」は前者よりも優れています。

問題は、AI合成アンカーの「新しい波」として、「新小威」がどのような技術を使って「古い波」を打ち破って浜辺に打ち上げるのかということです。

デジタルヒューマンモデルに関しては、「Xin Xiaowei」はスキャンと復元、顔の筋肉の駆動、表情と手足のキャプチャなどの技術を使用して、リアルな髪と肌の効果を復元します。

体の動きに関して言えば、収集作業には膨大な量のデータが関係する。「新小微」のプロトタイプである趙万微は、数百台のカメラが体の各部を360°全方位「ドット」スキャンするデータ収集ヘルメットをかぶる必要がある。

それだけでなく、カメラのデータ収集作業には表情のスキャンも含まれており、あらゆる形を詳細に捉えることができ、「新しい小微」誕生の基礎となっています。

さらに、Sogouのエンドツーエンドのマルチモーダルモデリング技術に基づいて、音声、画像、テキスト、3D筋肉動作データなどのマルチモーダル情報を組み合わせることで、「新小威」のモデリングトレーニングを完了することができます。

AIアルゴリズムの駆動により、「新小微」の専門能力がさらに強化され、音声テキストに合わせて顔の表情、唇の動き、ボディランゲージがすべて変化します。

「新小薇」のメイクや服装の変化は、その「マイクロモジュール」特性に基づいています。プロジェクトリーダーはさらに次のように説明した。

まるでレゴで遊ぶように、「新小威」のさまざまなパーツや表情をモジュール化し、それを組み立て直しました。

AI合成アンカーファミリー

「新小微」の就任により、新華社通信のAI合成キャスターファミリーに新たなメンバーが加わった。

2018年11月7日、新華社はホストQiu Haoをベースにした世界初の完全シミュレーションインテリジェントAIホスト「Xin Xiaohao」を歓迎しました。

[[327152]]

公式統計によると、初のAI合成キャスター「新小昊」は新華社クライアント上で500日以上視聴者にサービスを提供し、1万3000件以上のニュースレポートを制作し、累計時間は3万5000分を超えた。

SogouのCEOである王小川氏は、このインテリジェントAIホストは「Sogouアバター」技術に基づいており、実際のホストの声、唇の形、表情などの特徴を抽出し、音声合成、唇の形合成、表情合成、ディープラーニング技術を通じてそれらを複製すると紹介した。ニュースを放送する際には、テキストを提供するだけで、AI合成アンカーが模擬放送を行うことができます。

しかし、第一世代の AI 合成アンカーは素晴らしいものの、まだいくつかの欠点があります。たとえば、以前の AI 合成アンカーのプロトタイプには男性しかおらず、女性はいませんでした。また、合成アンカーには顔の表情しかなく、体の動きはありませんでした。

2019年2月から3月にかけて、AI合成キャスターは2回のバージョンアップを経て、世界初のAI合成女性キャスター「鑫小萌」が誕生しました。

「新小萌」は、第一世代のAI合成キャスターと比べて、ユーザーのニュース視聴体験をさらに向上させ、座ってニュースを放送するだけでなく、体の動きも加えています。

また、バージョンの反復により、AI 合成アンカーのカスタマイズサイクルも継続的に短縮されます。初期の技術はまだ成熟していなかったため、大量のデータが必要でした。繰り返し作業を行うことで録画時間が短縮され、録画されるデータ量も削減されるため、数時間のビデオ素材でリアルな画像を形成できるようになります。

「新小豪」から「新小夢」、そして「新小微」まで、AI合成キャスターが登場するたびに2つの異なる声が上がり、技術の進歩を称賛する一方で、その欠点を指摘する声もある。

[[327153]]

新しく発売された「新小微」を例に挙げると、一部のネットユーザーは「AI」と読むときの「新小微」の発音が少しぎこちないと指摘しており、これも間接的に「新小微」が十分に自然ではなく、まだ完全に人間のようではないことを示しています。

しかし、技術の発展には少しずつ量的な変化を積み重ねることが必要であり、継続的な反復とアップグレードを通じて改善されなければなりません。この観点から、「新小威」は進歩を遂げてきました。

<<: GoogleはAIを使って「ヘッドフォンケーブル」をトレーニングし、タッチスクリーンのほとんどの機能を実現

>>: 優れたビジネス機械学習のユースケース 5 つ

世界初の3D AI合成キャスターがデビューし、2つのセッションの取材にも参加。ネットユーザー：キャスターは失業中

中小企業が新規採用

AIアンカーが3D時代へ

AI合成アンカーファミリー

91.3%の成長、「スマート」な製造業の実現は協働ロボットにかかっている

ディープラーニングと自動テキスト要約が出会うとき

エントリーレベルのデータベースアルゴリズム [パート 2]

GoogleのAIオープンソース成果物は3年前に誕生し、想像もつかないような多くの場所で使用されている。

60年ぶり！ AI が新しい抗生物質の最初のバッチを発見し、MIT の主要な研究が Nature に掲載されました。人類はスーパーバグとの戦いに希望を持っている

誰もが知っておくべき 3 つの機械学習アルゴリズム

AIの未来: データだけでは不十分

音声認識技術はどのように発展したのでしょうか?

自動化とエンタープライズAIは2021年に大きく成長する

ドローンは将来何ができるのか

推薦する

エンタープライズ AI の 4 つのトレンド: 現在地と今後の方向性

IDCは、年平均成長率31.4%で、世界のAIソフトウェアの収益は2027年に2,790億ドルに達すると予測している。

注目すべきデータ視覚化の5つの新たなトレンド

公式スタンプ！ 35の大学がAI専門建設資格の第1期生を取得

Facebook エンジニアがまとめた 14 種類のアルゴリズム面接モード

第 5 世代の XiaoIce は、率先して電話をかけて「議論」するかもしれませんが、その鋭い舌により、コンバージョン率が最も高い AI アシスタントになりました。

エンジニアとして、アルゴリズムに取り組んでいる人の方があなたよりも稼いでいるのはなぜですか?

生成型人工知能とは何かについて話しましょう

新しいNeRF技術は、ビデオを簡単に制御できる3Dモデルに変換できます。