この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 みなさんこんにちは。私はAI合成アンカーファミリーの新メンバー、Xin Xiaoweiです。 きちんとした髪と青いスーツを着た「新小微」はニュースデスクの前に座り、真剣な表情で話した。 AI合成アンカーは珍しくないが、「Xin Xiaowei」は歩行、ジェスチャー、着替えができる世界初の3D AIアンカーだ。 「辛小薇」は就任後すぐに、今年の全国人民代表大会と中国人民政治協商会議のニュース・情報放送に参加することになった。 中小企業が新規採用「新小微」は、AIによって駆動され、3D技術で表現されるニュース業界初のAI合成キャスターです。その原型は新華社通信の趙万微記者です。 これまでのAI合成キャスターと比べ、「新小微」の最大の違いは3D特性にあり、放送フォーマットを豊かにし、さまざまな角度から総合的に表現できる。
従来の単一被写界深度 Leifeng.com 注記: 「新小微」がバーチャルスタジオに登場 (写真提供: 新華社) これまでのAI合成アナウンサーは主に特定の姿勢で座ってニュースを放送していたのに対し、「新小微」は歩く、回るなどの体の動きもできることがわかります。 それだけでなく、「新小微」の表情もより多様化しており、もはや単なる「プロの作り笑顔」ではなく、より多くの微細な表情を持っています。
Leifeng.com 注: 画像出典: 新華社通信 AI 合成アンカーはますます人間に似てきていると言わざるを得ません。 「新小威」は立体感や重層感の向上に加え、インテリジェンス面でも新たな改良が施されている。 「新小威」プロジェクトリーダーは、人工知能のリアルタイム駆動により、3DバージョンのAI合成アンカーは機能の継続的な自己更新を実現できると述べた。 例えば、「メイク・衣装」の面では、「新小薇」はこれまでのAIキャスターよりも「美しい」と言えます。彼女の髪型やメイクは、さまざまなシーンやさまざまなニュース報道のニーズに合わせて変えることができます。 さらに、「新小微」のメイクは毛穴まで見えるほど細かい。 前述の通り、「新小衛」は両会期中に正式に就任し、定量的なニュース放送ビデオの制作を行う。 新華社によると、「新小微」は対応するテキストコンテンツを機械に入力するだけで、ニュースを放送したり、さまざまな意味に基づいて表情情報や体の動きを生成したりできるという。 「新小薇」はますます賢くなり、継続的な反復を経て、「新小薇」の舞台はスタジオだけではありません。関係者はこう語った。
十分な実力があれば、スタジオから出て行くことも夢ではないようです。 ネットユーザーが職を失うかもしれないと嘆くのも不思議ではない。
AIアンカーが3D時代へパフォーマンスの面から見ると、表情の情報、体の動き、メイクの変化、あるいはニュースを報道する専門的な能力など、どの点でも「新しい小微」は前者よりも優れています。 問題は、AI合成アンカーの「新しい波」として、「新小威」がどのような技術を使って「古い波」を打ち破って浜辺に打ち上げるのかということです。 デジタルヒューマンモデルに関しては、「Xin Xiaowei」はスキャンと復元、顔の筋肉の駆動、表情と手足のキャプチャなどの技術を使用して、リアルな髪と肌の効果を復元します。 体の動きに関して言えば、収集作業には膨大な量のデータが関係する。「新小微」のプロトタイプである趙万微は、数百台のカメラが体の各部を360°全方位「ドット」スキャンするデータ収集ヘルメットをかぶる必要がある。 それだけでなく、カメラのデータ収集作業には表情のスキャンも含まれており、あらゆる形を詳細に捉えることができ、「新しい小微」誕生の基礎となっています。 さらに、Sogouのエンドツーエンドのマルチモーダルモデリング技術に基づいて、音声、画像、テキスト、3D筋肉動作データなどのマルチモーダル情報を組み合わせることで、「新小威」のモデリングトレーニングを完了することができます。 AIアルゴリズムの駆動により、「新小微」の専門能力がさらに強化され、音声テキストに合わせて顔の表情、唇の動き、ボディランゲージがすべて変化します。 「新小薇」のメイクや服装の変化は、その「マイクロモジュール」特性に基づいています。プロジェクトリーダーはさらに次のように説明した。
AI合成アンカーファミリー「新小微」の就任により、新華社通信のAI合成キャスターファミリーに新たなメンバーが加わった。 2018年11月7日、新華社はホストQiu Haoをベースにした世界初の完全シミュレーションインテリジェントAIホスト「Xin Xiaohao」を歓迎しました。
公式統計によると、初のAI合成キャスター「新小昊」は新華社クライアント上で500日以上視聴者にサービスを提供し、1万3000件以上のニュースレポートを制作し、累計時間は3万5000分を超えた。 SogouのCEOである王小川氏は、このインテリジェントAIホストは「Sogouアバター」技術に基づいており、実際のホストの声、唇の形、表情などの特徴を抽出し、音声合成、唇の形合成、表情合成、ディープラーニング技術を通じてそれらを複製すると紹介した。ニュースを放送する際には、テキストを提供するだけで、AI合成アンカーが模擬放送を行うことができます。 しかし、第一世代の AI 合成アンカーは素晴らしいものの、まだいくつかの欠点があります。たとえば、以前の AI 合成アンカーのプロトタイプには男性しかおらず、女性はいませんでした。また、合成アンカーには顔の表情しかなく、体の動きはありませんでした。 2019年2月から3月にかけて、AI合成キャスターは2回のバージョンアップを経て、世界初のAI合成女性キャスター「鑫小萌」が誕生しました。 「新小萌」は、第一世代のAI合成キャスターと比べて、ユーザーのニュース視聴体験をさらに向上させ、座ってニュースを放送するだけでなく、体の動きも加えています。 また、バージョンの反復により、AI 合成アンカーのカスタマイズ サイクルも継続的に短縮されます。初期の技術はまだ成熟していなかったため、大量のデータが必要でした。繰り返し作業を行うことで録画時間が短縮され、録画されるデータ量も削減されるため、数時間のビデオ素材でリアルな画像を形成できるようになります。 「新小豪」から「新小夢」、そして「新小微」まで、AI合成キャスターが登場するたびに2つの異なる声が上がり、技術の進歩を称賛する一方で、その欠点を指摘する声もある。
新しく発売された「新小微」を例に挙げると、一部のネットユーザーは「AI」と読むときの「新小微」の発音が少しぎこちないと指摘しており、これも間接的に「新小微」が十分に自然ではなく、まだ完全に人間のようではないことを示しています。 しかし、技術の発展には少しずつ量的な変化を積み重ねることが必要であり、継続的な反復とアップグレードを通じて改善されなければなりません。この観点から、「新小威」は進歩を遂げてきました。 |
<<: GoogleはAIを使って「ヘッドフォンケーブル」をトレーニングし、タッチスクリーンのほとんどの機能を実現
[51CTO.com クイック翻訳]インド工科大学 (IIT マドラス) の研究者らは、人間のように...
私たちは市内を運転中に、このようなことが何度も起こるのを見てきました。人々は前方の交通状況を気にせず...
2023 年の新規建設の大幅な増加は、データ センターの空室率が史上最低水準にある重要な時期に起こり...
最近、OpenAI は、最新の生成人工知能モデル GPT-4 を使用してコンテンツレビューを行い、手...
[[346356]] 0. はじめにみなさんこんにちは。私は、複数選択パラメータのプログラマーポッ...
著者 | 屈譚旭洋 他LBS (位置情報サービス) の距離制約により、候補数が少ないと店内広告ランキ...
11月29日、海外メディアの報道によると、マイクロソフトは最近、機械学習モデルを.NETアプリケーシ...
[51CTO.com クイック翻訳]グラフィックは人々の仕事や生活のいたるところに存在します。たと...
[[355279]] 2018 年 2 月の Gartner レポートによると、「2020 年までに...
1. シーン分類 顔認識:セキュリティ監視認識、顔アクセス制御、有名人の顔、VIP ID認識など。人...
[[319769]]今日、デジタルサイエンスは企業にとってますます魅力的になっています。しかし、デジ...
[51CTO.com からのオリジナル記事] SIEM はエンタープライズ セキュリティの中核ハブで...
[[195170]] [51CTO.com からのオリジナル記事]最近、私たちの画面には、「どの有名...