合成データのみでリアルな顔解析が可能!マイクロソフトの新しい研究は、手動ラベル付けに別れを告げる

合成データのみでリアルな顔解析が可能!マイクロソフトの新しい研究は、手動ラベル付けに別れを告げる

[[427464]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

さらに、顔分析タスクでは、その精度は実際のデータに劣りません。

これは Microsoft チームによる最新の研究であり、論文のタイトルがすべてを物語っています。

成功するまで偽り続けなさい。

この記事では、プログラムで生成された 3D 顔モデルと合成データベースを組み合わせて画像をトレーニングする方法を紹介します。顔の解析などのタスクの結果は、実際のデータと比較できます。

研究者らは、これにより手作業によるラベル付けが不可能な分野に新たな方法が開かれたと述べた。

将来、本当に手作業によるラベル付けはなくなるのでしょうか? !

どうやってそれを達成するのでしょうか?

顔データセットをより多様で豊かにしたい場合、収集とラベル付けによってそれを実現することはますます困難になっています。

言うまでもなく、Web スクレイピングなどの収集は、重大なプライバシーおよび著作権の問題を引き起こす可能性があります。手動でラベルを付ける場合、エラーが発生したり、ラベルに一貫性がなくなったりする可能性があります。

そのため、研究チームは、実際のデータの補強または置き換えに合成データを使用することを検討しました。しかし、顔モデル自体が複雑なため、実装が困難でした。

それで、今回はどのように達成されたのでしょうか?

最初のステップは、プログラムを使用して、アイデンティティ、表情、顔の質感、髪型、服装、さまざまな照明環境下での効果を含む合成顔を生成することです。

これらのデータはすべて個別にサンプリングされ、より多様な個体が作成されるように事前に「手動で」ノイズが除去されました。

例えば顔モデルではこんな感じです〜

例えば衣服はファッションデザイナーやシミュレーションソフトウェアデザイナーによって手作りされており、合計30セットのさまざまな衣服がありました。

ヘッドドレス(36個)、マスク(7個)、メガネ(11個)も含まれています。

これに加えてタグが合成されます。

トレーニング段階に移り、研究者らは解像度 512 × 512 の 10 万枚の画像のデータセットを作成し、データ拡張を実行し、150 個の NVIDIA M60 GPU を使用して 48 時間レンダリングしました。

さらに、チームは顔解析ネットワーク(合成データのみを使用)とラベル適応ネットワークをトレーニングし、合成ラベルと人間が注釈を付けたラベル間の体系的な違いを考慮しました。

最終的に、顔分析やランドマークの位置特定などのタスクの結果は、実際のデータを使用する他のモデルに匹敵します。

しかし、研究者たちはこの技術にはまだ一定の限界があることを認めている。

たとえば、顔のモデルには頭と首しかなく、実際のしわをシミュレートできず、顔をランダムにマッチングすると、ひげを生やした女性など、不合理な顔が生成されます。

今後の研究では、これらの制限に対処する予定です。

興味のある方は下の論文リンクをクリックしてください〜

論文リンク:
https://www.arxiv-vanity.com/papers/2109.15102/

<<:  「未来ロボット」が1億元の資金調達を完了。自動物流が次の「阿修羅場」となるか?

>>:  携帯電話に搭載された3D姿勢推定は、モデルサイズが類似モデルの1/7しかないが、誤差はわずか5cmである。

ブログ    
ブログ    
ブログ    

推薦する

脳コンピューターインターフェースツール:脳波からテキストまで、必要なのは機械翻訳モデルだけ

[[320655]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

フラッシュは廃止されるが、5G時代の新技術は過去を思い出す暇を与えないだろう

Adobe が 2020 年 12 月 31 日をもって有名な Flash ソフトウェアのサポートを...

あまり知られていないがプライバシーを保護するトレーニング方法:フェデレーテッドラーニング

[[261420]]ビッグデータダイジェスト制作出典: MITテクノロジーレビュー編集者: stat...

人工知能技術は子供たちにどのような影響を与えるのでしょうか?

人工知能技術は、おもちゃ、オンライン アプリケーション、ビデオ ゲームに組み込まれています。AI ア...

人工知能産業の将来は、パンデミックの最中に過大評価されているのでしょうか?

これまで、私を含め、ほとんどの人は、今回の流行が経済に及ぼす影響は段階的かつ一時的な変動に過ぎないと...

データセキュリティリスクのため、米国宇宙軍はChatGPTなどの人工知能ツールの使用を一時停止

ロイターが確認したメモによると、10月12日、米宇宙軍はデータセキュリティに関する懸念から、職員によ...

最も強力なオープンソースのマルチモーダル生成モデル MM-Interleaved: 最初の機能同期装置

AI がチャットできるだけでなく、「目」を持ち、絵を理解し、絵を描くことで自分自身を表現することさえ...

自動運転の世界情勢を理解するための記事

自動運転前夜2021年、ビル・ゲイツは「すべての家庭にロボットを」と題する記事を発表し、爆弾処理ロボ...

AIと拡張現実が職場でどのように進化しているか

[51CTO.com クイック翻訳]職場における支援/拡張現実 (AR) と人工知能 (AI) の潜...

コーディングが ChatGPT を圧倒します! UIUCと清華大学が共同で7BパラメータのMagicorderをリリース、コードデータの重みは完全にオープンソース

オープンソースの「ビッグコードモデル」が登場しました。 UIUC 清華大学の研究者チームは、70 億...

Facebookはライブ動画でユーザーを見えなくする匿名化システムを開発した

最近、ノルウェー科学技術大学の「DeepPrivacy: 顔の匿名化のための生成的敵対的ネットワーク...

人工知能ネットワークが教育に与える影響を探る

教育業界は、テクノロジーの継続的な進歩によって大きなパラダイムシフトを経験しています。人工知能(AI...

マイクロソフト、AIアシスタントCopilotを搭載したWindows 11のメジャーアップデートをリリース

11月1日(米国時間火曜日)、ソフトウェア大手マイクロソフトは、パソコン用OS「Windows 11...

...

このAI「マスターレベル」の棒人間レベルはネットユーザーを驚かせた。GANすら使っていない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...