この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 海外メディアROAD TOVRによると、Meta Reality Labsの研究者らが、Codec Avatarsプロジェクトのレンダリングをサポートし、AI処理専用のカスタムアクセラレータチップを搭載したVRヘッドセットのプロトタイプを作成したという。 Facebook が社名を Meta に変更するずっと前から、同社は VR で「写真のようにリアルな」仮想アバターを実現することを目指す Codec Avatars プロジェクトに取り組んでいた。このシステムは、AI 処理と、視線追跡や口追跡などのデバイス上のセンサーを組み合わせて、ユーザーの顔を可能な限りリアルな方法で仮想世界に投影します。 Codec Avatars 研究の初期バージョンは、NVIDIA Titan X GPU の計算能力によって実現されました。しかし、Meta の最新の Quest 2 オールインワンデバイスのようなデバイスでは、その機能を十分に活用することはできません。 このため、Meta は Codec Avatars プロジェクトの機能を低電力のオールインワン デバイスに実装する方法に取り組んでいます。 先月開催されたIEEE CICCカンファレンスで発表された論文の中で、MetaはCodec Avatarsのアクセラレータとして機能する7nmプロセスを使用したカスタムチップを設計していることを明らかにした。 実際、Meta のチップ製造計画は 2018 年にはすでに始まっていました。 2018年4月、Facebookはシャリアール・ラビー氏を副社長兼チップ部門責任者として採用した。ラビー氏は以前Googleに勤務し、Pixelスマートフォン向けVisual Coreなどのチップの開発に携わっていた。 研究者らは、このチップが紙の上から現実のものになるまでにはまだ長い道のりがあると述べている。 チップ設計プロセス中に、設計者はコーデック アバター モデルの生成に必要なデータを考慮しました。 「テストチップは7nmプロセスを採用しており、1024の積和演算アレイ、2MBのオンチップSRAM、32ビットRISC-V CPUで構成されるニューラルネットワークアクセラレータを搭載している」と研究者らは述べた。 一方、チップの特定のアーキテクチャに合わせるために、設計者はコーデックアバター AI モデルの一部も再構築しました。 「畳み込みニューラルネットワークベースの視線モデルを再構築し、ハードウェア向けにカスタマイズしてチップに適したものにしました。これにより、オフチップメモリアクセスのエネルギー消費と待ち時間が削減されます」とリアリティラボの研究者は書いています。 アクセラレーション チップは、モデルの動作を高速化するだけでなく、コーデック アバターのワークロードの重い部分を高速化することで、電力と熱を削減します。チップのカスタマイズの利点により、このカスタマイズされたチップは、電力と音量制御の点で一般的な CPU よりも多くの利点があります。 研究者らによると、このチップはすでにコーデックアバターモデルを毎秒30フレームで実行できるという。同時に、消費電力が低く、サイズも小型です。 専用チップの高速化により、Meta の Codec Avatars はオールインワン デバイスでも実行できるようになるかもしれません。しかし、アバターの視覚的なレンダリングがどの程度うまく機能するかはまだわかりません。オールインワン以外のマシンで実行する場合、モデルはユーザーのスキャンを非常に詳細にモデル化しますが、Quest2 などのオールインワン マシンでは完全にレンダリングするには複雑すぎる可能性があります。これらの客観的な条件の制約下で、コーデック アバターの強力な「リアルな」画像が最終的にどのように見えるかはまだ不明です。 この特別に設計されたアクセラレーション チップにより、XR 固有のさまざまな機能が実現できると考えられます。たとえば、XR プレイヤーは、没入感を高めることができる空間オーディオが XR の世界に実装されることを望んでいます。ただし、リアルなサウンドシミュレーションは、実際の使用時にコストが増加するだけでなく、バッテリー寿命にも影響します。 さらに、位置追跡とジェスチャ追跡も XR エクスペリエンスの重要な部分であり、これらの領域のハードウェアとアルゴリズムを組み合わせることで、XR デバイスの速度とパワーを大幅に向上させることができます。 |
>>: オフライン認識率が最大99%のオープンソースPython顔認識システム〜
現在、自動運転車の知覚の実現は、車両に搭載されたレーザーレーダー、車載カメラ、ミリ波レーダーなどのセ...
アプリケーションをゼロから開発するというコンセプトは何ですか?これをルーブ・ゴールドバーグ・マシンの...
サプライ チェーンは、生産におけるあらゆるリンクの源です。原材料から製造、流通まで、各ステップで最も...
GPT-4V はすでに、Web サイトのコード設計やブラウザの制御に役立っています。これらのアプリケ...
CVPR 2021で発表された論文の中で、NetEase Fuxiとミシガン大学の研究者は、制御可能...
世界各国がインダストリー4.0の時代を迎える中、多くの業界団体がプロセス自動化の重要性を認識し始め、...
ロボット工学は、特にスマートテクノロジーと組み合わせると、無限の可能性を秘めたテクノロジーです。近年...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
1 件の AI 論文、442 人の著者。著者の貢献のために特別な章も設けられています。 100ペー...
え、まだNeRFを知らないの? NeRF は、今年コンピューター ビジョン分野で最も注目されている ...
[[418112]]テスラは月曜日に駐車中の緊急車両との一連の衝突事故が発生した後、オートパイロット...