顔をスキャンして出勤記録を取ったり、顔で支払いをしたり、顔でドアを開けたり、顔をスキャンしながら生活を始めていませんか? 指紋、虹彩、音声、静脈、網膜認証と比較すると、顔認証はより高速で便利です。顔認証技術がどのように実現されているかご存知ですか? 2D画像データに基づく顔認識は現在主流であり、セキュリティ、監視、アクセス制御、出席、金融ID認証、エンターテイメントなど、多くのシナリオで使用されています。その利点は、比較的多くのアルゴリズムが実装されており、プロセスが比較的成熟していることです。画像データの取得も比較的簡単で、通常のカメラのみが必要です。 2D 顔認識の主な原理は、写真のマッチング、つまり収集した顔写真をシステム ライブラリに保存されている顔と比較してマッチング結果を得ることです。 (顔検出-顔の位置合わせ-顔の表現-顔のマッチング) 実際には、収集された写真は、光源、顔の角度、モーションブラーなどの要因の影響を受けることがよくあります。そのため、2D アライメントの場合、顔画像上の顔の特徴点の座標を正確に見つけることが重要です。従来のアプローチは、手動で設計された機能と、幾何学的手法、全体論的手法、機能ベースの手法、ハイブリッド手法などの機械学習技術に基づいています。その後、大規模なデータセットでトレーニングされたディープニューラルネットワーク (DNN) と畳み込みニューラルネットワーク (CNN) に基づくディープラーニング手法が登場しました。現在、2D顔認識技術はかなり成熟しており、2D顔認識アルゴリズムの認識精度は99.80%に達し、人間の認識精度に匹敵します。 2D顔認識は精度が高いですが、偽顔詐欺を防ぐのは困難です。現在、当社の一般的な不正防止方法には、アルゴリズム支援、ビデオ支援、音声支援が含まれます。特に銀行の認証プロセスでは、顔は唯一の認証次元ではありません。顔認識の後、携帯電話番号、IDカードなどを検証する必要があります。これは、2D顔認識は使いやすいものの、完全に安全で信頼できるわけではないことを示しています。 2D顔認識には一定の限界があるため、その欠点を補うために3D顔認識技術が誕生しました。 2D顔認証と比較して、3D顔認証ではより安全なデータ読み取り機器を使用して顔の真正性を保証し、顔情報の盗難を困難にします。開発期間を経て、データサンプルが増えるにつれて、3D 顔認識のアルゴリズムはますます成熟してきました。 3D 顔認識の利点は、主に画像取得技術にあります。主な 3D カメラ技術には、3D 構造化光、TOF、両眼立体視などがあります。 3D構造光 3D 構造化光は、特定の構造特性を持つ光を赤外線光プロジェクターを通して撮影対象物に投影し、専用の赤外線カメラで撮影することで実現されます。光学三角測量測定の原理に基づいて計算を実行し、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。したがって、どんな平面写真も 3D 構造化光の目から逃れることはできません。 3D構造化光による顔認証は、一部のスマートフォンで実用化されています。例えば、iPhoneで採用されているFace IDは、ハードウェアとアルゴリズムを組み合わせて、3D顔認証で携帯電話やアカウントを認証します。 東経 TOF は飛行時間 (time of fly) の略で、レーザー測距のことです。光源は一般に方形波パルスで変調され、パルスの発信と受信の時間差に基づいて距離が測定されます。 TOF テクノロジーは、従来の 2D XY 軸画像に Z 軸方向からの深度情報を追加し、最終的に 3D 画像情報を生成します。 TOF の主な用途は、機械とのインタラクティブ デバイスです。ゲームで使用され、主に人間の姿勢データを取得して処理します。 TOF は長距離でのデータ収集に適しているため、一部のメーカーは携帯電話の背面カメラに TOF 設計を追加しています。 両眼立体視 両眼視は視差の原理に基づいた方法で、複数の画像から物体の3次元の幾何学的情報を取得します。測定対象物の2つのデジタル画像をデュアルカメラで異なる角度から同時に取得し、視差の原理に基づいて対象物の3次元幾何情報を復元することで、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。 上図は、ヘッドアップ両眼ステレオ撮影の原理を示す簡単な概略図です。2 台のカメラの投影中心間の距離がベースライン距離 B です。 2 台のカメラが同時に時空間オブジェクトの同じ特徴点 P を観測し、それぞれ「左目」と「右目」の P の座標に基づいて、カメラ座標系における P の 3 次元座標を計算します。したがって、左カメラの画像平面上の任意の点が右カメラの画像平面上の対応するマッチング点を見つけることができれば、その点の 3 次元座標を完全に決定できます。 3D顔認識システムは精度が高く盗難防止に有効ですが、3Dカメラや双眼カメラなどの専用機器が必要です。現在、3D顔認識コンポーネントが普及していないため、2D顔認識は依然として市場シェアが最も高いですが、今後は減少傾向にあります。 セキュリティ分野では、3D顔認識が徐々に注目を集めています。 2019年のCPSEセキュリティ博覧会で、Dahua LeChengは業界初の3D構造化光AI顔認識ビデオロックを発表しました。これはユーザーのためにミリメートルレベルの3D顔モデルを構築し、写真、ビデオ、フードやマスクによる攻撃を効果的に防ぐことができます。さらに、3D構造化光認識は、光や背景光環境などの要因の影響を受けにくく、その応用はより安定しています。 市場では、3D顔認識モジュールの価格が高止まりしており、スマートロックのコストが上昇しています。また、中国の家庭におけるスマートロックの需要が十分に活用されていないため、3D顔認識機能を備えたスマートロックの市場シェアは比較的低いです。しかし、近い将来、この新しい技術に対する人々の受け入れはますます高まり、3D顔認識技術の人気もますます高まると私たちは信じています。 |
<<: 人工知能:しっかりと根を張ってこそ、どこでも繁栄できる
>>: 企業は今後の組織開発においてハイパーオートメーションを採用するでしょうか?
[51CTO.comからのオリジナル記事] 突然の流行に直面して、国民は情報の適時性、透明性、伝達効...
DeepMind がまた別の「悪役」を生み出しました! [[428779]]これらの小人たちは、ア...
ICLR 2022の授賞式を利用して、MIT、コーネル、Google、Microsoftが新しいSO...
過去 10 年間で、ディープラーニングの分野では多くの高度な新しいアルゴリズムと画期的な研究が登場し...
AI が作成した資金調達計画が、実際に VC を熱狂的に追いつめたと信じられますか? GPT-4 に...
人工知能の発展の過程で、常に次のような声が聞かれます。「人工知能によって、特に若者を中心に、失業者が...
トラブルを起こせ! AI は、人間が GitHub で更新 (コミット) を送信する方法を「見て」、...
最近、烏鎮での夕食会で大物たちが何を食べたかという噂に加え、インターネット会議では人工知能に関する一...
今年の AI スタートアップ リストには、AI 音声アシスタントを構築するためのコード不要の Web...
ナスダックがAIGCに対して強気であることは疑いの余地がない。 Nasdaq の CIO 兼 CTO...