顔認識はどのようにして顔を認識するのでしょうか?

顔認識はどのようにして顔を認識するのでしょうか?

顔をスキャンして出勤記録を取ったり、顔で支払いをしたり、顔でドアを開けたり、顔をスキャンしながら生活を始めていませんか?

指紋、虹彩、音声、静脈、網膜認証と比較すると、顔認証はより高速で便利です。顔認証技術がどのように実現されているかご存知ですか?

2D画像データに基づく顔認識は現在主流であり、セキュリティ、監視、アクセス制御、出席、金融ID認証、エンターテイメントなど、多くのシナリオで使用されています。その利点は、比較的多くのアルゴリズムが実装されており、プロセスが比較的成熟していることです。画像データの取得も比較的簡単で、通常のカメラのみが必要です。

2D 顔認識の主な原理は、写真のマッチング、つまり収集した顔写真をシステム ライブラリに保存されている顔と比較してマッチング結果を得ることです。

(顔検出-顔の位置合わせ-顔の表現-顔のマッチング)

実際には、収集された写真は、光源、顔の角度、モーションブラーなどの要因の影響を受けることがよくあります。そのため、2D アライメントの場合、顔画像上の顔の特徴点の座標を正確に見つけることが重要です。従来のアプローチは、手動で設計された機能と、幾何学的手法、全体論的手法、機能ベースの手法、ハイブリッド手法などの機械学習技術に基づいています。その後、大規模なデータセットでトレーニングされたディープニューラルネットワーク (DNN) と畳み込みニューラルネットワーク (CNN) に基づくディープラーニング手法が登場しました。現在、2D顔認識技術はかなり成熟しており、2D顔認識アルゴリズムの認識精度は99.80%に達し、人間の認識精度に匹敵します。

2D顔認識は精度が高いですが、偽顔詐欺を防ぐのは困難です。現在、当社の一般的な不正防止方法には、アルゴリズム支援、ビデオ支援、音声支援が含まれます。特に銀行の認証プロセスでは、顔は唯一の認証次元ではありません。顔認識の後、携帯電話番号、IDカードなどを検証する必要があります。これは、2D顔認識は使いやすいものの、完全に安全で信頼できるわけではないことを示しています。

2D顔認識には一定の限界があるため、その欠点を補うために3D顔認識技術が誕生しました。

2D顔認証と比較して、3D顔認証ではより安全なデータ読み取り機器を使用して顔の真正性を保証し、顔情報の盗難を困難にします。開発期間を経て、データサンプルが増えるにつれて、3D 顔認識のアルゴリズムはますます成熟してきました。

3D 顔認識の利点は、主に画像取得技術にあります。主な 3D カメラ技術には、3D 構造化光、TOF、両眼立体視などがあります。

3D構造光

3D 構造化光は、特定の構造特性を持つ光を赤外線光プロジェクターを通して撮影対象物に投影し、専用の赤外線カメラで撮影することで実現されます。光学三角測量測定の原理に基づいて計算を実行し、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。したがって、どんな平面写真も 3D 構造化光の目から逃れることはできません。

3D構造化光による顔認証は、一部のスマートフォンで実用化されています。例えば、iPhoneで採用されているFace IDは、ハードウェアとアルゴリズムを組み合わせて、3D顔認証で携帯電話やアカウントを認証します。

東経

TOF は飛行時間 (time of fly) の略で、レーザー測距のことです。光源は一般に方形波パルスで変調され、パルスの発信と受信の時間差に基づいて距離が測定されます。

TOF テクノロジーは、従来の 2D XY 軸画像に Z 軸方向からの深度情報を追加し、最終的に 3D 画像情報を生成します。 TOF の主な用途は、機械とのインタラクティブ デバイスです。ゲームで使用され、主に人間の姿勢データを取得して処理します。

TOF は長距離でのデータ収集に適しているため、一部のメーカーは携帯電話の背面カメラに TOF 設計を追加しています。

両眼立体視

両眼視は視差の原理に基づいた方法で、複数の画像から物体の3次元の幾何学的情報を取得します。測定対象物の2つのデジタル画像をデュアルカメラで異なる角度から同時に取得し、視差の原理に基づいて対象物の3次元幾何情報を復元することで、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。

上図は、ヘッドアップ両眼ステレオ撮影の原理を示す簡単な概略図です。2 台のカメラの投影中心間の距離がベースライン距離 B です。 2 台のカメラが同時に時空間オブジェクトの同じ特徴点 P を観測し、それぞれ「左目」と「右目」の P の座標に基づいて、カメラ座標系における P の 3 次元座標を計算します。したがって、左カメラの画像平面上の任意の点が右カメラの画像平面上の対応するマッチング点を見つけることができれば、その点の 3 次元座標を完全に決定できます。

3D顔認識システムは精度が高く盗難防止に有効ですが、3Dカメラや双眼カメラなどの専用機器が必要です。現在、3D顔認識コンポーネントが普及していないため、2D顔認識は依然として市場シェアが最も高いですが、今後は減少傾向にあります。

セキュリティ分野では、3D顔認識が徐々に注目を集めています。 2019年のCPSEセキュリティ博覧会で、Dahua LeChengは業界初の3D構造化光AI顔認識ビデオロックを発表しました。これはユーザーのためにミリメートルレベルの3D顔モデルを構築し、写真、ビデオ、フードやマスクによる攻撃を効果的に防ぐことができます。さらに、3D構造化光認識は、光や背景光環境などの要因の影響を受けにくく、その応用はより安定しています。

市場では、3D顔認識モジュールの価格が高止まりしており、スマートロックのコストが上昇しています。また、中国の家庭におけるスマートロックの需要が十分に活用されていないため、3D顔認識機能を備えたスマートロックの市場シェアは比較的低いです。しかし、近い将来、この新しい技術に対する人々の受け入れはますます高まり、3D顔認識技術の人気もますます高まると私たちは信じています。

<<:  人工知能:しっかりと根を張ってこそ、どこでも繁栄できる

>>:  企業は今後の組織開発においてハイパーオートメーションを採用するでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

韓国の常温超伝導チームは重要な技術を隠蔽したのか?アニーリングの詳細がネットユーザーによって暴露され、6つの中国チームが攻撃を開始

昨今、室温超伝導を再現する実験が注目を集めています。 3日間の期限が過ぎ、多くの再現実験で結果が得ら...

高校時代の位相除算と位相減算のアルゴリズムについて

[[356850]]プログラミングの本質はアルゴリズムから来ており、アルゴリズムの本質は数学から来て...

...

2017 年のトップデータサイエンスと機械学習手法

[51CTO.com クイック翻訳] 統計によると、回答者が現在選択している最も一般的に使用されてい...

中国の「マインドショッピング」技術がマスク氏の脳コンピューターインターフェースに挑戦!ネットユーザー:手を切断することが斬首にエスカレート

心で買い物をすることを想像したことがありますか?最近、タオバオはマインドショッピングと呼ばれるブラッ...

...

データが増えるほど、AIの意思決定モデルは脆弱になる

データは人工知能システムを構築するために必要な重要なインフラストラクチャです。データは、AI システ...

人間と機械の統合はなぜ難しいのでしょうか?

時間と空間を結びつけるのは速度であり、エネルギーと質量を結びつけるのも速度です。事実と価値を結びつけ...

「今日の簡単な歴史」:今後 15 年間でほとんどの人が失業することになるのでしょうか?

ユヴァル・ノア・ハラリ氏(42歳)はもともとエルサレムでヘブライ語で歴史を教える大学教授だった。38...

マスク氏はWeChatの複製に本気だ! 𝕏は音声通話とビデオ通話を推進します、シャオ・ザッカーバーグ:私は4年前にそれをやりました

マスク氏はツイッターで新たな計画を発表した。音声通話とビデオ通話を提供します。電話番号は必要ありませ...

...

NetEase Games AIOps実践:異常検知の最適化戦略とプラットフォーム構築

この共有では主に以下の点が紹介されます。 AIOps ロードマップ異常検出プラットフォーム構築インテ...

AIoTの生死に関わる状況:将来的にはAIoTは非常に収益性が高いが、現時点ではAI+IoTは非常に高価

Huawei が初めて AIoT 戦略を発表したり、JD.com が IoT 事業を Xiaojin...

...

クラウドネットワークとAIに焦点を当てると、3大通信事業者の財務報告はどのようなことを明らかにするのでしょうか。

少し前に、中国移動、中国聯通、中国電信の3大通信事業者が2023年第2四半期の財務報告書を発表しまし...