顔認識システムの技術的プロセスの分析

顔認識システムの技術的プロセスの分析

顔認識は、顔の特徴に基づいて人物を識別する生体認証技術です。カメラまたはビデオカメラを使用して、顔を含む画像またはビデオ ストリームをキャプチャし、画像内の顔を自動的に検出して追跡し、検出された顔に対して一連の顔関連テクノロジを実行します。これは、一般にポートレート認識または顔認識とも呼ばれます。

[[268928]]

顔認識システムの研究は1960年代に始まり、1980年代以降、コンピュータ技術と光学画像技術の発展とともに改良され、1990年代後半に本格的に一次応用段階に入り、主に米国、ドイツ、日本の技術によって実現されました。顔認識システムの成功の鍵は、最良のコアアルゴリズムを備えているかどうか、認識結果が実用的な認識率と速度を備えているかどうかにあります。「顔認識システム」は、人工知能、機械認識、機械学習、モデル理論、エキスパートシステム、ビデオ画像処理などの複数の専門技術を統合し、中間値処理の理論と実装を組み合わせる必要があります。これは、生体認証の最良の応用です。そのコア技術の実現は、弱い人工知能から強い人工知能への転換を示しています。

[[268929]]

顔認識システムは、主に顔画像の取得と検出、顔画像の前処理、顔画像の特徴抽出、マッチング、認識の 4 つのコンポーネントで構成されています。

顔画像の取得と検出

顔画像の取得: 静止画像、動画像、さまざまな位置、さまざまな表情など、さまざまな顔画像をカメラのレンズを通して撮影できます。ユーザーが取得装置の撮影範囲内にいる場合、取得装置は自動的にユーザーの顔画像を検索して撮影します。

顔検出: 顔検出は、実際には主に顔認識の前処理、つまり画像内の顔の位置とサイズを正確に調整するために使用されます。顔画像には、ヒストグラム特徴、色特徴、テンプレート特徴、構造特徴、ハール特徴など、さまざまなパターン特徴が含まれています。顔検出とは、有用な情報を抽出し、これらの特徴を利用して顔検出を実現することです。

主流の顔検出方法は、上記の特徴に基づいた Adaboost 学習アルゴリズムを使用します。Adaboost アルゴリズムは、いくつかの弱い分類方法を組み合わせて、新しい強力な分類方法を形成する分類方法です。

顔検出プロセスでは、Adaboost アルゴリズムを使用して、顔を最もよく表す長方形の特徴 (弱い分類器) を選択します。弱い分類器は、重み付け投票によって強い分類器に構築されます。次に、トレーニングされた複数の強い分類器が直列に接続されてカスケード分類器が形成され、分類器の検出速度が効果的に向上します。

顔画像の前処理

顔画像の前処理: 顔画像の前処理は、顔検出結果に基づいて画像を処理し、最終的に特徴抽出プロセスを提供するプロセスです。システムによって取得された元の画像は、さまざまな制限やランダムな干渉により、そのまま使用されないことが多く、画像処理の初期段階でグレースケール補正、ノイズフィルタリングなどの前処理を施す必要があります。顔画像の場合、前処理プロセスには主に、光補正、グレースケール変換、ヒストグラム均等化、正規化、幾何学的補正、フィルタリング、顔画像のシャープ化が含まれます。

顔画像の特徴抽出

顔画像の特徴抽出: 顔認識システムで使用できる特徴は、通常、視覚的特徴、ピクセル統計的特徴、顔画像変換係数特徴、顔画像代数的特徴などに分類されます。顔の特徴抽出は、顔の特定の特徴に対して実行されます。顔特徴抽出は顔表現とも呼ばれ、顔の特徴をモデル化するプロセスです。顔の特徴抽出の方法は、知識に基づく表現方法と代数的特徴または統計的学習に基づく表現方法の 2 つのカテゴリにまとめることができます。

知識ベースの表現方法は、主に顔の器官の形状記述とそれらの間の距離特性に基づいて、顔の分類に役立つ特徴データを取得します。その特徴コンポーネントには通常、特徴点間のユークリッド距離、曲率、角度が含まれます。人間の顔は、目、鼻、口、あごなどの部分で構成されています。これらの部分の幾何学的記述とそれらの間の構造的関係は、顔を識別するための重要な特徴として使用できます。これらの特徴は、幾何学的特徴と呼ばれます。知識ベースの顔表現には、主に幾何学的特徴ベースの方法とテンプレートマッチング方法が含まれます。

顔画像のマッチングと認識

顔画像のマッチングと認識: 抽出した顔画像の特徴データをデータベースに保存されている特徴テンプレートと検索し、マッチングします。閾値を設定することで、類似度がこの閾値を超えた場合にマッチング結果を出力します。顔認識とは、識別したい顔の特徴と取得した顔の特徴テンプレートを比較し、類似度に基づいて顔の同一性情報を判断します。このプロセスは、1 対 1 の画像比較プロセスである確認と、1 対多の画像マッチングおよび比較プロセスである認識の 2 つのカテゴリに分けられます。

<<:  ホットマネーの流入が止まると、2019年の人工知能業界の浮き沈みに関する考察

>>:  Web攻撃検出のための機械学習の深層実践

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

復旦大学の論文は、3体のSFシーンを実現:体にディスプレイ画面を装着し、ナビゲートやチャットも可能

誰もが歩くディスプレイ画面であり、これは単なる SF のワンシーンではありません。羅吉が最も感動した...

IBMの新しいデータ分析アルゴリズムは、20分で9TBのデータを分析できる

IBMは最近、スイスのチューリッヒ研究所がデータ分析アルゴリズムにおいて画期的な進歩を遂げ、膨大なデ...

...

機械学習とディープラーニングとは何ですか?ファイザン・シャイクがお手伝いします

概要: この記事では、機械学習とディープラーニングの定義と応用についてわかりやすい言葉で紹介するとと...

DeepMind のブラック ボックス解読の第一歩: ニューラル ネットワークの認知原理は人間のものと同じであることが判明しました。

人間は、画像内の物体を認識して推論することから、超人的なレベルで Atari ゲームや囲碁をプレイす...

新しい人工ニューロンデバイスは、非常に少ないエネルギーでニューラルネットワークの計算を実行できる

カリフォルニア大学サンディエゴ校の研究者らが開発した新しい人工ニューロン装置のおかげで、画像の認識や...

テスラの秘密チームが暴露:ネガティブなニュースを抑え、虚偽入札の段階を乗り切ることに特化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

5GとAIの相互影響

技術革新に関しては、私たちは転換点に達したようです。過去 5 年間で、私たちは、アイデアの創出から会...

アップル、シアトルのAI研究開発施設を拡張へ

海外メディアの報道によると、アップルは最近シアトルの人工知能研究開発センターのオフィススペースを拡大...

AI モデルに新たな革命が起こるのでしょうか?脳の記憶は回転するのでしょうか?過去と未来は実際には「直交」した空間である

人間も他の動物も、目覚めるたびに過去の記憶を整理し、新しい記憶を迎える準備をします。私たちは、以前の...

世界をリセットし、すべてをつなげる5Gは人工知能にどんな機会と課題をもたらすのか

[[274397]] 5G時代は人工知能にどのような新たな機会をもたらすのでしょうか?人工知能と5G...

...

2020 年のソフトウェア開発における 6 つの画期的なトレンドは何ですか?

[[313570]] 1. ブロックチェーンブロックチェーンは、間違いなく IT 業界で最も議論さ...