顔認識の3つの主要技術と4つの主要機能

顔認識の3つの主要技術と4つの主要機能

2016年百度世界大会が開幕し、百度創始者の李承燁氏は大会で「人工知能」をテーマに講演し、最新製品「百度脳」を発表して出展者に感銘を与えた。その画像認識能力は非常に優れており、顔認識の確率は97%に達した。現在、業界全体では顔認識に関連する触媒的出来事に注目が集まっています。

以前、小米科技は、小米の顔検出チームが開発した新しいアルゴリズムがFDDB顔検出精度で世界一になったと発表しました。その後すぐに、百度、テンセント、360などの国内インターネット大手も顔検出アルゴリズムチームを設立し、プラットフォーム評価に積極的に参加しました。さらに、Apple、Samsung、Huawei、Facebook、Googleなどの端末大手も顔認識の分野への参入を競っています。過去にIDカード認識が人気を博したように、今後も応用シナリオが増え続けるにつれて、顔認識機能が消費者向け端末の次の大きな方向性となる可能性が高い。

顔認識は、顔の特徴に基づいて人物を識別する生体認証技術です。カメラまたはビデオカメラを使用して顔を含む画像またはビデオをキャプチャし、画像情報を自動的に検出して顔を追跡し、検出された顔に対して一連の顔分析手法を実行します。

顔検出とは、複雑な背景から対象の顔画像を抽出することを指します。顔の毛、化粧品、照明、ノイズ、顔の傾きやサイズの変化、さまざまな遮蔽などの要因により、顔検出の問題がさらに複雑になる可能性があります。顔認識技術の主な目的は、入力画像全体から特定の顔領域を見つけ、それによってその後の顔認識を準備することです。

[[185749]]

顔認識の3つの主要技術

1. 特徴ベースの顔検出技術: 色、輪郭、テクスチャ、構造、またはヒストグラムの特徴を使用して顔検出が実行されます。

2. テンプレートマッチングに基づく顔検出技術:データベースから顔テンプレートを抽出し、特定のテンプレートマッチング戦略を採用して、キャプチャされた顔画像とテンプレートライブラリから抽出された画像をマッチングします。顔のサイズと位置情報は、相関度とマッチングされたテンプレートのサイズによって決定されます。

3. 統計的顔検出技術:「顔」と「非顔」の画像を大量に収集して顔の正と負のサンプルライブラリを形成し、統計的手法を使用してシステムを強化およびトレーニングし、顔と非顔のパターンの検出と分類を実現します。

顔認識の4つの主な特徴

1. 幾何学的特徴:顔の点間の距離と比率を特徴として使用します。認識速度が速く、メモリ要件が比較的小さく、光に対する感度が低くなります。

2. モデルの特徴に基づいて、さまざまな特徴状態のさまざまな確率に基づいて顔画像の特徴を抽出します。

3. 統計的特徴に基づく: 顔画像はランダムベクトルとみなされ、統計的手法を使用してさまざまな顔の特徴パターンが識別されます。代表的な手法には、固有顔、独立成分分析、特異値分解などがあります。

4. ニューラルネットワークの特徴に基づく:多数のニューラルユニットを使用して顔画像の特徴を連想的に保存および記憶し、さまざまなニューラルユニットの状態の確率に基づいて顔画像を正確に認識します。

顔認識とは、関連する認識アルゴリズムを使用して抽出された顔画像の特徴に基づいて顔を確認または区別するプロセスです。つまり、識別対象として検出された顔をデータベース内の既知の顔と比較・照合して関連情報を取得します。このプロセスの鍵となるのは、適切な顔表現方法と照合戦略を選択することです。システムの構造は顔表現方法と密接に関係しています。一般的に、提案された特徴に基づいて、測定用にさまざまな認識アルゴリズムが選択されます。一般的に使用されるものには、距離測定、サポートベクターマシン、ニューラルネットワーク、k-means クラスタリングなどがあります。

<<:  顔認識における克服すべき困難

>>:  JavaScript 面接でよくあるアルゴリズムの質問の詳細な説明

ブログ    
ブログ    
ブログ    

推薦する

人工知能はあなたの目を見るだけであなたの性格を理解できる

[[238546]]目は魂の窓です。科学者たちは、目の動きを通じて「心を読む」ことができる人工知能を...

ブロックチェーンを使用して AI スマートエコノミーを構築するにはどうすればよいでしょうか?

人工知能(AI)は、機械によって発揮される知能であるという点で人間の知能とは異なります。しかし、直接...

北京、自動運転路上試験の新規則を発表、有人試験も可能に

最近、北京市交通委員会は新たに改訂された「北京市自動運転車両路上試験管理実施規則(試行)」を発行し、...

AI倫理: CIOが問うべき5つの質問

[51CTO.com クイック翻訳] 人工知能ツールを導入する IT リーダーは、責任の取り方、プラ...

...

まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるた...

AI プロジェクトの 85% が失敗する理由は何ですか?

現在、人工知能(AI)は、人事、サプライチェーン、マルチレベルマーケティングなど、さまざまな分野で広...

AIが銀行業務をどう変えるか

今日、人工知能 (AI) は多くの業界に多くの資産と利点をもたらし、チャットボットから Siri や...

機械学習は数字を数え、マウスをクリックしてモデルをトレーニングし、残りはコンピューターに任せます

[[432947]] JAVA ベースで開発された Weka は、機械学習やデータマイニングに適した...

AI企業の成人式:自由が996と衝突し、技術的理想が地上戦争と衝突する

戦争の理由はすべて、例外なく一つのこと、つまり生き残ることにつながります。狼の本能がなければ、生き残...

ロボットを放っておいてください!人間が本当に心配しなければならないのは人工知能だ

近年、人工知能の倫理的問題についての議論が盛んに行われている。最近終了した中国コンピュータカンファレ...

...

人工知能をより深く理解するための人工知能と機械学習の12のキーワード

[[260979]]人工知能(AI)技術があらゆる分野にますます大きな影響を及ぼすようになるにつれ、...

海外メディア:TikTokは米国の規制当局の支援を得るためにアルゴリズムを公開する予定

米国現地時間の水曜日、人気の短編動画プラットフォーム「TikTok」(Douyinの海外版)のCEO...

偽の顔を正確に生成します! Amazonの新しいGANモデルは死角のないオールラウンドな美しさを提供します

最近、Amazon One の研究者は、生成された画像を明示的に制御できる GAN をトレーニングす...