Python による顔認識 (ソースコード付き)

Python は画像やビデオから顔を検出して認識できます。

顔の検出と認識は、コンピュータービジョンの分野における研究のホットスポットの 1 つです。

顔認識の用途には、顔によるロック解除、セキュリティ保護などがあります。医師や医療スタッフは、顔認識を使用して医療記録や病歴を取得し、病気をより正確に診断します。

Python 顔認識について

この Python プロジェクトでは、画像から人物を認識する機械学習モデルを構築します。私たちのプロジェクトでは、顔認識 API と OpenCV を使用しました。

最新のテクノロジートレンドを常に把握

Telegram で DataFlair に参加しましょう!

ツールとライブラリ

Python 3.x の場合
CV2-4.5.2
ハンプティ・ダンプティ - 1.20.3
顔認識-1.3.0

上記のパッケージをインストールするには、次のコマンドを使用します。

 pip インストールnumpy opencv - python

FaceRecognition をインストールするには、まず dlib パッケージをインストールします。

 pipでdlib をインストール

次のコマンドを使用して顔認識モジュールをインストールします。

 顔認識をpip でインストールする

顔認識Pythonコードをダウンロードする

Python顔認識プロジェクトのソースコードをダウンロードしてください: 顔認識プロジェクトコード

プロジェクトデータセット

この顔認識プロジェクトを完了するには、独自のデータセットを使用できます。このプロジェクトでは、アメリカの人気ウェブシリーズ「フレンズ」をデータセットとして使用します。このデータセットは、前のセクションでダウンロードした顔認識プロジェクトコードに含まれています。

顔認識モデルを構築する手順

先に進む前に、顔認識と検出とは何かを理解しておきましょう。

顔認識とは、写真やビデオフレームから人の顔を識別または検証するプロセスです。

顔検出とは、顔検出アルゴリズムで使用するために、画像内の顔（位置とサイズ）を見つけて抽出するプロセスを指します。

顔認識方法は、画像内の一意に指定された特徴を見つけるために使用されます。ほとんどの場合、顔は削除され、切り取られ、拡大縮小され、グレースケールに変換されています。顔認識には、顔検出、特徴抽出、顔認識の 3 つのステップが含まれます。

OpenCV は C++ で書かれたオープンソースライブラリです。コンピュータービジョンタスク用のさまざまなアルゴリズムとディープニューラルネットワークの実装が含まれています。

1.データセットを準備する

トレーニングとテストの 2 つのディレクトリを作成します。各俳優について、インターネットから画像を選択し、「train」ディレクトリにダウンロードします。選択した画像が、分類器が分類できるほど人間の顔の特徴を十分に表していることを確認してください。

モデルをテストするには、すべてのキャストを含むイメージを取得し、「test」ディレクトリに配置します。

お客様の利便性を考慮し、プロジェクトコードとともにトレーニングデータとテストデータを追加しました。

2. モデルのトレーニング

まず必要なモジュールをインポートします。

 face_recognition をfr としてインポートします
cv2 をインポート
numpyをnp としてインポートする
インポートOS

顔認識ライブラリには、顔認識プロセスを支援するさまざまなユーティリティの実装が含まれています。

ここで、画像 (人物) の名前とそれぞれの顔のエンコーディングを格納する 2 つのリストを作成します。

 パス= "./train/"
 知られている名前= []
 既知の名前エンコーディング= []
 images = os.listdir (パス)

顔エンコーディングは、目の間の距離、額の幅など、顔の特徴間の重要な測定値を表す値のベクトルです。

トレーニングディレクトリ内の各画像をループし、画像内の人物の名前を抽出し、顔のエンコードベクトルを計算して、対応するリストに情報を保存します。

 画像内の_ の場合:
 image = fr.load_image_file ( パス+ _ )
 image_path = パス+ _
 エンコーディング= fr . face_encodings ( 画像)[ 0 ]
 known_name_encodings . append ( エンコーディング)
 known_names.append (os.path.splitext(os.path.basename ( image_path ) ) [ 0 ] .capitalize ( ))

3. テストデータセットでモデルをテストする

前述したように、テストデータセットにはすべての人物を含む画像が 1 つだけ含まれています。

CV2 imread() メソッドを使用してテストイメージを読み取ります。

 test_image = "./test/test.jpg"
 イメージ= cv2.imread ( test_image )

顔認識ライブラリには、画像内で検出された各顔の座標 (左、下、右、上) を特定する Face_Locations() という便利なメソッドが用意されています。これらの位置の値を使用すると、顔のエンコードを簡単に見つけることができます。

 face_locations = fr . face_locations ( 画像)
 face_encodings = fr . face_encodings ( 画像, face_locations )

画像内の各顔の位置とそのエンコードをループします。次に、このエンコーディングを「トレーニング」データセット内の顔のエンコーディングと比較します。

次に、顔距離、つまりテスト画像のエンコードとトレーニング画像のエンコード間の類似度を計算します。ここで、そこからの最小距離を選択します。これは、テスト画像の顔がトレーニングデータセット内の人物の 1 人であることを示します。

ここで、CV2 モジュールのメソッドを使用して、面の位置の座標を含む四角形を描画します。

 for ( top 、 right 、 bottom 、 left )、 face_encoding in zip ( face_locations 、 face_encodings ):
 一致するもの= fr . compare_faces ( 既知の名前のエンコーディング、 顔のエンコーディング)
 名前= ""
 face_distances = fr . face_distance ( 既知の名前のエンコーディング, face_encoding )
 best_match = np.argmin ( 面の距離)
 [ best_match ] と一致する場合:
 name = 既知の名前[ ベストマッチ]
 cv2 . 長方形( 画像、 ( 左、 上)、 ( 右、 下)、 ( 0、0、255 ) 、 2 )
 cv2 . 長方形( 画像、( 左、 下-15 ) 、( 右、 下)、( 0、0、255 ) 、 cv2 . 塗りつぶし)
 フォント= cv2.FONT_HERSHEY_DUPLEX
 cv2.putText ( 画像、 名前、( 左+ 6 、 下- 6 )、 フォント、 1.0 、( 255,255,255 ) 、 1 )

CV2 モジュールの imShow() メソッドを使用して画像を表示します。

 cv2.imshow ( "結果" , 画像)

imwrite() メソッドを使用して、イメージを現在の作業ディレクトリに保存します。

 cv2.imwrite ( "./output.jpg" , 画像)

解放されていないリソース（ある場合）を解放します。

 cv2.waitKey ( 0 )
 cv2.すべてのウィンドウを破棄します( )

Python 顔認識出力

モデルの出力を見てみましょう。

<<: 2022 年の 9 つの新しいテクノロジートレンドと雇用機会

>>: インテルは世界的なIT需要爆発の機会を無駄にしない

HuggingFace は、大規模モデルの製造パフォーマンスを効率的にリリースするための Transformer 拡張および最適化ライブラリをオープンソース化しました。

ブログ

米連邦取引委員会は、ChatGPTによるデータ漏洩と回答の捏造を含むOpenAIに対する徹底的な調査を開始した。

ブログ

Python による顔認識 (ソースコード付き)

Python は画像やビデオから顔を検出して認識できます。

Python 顔認識について

ツールとライブラリ

顔認識Pythonコードをダウンロードする

プロジェクトデータセット

顔認識モデルを構築する手順

1.データセットを準備する

2. モデルのトレーニング

3. テストデータセットでモデルをテストする

HuggingFace は、大規模モデルの製造パフォーマンスを効率的にリリースするための Transformer 拡張および最適化ライブラリをオープンソース化しました。

996の非効率性にノーと言いましょう: ChatGPTはコードコメントとドキュメントを簡単に処理するのに役立ちます

2017 年に注目すべき人工知能の 7 つのホットなトレンド

自動運転車のためのモデルベースのエンドツーエンドの深層強化学習戦略

写真にピクセルレベルの透かしをひっそり追加: AI による芸術作品の「盗作」を防ぐ方法が発見されました

ドローンは何に使えるのでしょうか？これらの使い方は本当に素晴らしいです!

米連邦取引委員会は、ChatGPTによるデータ漏洩と回答の捏造を含むOpenAIに対する徹底的な調査を開始した。

推薦する

海底撈のIPOは1000億元規模：将来、厨房に必要なのはエンジニア2人だけ

Google は一連の大きな動きを発表しました: Gemini Pro は中国語をサポートし、Bard は描画を学習し、新しいモデルが利用可能になりました

AIが医療画像診断を強化し、潜在的な病気が隠れる場所をなくす

AIがFX市場に、私たちが気づかないうちに革命を起こしている

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

人工知能シンギュラリティと人類の未来

百度CEOロビン・リー：AI時代のオープン性が技術の進歩を推進

人工知能が買い物をより簡単にする

神々の中年の戦いが始まった。どの国内大型モデルが華山の頂上を勝ち取ることができるのか？

2017 年に注目すべき人工知能の 7 つのホットなトレンド

DeeCamp 2019は産学連携を促進するためにKuaishouとInnovation Worksを正式に立ち上げました

NVIDIA、端末デバイスへのディープラーニングの導入を加速する高性能Jetson TX2を発表