独自の顔ぼかしツールを構築する方法

独自の顔ぼかしツールを構築する方法

OpenCVを使用して顔認識をカスタマイズする方法

[[412851]]

匿名化とは、データを匿名化するプロセスを指します。欧州連合の GDPR や他の国の同様の措置の実施により、データセットの準備や個人情報の処理において、PII (個人を特定できる情報) を保護することが必須のステップになります。もちろん、人の顔は人のアイデンティティの最も顕著な特徴の 1 つであるため、顔を検出して匿名化するソリューションは数多くあります。ただし、カスタマイズや自動化は困難です。これは、オープンソースを使用して自分でやりたい人のための DIY ガイドです。コード例全体は Colab で実行でき、こちらから入手できます。 GDPRはこちら: https://github.com/changsin/DL/blob/main/notebooks/deidentify_faces_opencv.ipynb

顔を自動的に匿名化する手順は次のとおりです。

1. 顔検出

顔検出は物体検出の一種なので、この目的にはディープラーニング ネットワークを使用できます。 OpenCV には、公開されているデータセットを使用して顔を検出するように事前トレーニングされたディープラーニング ニューラル ネットワークが含まれています。 Caffe ディープラーニング フレームワークを使用しており、モデル定義と事前トレーニング済みの重みファイルをダウンロードできます。ダウンロードしたら、それらをロードして、画像内の顔を検出できるディープ ニューラル ネットワークを作成します。 Caffe ディープラーニングフレームワーク

ここで、次のコード スニペットに示すように、画像をロードして DNN に渡し、顔を検出するだけです。

各予測には、カテゴリ ID (インデックス = 1)、信頼度 (インデックス = 2)、および検出された顔の座標が含まれます。

  1. # DNNからのサンプル予測出力
  2. 配列([ 0 . , 1 . , 0.8745881 , 0.68375957 , 0.47576728 , 0.75310016 , 0.62532324 ], dtype=float32)

私たちは顔検出だけに興味があるので、信頼確率だけに焦点を当て、それを使って予測を受け入れるか拒否するかを決めることができます。

今にしましょうか? euro™ によるサンプル画像の処理。この公開画像を選択したのは、People-uro™ の顔がさまざまな角度や肌の色で写っているためです。

[[412852]]

信頼度しきい値が 0.5 (つまり、顔である確率が 50%) に設定されている場合、正面を向いている人物の顔だけが検出されます。

これは理解できることであり、すべての顔検出アルゴリズムに共通する問題です。この問題を解決する正しい方法は、横顔やその他の角度を含む、より多様な画像を追加することです。これを行う簡単で安価な方法は、単に自信を下げることです。たとえば、信頼度レベルを 0.12 に設定すると、結果ははるかに良くなります。

しかし、新たな問題が発生しました。信頼しきい値がこのように低い場合、偽陽性と偽陰性が多くなることが予想されます。左側にラベルの付いたボックスが 3 つ表示されます。良いニュースは、モデルの予測をある程度制御できることです。

2. 顔の匿名化

顔が検出されると、次のステップはそれを匿名化/非識別化する方法です。さまざまなテクニックが存在します。 2 つのぼかしテクニックとピクセル化方法の 3 つの方法を紹介します。

a. 長方形のぼかし

最も簡単な方法は、畳み込みカーネル内のピクセル値を平均化することによって機能する OpenCVâuro™ のぼかし方法を使用することです。つまり、畳み込みは平滑化フィルターとして機能します。カーネル サイズを調整することで、多少粗いぼかし効果を得ることができます。画像は多次元整数配列として処理されるため、1行のコードで関心領域をぼかしたピクセルに置き換えることができます。OpenCVのぼかし

  1. 画像[開始Y:終了Y, 開始X:終了X] = cv2.blur(画像[開始Y:終了Y, 開始X:終了X], カーネルサイズ)

kernel_size(20, 20) を使用した場合の結果は次のとおりです。

b. 省略記号のぼかし

長方形をぼかすと目的の匿名化が達成されますが、結果として得られる画像はむしろ不自然に見えます。カーネル サイズを小さくすると、不均一なぼかしを滑らかにすることができますが、別の方法としては、楕円形でぼかしを行うという方法があります。 uro™の表面は楕円形です。これを行うには、マスクを作成し、いくつかのビット演算を実行するという少しの作業を行う必要があります。カーネル サイズ (10, 10) の結果は次のとおりです。

c. ピクセル化

顔を匿名化するもう一つの一般的な方法は、ピクセル化を使用することです。ピクセル化では、関心領域がいくつかの小さなブロックに分割されます。 -euro� ピクセル化では、関心領域がいくつかの小さなブロックに分割されます。各チョークの平均 RGB 値が計算され、チョーク全体に適用されます。ご覧のとおり、結果の画像は非常に自然に見えます。

結論は

顔認識をキャンセルすることはプライバシーを保護するための第一歩です。既成のソリューションは数多くありますが、この記事では OpenCV を使用したカスタマイズと自動化のための簡単な DIY 手順を示します。ソースコード全体は Jupyter ノートブックにあり、ここから入手できます。 https://github.com/changsin/DL/blob/main/notebooks/deidentify_faces_opencv.ipynb

参考文献

  • OpenCV と Python を使用して顔をぼかし、匿名化する
  • OpenCVとディープラーニングに基づく顔検出

<<:  AIがすぐに作家に取って代わることはないだろうが、その未来はあなたが思っているよりも近いかもしれない

>>:  AIが復活! GPT-3を使用して亡くなった婚約者を複製し、アメリカ人男性は愛する人をデジタル形式で永遠に生きさせました

ブログ    
ブログ    

推薦する

...

...

...

R言語におけるAprioriアルゴリズムの応用

[[193979]] I. コンセプト関連性分析は、大規模なデータセットに隠された意味のあるつながり...

...

10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

現在、ニューラル表現は、レンダリング、イメージング、幾何学モデリング、シミュレーション アプリケーシ...

HipHop アルゴリズム: マイクロブログの相互作用関係を使用してソーシャル サークルをマイニングする

[[120924]] Weibo 環境において、Weibo ユーザーのソーシャル サークルや興味サー...

AIを信頼していない経営者は何を考えているのか?

経営幹部は長い間、より高度な意思決定にデータ分析を使用することに抵抗し、AI 支援による意思決定より...

GNNに大量のデータを与えると重力の法則が発見される

機械学習 (ML) は、大規模なデータセット内の特徴を学習し、さまざまなオブジェクトを分類し、パラメ...

オリンピックチャンピオンでさえ正しく答えられなかった質問が ML モデルのテストに使用されているのですか? GPT-3: できない

機械学習モデルの数学解答能力を測定するために、カリフォルニア大学バークレー校とシカゴ大学の研究者らは...

コンピューティング技術を変えた偉大なアルゴリズムを数えてみましょう

これまで、多くの独創的なコンピュータ アルゴリズムの設計が私たちのコンピューティング技術を変えてきま...

ニューラルネットワークにおけるBPアルゴリズムの原理とPython実装のソースコード解析

私は最近、BP アルゴリズムを体系的に研究し、この研究ノートを書きました。私の能力が限られているため...

Wi-Fi の AI がワイヤレス接続をどのように形作るか

2023年までに、おそらく人工知能ほど普及するテクノロジーはなくなるでしょう。生成型 AI の爆発的...

RPA 導入によって企業が得る 10 のメリット

[[358363]] RPA(ロボティック・プロセス・オートメーション)は、企業の業務効率と生産性を...

孤独を研究していますか? Reddit のホットな話題: AI のゴッドファーザー、ヤン・ルカンが提案した「エネルギー モデル」とは一体何でしょうか?

「エネルギー自己教師学習っていったい何?」と多くのRedditネットユーザーがコメントした。ちょう...