顔認識に興味がありますか? JavaScriptで実装された顔検出方法

私はビデオや画像における顔のタグ付け、検出、顔認識技術に常に興味を持っています。顔認識ソフトウェアやプラグインを開発するためのロジックやアルゴリズムを入手するのは私の想像を超えていることは承知しています。笑顔、目、顔の構造を認識できる JavaScript ライブラリについて知ったとき、チュートリアルを書こうという気持ちになりました。純粋な JavaScript ベースまたは Java ベースのライブラリが多数あります。

今日は、 Eduardo Lundgren が開発した軽量の JavaScript ライブラリである、tracking.js の学習を始めます。これを使用すると、リアルタイムの顔検出、色追跡、友達の顔のタグ付けが可能になります。このチュートリアルでは、静止画像から顔、目、口を検出する方法について説明します。

チュートリアルの最後には、ヒントやコツ、さらに技術的な詳細を含む実用的な例を提供するチュートリアルがあります。

まず、プロジェクトをビルドする必要があります。GitHub からプロジェクトをダウンロードし、ビルドフォルダーを抽出します。ファイルとディレクトリの構造に従ってビルドフォルダーを配置します。このチュートリアルでは、次のファイルとディレクトリ構造を使用しました。

フォルダ構造

プロジェクトフォルダ
│
 │ インデックス
│
 ├───資産
│ 顔.jpg
 │
 └───js
    │トラッキング最小値.js
    │トラッキング
    │
    └───データ
            目-min.js
            目.js
            フェイス-min.js
            フェイス
            口-min.js
            口.js

js フォルダーには、tracking.js から抽出した JavaScript ファイルがあることがわかります。以下はindex.htmlのHTMLコードです。

HTMLコード

<!doctype html >  
 <html>  
 <ヘッド>  
   <メタ 文字セット= "utf-8" >  
   < title > @tuts 顔検出チュートリアル</ title >  
   
   <スクリプト  src = "js/tracking-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/face-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/eye-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/mouth-min.js" > </スクリプト>  
   
   <スタイル>  
  .rect {
    境界線: 2px 実線 #a64ceb;
    左: -1000px;
    位置: 絶対;
    上: -1000px;
  } 
   
  #画像 {
    位置: 絶対;
    上位: 50%;
    左: 50%;
    マージン: -173px 0 0 -300px;
  } 
   </スタイル>  
 </ヘッド>  
 <本文>  
 < div  クラス= "imgContainer" >  
   <画像  id = "画像"   src = "アセット/face.jpg"   />  
 </div>  
   
 </本文>  
 </html>

上記の HTML コードでは、tracking.js から 4 つの JavaScript ファイルをインポートします。これらのファイルは、画像から顔、目、口を検出するのに役立ちます。次に、静止画像から顔、目、口を検出するコードを記述します。この画像を意図的に選んだのは、表情やポーズの異なる複数の顔が含まれているからです。

目標を達成するには、HTML ファイルのヘッダー内のコードを変更する必要があります。

HTMLコード

<!doctype html >  
 <html>  
 <ヘッド>  
   <メタ 文字セット= "utf-8" >  
   < title > @tuts 顔検出チュートリアル</ title >  
   
   <スクリプト  src = "js/tracking-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/face-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/eye-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/mouth-min.js" > </スクリプト>  
   
   <スタイル>  
  .rect {
    境界線: 2px 実線 #a64ceb;
    左: -1000px;
    位置: 絶対;
    上: -1000px;
  } 
   
  #画像 {
    位置: 絶対;
    上位: 50%;
    左: 50%;
    マージン: -173px 0 0 -300px;
  } 
   </スタイル>  
 //トラッキングコード。
 <スクリプト>  
     window.onload =関数（）{
      var img =ドキュメント.getElementById('img'); 
   
      var tracker = new tracker.ObjectTracker(['face', 'eye', 'mouth']); // パラメータに基づいて配列を返します。
      トラッカー.setStepSize(1.7); 
   
      トラッキング.track('#img', トラッカー); 
   
      トラッカー.on('トラック', 関数(イベント) {
        イベント.データ.forEach(関数(rect) {
          描画(rect.x、rect.y、rect.width、rect.height);
        });
      }); 
   
      関数draw(x, y, w, h) {
        var rect = document .createElement('div');
        document.querySelector('.imgContainer').appendChild(rect);
        rect.classList.add('rect'); 
         rect.style.width = w + 'px'; 
         rect.style.height = h + 'px'; 
         rect.style.left = (img.offsetLeft + x) + 'px'; 
         rect.style.top = (img.offsetTop + y) + 'px';
      };
    }; 
   </スクリプト>  
   
 </ヘッド>  
 <本文>  
 < div  クラス= "imgContainer" >  
   <画像  id = "画像"   src = "アセット/face.jpg"   />  
 </div>  
   
 </本文>  
 </html>

結果

コードの説明。

tracking.ObjectTracker()メソッドは、追跡するオブジェクトを識別するクラスを受け取り、配列をパラメーターとして受け入れます。
setStepSize() はブロックのステップサイズを指定します。
追跡するオブジェクトを “track” イベントにバインドします。オブジェクトが追跡されると、追跡対象のオブジェクトはすぐに追跡イベントをトリガーします。
データはオブジェクトの配列の形式で取得されます。この配列には、各オブジェクト (顔、口、目) の幅、高さ、x 座標、y 座標が含まれます。

結果の要約。
結果は症状の形状によって異なる場合があり、改善と拡張の余地がありますが、私たちはこのタイプの API の開発を認識し、高く評価しています。

例を実行します:

画像付き実行例。

その他のリソース – Javascript による顔認識

https://github.com/auduno/headtrackr

https://github.com/auduno/clmtrackr

HTML5 Canvas とウェブカメラのビデオおよび画像のタグ付けを使用した顔追跡のチュートリアルを作成する予定です。上で説明したクライアントアクセスカメラブログを使用すると、既知の方法でユーザーのカメラにアクセスできるようになります。

注意:ブラウザのセキュリティ上の理由により、このプログラムは同じドメインで実行するか、ブラウザで Web セキュリティを無効にして実行する必要があります。

この記事は気に入りましたか？

この記事に関してご提案や追加事項がある場合、または誤りや古い情報を見つけた場合は、お気軽にお問い合わせください。皆様のご意見をお待ちしております。

ぜひこの記事を友達と共有したり、コメントを残したりしてください。皆様のご支援を心より感謝いたします！

Javascript ベースの顔検出方法

<<: WeChat JS-SDK-使用許可署名アルゴリズム

>>: 非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

人工知能が学習と発達に及ぼす7つの影響

ブログ

顔認識に興味がありますか? JavaScriptで実装された顔検出方法

人工知能が学習と発達に及ぼす7つの影響

自動車業界における人工知能の5つの主要な応用

中国と米国の人工知能の格差はどれほど大きいか：米国の人材総数は中国の約20倍

Nvidia は、ハイエンド GPU チップ上の AI モデルのパフォーマンスを向上させる TensorRT-LLM オープンソースソフトウェアをリリースしました。

Google、AIの地位強化のためデータサイエンスコミュニティKaggleの買収を発表

複雑なネットワーク分析の効率を向上！中国の科学者が強化学習の新しい枠組みを開発

倉庫の自動化は人気が高い。ソフトバンクは28億ドルを投じてオートストアの40％を買収した。

世界主要7カ国のAI戦略を総ざらい

推薦する

人工知能はどのようにして銀行をより「インテリジェント」にすることができるのでしょうか?

米メディア：人工知能の発展には5つの大きなトレンドが予想される

AIとRPAによるテストがイノベーションを促進できる理由

5G時代の人工知能のホットスポットとなる業界はどこでしょうか？

機械学習に必要なエンジニアリングの量は将来大幅に削減されるだろう

マイケル・ブロンスタインは代数的位相幾何学から学び、新しいグラフニューラルネットワークのコンピューティング構造を提案しました。

Javaソートアルゴリズムの概要（I）：挿入ソート

DeeCamp 2019は産学連携を促進するためにKuaishouとInnovation Worksを正式に立ち上げました

崑崙Core2が量産開始：性能が2～3倍向上し、中国の産業知能に強力な「コア」を注入

人工知能時代の到来とともに、私たちはどんな知識を学ぶべきでしょうか？

30億枚の写真データベースを持つ顔認識スタートアップがハッカーの攻撃を受ける！ 600以上の法執行機関と銀行の情報が盗まれた