JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実際の導入と徹底的な研究には、それに応じた公的支援が必要です。たとえば、実稼働レベルの顔表現ネットワークでは、さまざまな SOTA バックボーン ネットワーク、トレーニング監督トピック、および現実世界の顔認識のニーズに対応するためのモジュール式のトレーニング メカニズムが必要です。パフォーマンス分析と比較に関しては、複数のベンチマークに基づく多数のモデルには、標準的で自動化された評価ツールも必要です。さらに、全体的なパイプラインの形で展開できる顔認識の共通基盤が出現することが期待されています。

最近では、感染症流行中にマスクを着用しながらの顔認識の必要性など、一連の新たな課題も浮上しており、実用化に向けて人々の注目を集めている。実行可能な解決策は、これらの問題を解決するための使いやすい統一されたフレームワークを確立することです。

今年 1 月、JD.com の研究者は、顔認識技術開発コミュニティ向けに新しいオープン ソース フレームワーク FaceX-Zoo を提案しました。 FaceX-Zoo は、高度にモジュール化されスケーラブルな設計を採用しており、最適な顔認識を実現するために、さまざまな監視ヘッドとバックボーン ネットワークを備えたトレーニング モジュールを提供します。さらに、ほとんどの場合にモデルのパフォーマンスをテストするための標準化された評価モジュールも備えています。

このツールでは、単純な構成を変更するだけで、最も人気のあるベンチマークでモデルをテストできます。さらに、トレーニング済みモデルを検証し、予備的なアプリケーションを実行するための、シンプルでありながら完全に機能する顔 SDK も備えています。このツールには既存のテクノロジーがあまり含まれていませんが、これにより拡張やアップグレードも容易になります。

最近、このツールはオープンソース化されました。

GitHub リンク: https://github.com/JDAI-CV/FaceX-Zoo

ツールの環境要件は次のとおりです。

  • Python >= 3.7.1
  • Python 3.0 以降
  • トーチビジョン >= 0.3.0

FaceX-Zoo は、顔の特徴の抽出を容易にするために、MobileFaceNet、ResNet、SE-ResNet、HRNet、EfficientNet などの一般的なバックボーン ネットワークを提供します。これがニーズを満たさない場合は、構成ファイルを変更し、アーキテクチャ定義ファイルを追加するだけで、PyTorch のサポートを利用して他の選択肢を簡単にカスタマイズできます。

FaceX-Zoo の FMA-3D ツールを使用して、写真に写っている人物にマスクを付け、マスクされた顔データセットを入力します。

さまざまなバックボーン ネットワークのパフォーマンス評価。

さまざまな監督責任者のパフォーマンス評価。

JDの開発者らは、今後、研究者らは顔分析や顔照明などのFaceX-Zooモジュールの数をさらに増やし、バックボーンネットワークアーキテクチャと監視ヘッドの数を補充し、分散データ並列技術と混合精度トレーニングを通じてモデルトレーニングの効率を向上させる計画もあると述べた。

関連論文: https://arxiv.org/abs/2101.04407

<<:  人類の生存に関わる問題ですか? AI システムの説明可能性を調査する理由は何ですか?

>>:  準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ

ブログ    

推薦する

...

...

...

ソフトウェア開発プロセスは、路上でのスマートカーの安全な運行を保証するものである。

2021年に入り、自動車の道路事故率を減らし、運転プロセスの快適性を向上させる先進運転支援システム...

...

Pythonを使用して独自の音声認識システムをトレーニングします。この操作の波は安定しています

近年、音声認識技術は急速に発展しており、携帯電話のSiri音声インテリジェントアシスタント、Micr...

AI導入から最大限の価値を引き出す方法

[[344258]]業界をリードする組織を対象とした調査では、世界中の組織の大多数 (91.6%) ...

2年後には「ロボット」が人間の活動の80%以上をこなすようになるのでしょうか? AIに関する専門家の見解を聞く

写真:人工知能カンファレンスフォーラム 撮影:新民晩報主任記者 劉欣 「私は生産性を変革し、新しい...

Google が AI で利益を上げている秘密は何でしょうか?

[[441488]]ビジネスプロセスはインテリジェントではないAI プロジェクトから価値を引き出す...

AIを使って株取引で不正行為をしよう!この世代のプログラマーは本当に楽しみ方を知っている

ディープラーニングを使用して株価を予測することは、以前は少し神秘的に思えたかもしれませんが、新しいこ...

ChatGPTに対抗できるAIモデル6つと中国企業の製品2つが選定

ChatGPT は、大規模言語モデル (LLM) に基づく業界をリードするチャットボットとして、テク...

SQL Serverは最短経路検索アルゴリズムを実装しています

これは去年の質問です。今日メールを整理していたら偶然見つけました。とても興味深いと思ったので書き留め...

AIチップのスタートアップ企業CambrianがシリーズB資金調達で数億ドルの完了を発表

本日、AIチップのスタートアップ企業Cambrianが数億ドルのBラウンド資金調達を完了した。資金調...

教師あり学習の一般的なアルゴリズムは何ですか?どのように適用されますか?

教師あり学習とは何ですか?教師あり学習は機械学習のサブセットであり、機械学習モデルの入力データにラベ...

...