サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

最近、ユーザー Linzaer が、エッジ コンピューティング デバイス、モバイル デバイス、PC に適した超軽量のユニバーサル顔検出モデルを Github でオープンソース化しました。このモデル ファイルのサイズはわずか 1 MB で、オープンソース化されるとすぐに Github のトレンド リストのトップに躍り出ました。

わずか数日で、Github で 2.1K のスターと 398 のフォークを獲得しました (Github アドレス: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)

Linzaer氏によると、このモデルはエッジコンピューティングデバイスや低コンピューティングデバイス(ARM推論を使用するなど)向けに設計されており、ARMなどの低コンピューティングデバイスでの一般的なシナリオでリアルタイムの顔検出推論を実行できるほか、モバイル端末やPCにも適用できるという。

主な機能は次のとおりです。

  • モデルサイズに関しては、デフォルトの FP32 精度 (.pth) ファイルサイズは 1.04 ~ 1.1 MB で、int8 量子化後の推論フレームワークのサイズは約 300 KB です。
  • モデル計算に関しては、入力解像度は 320x240、スループットは約 90~109 MFlops です。
  • このモデルには、バージョン スリム (合理化されたバックボーンによりわずかに高速化) とバージョン RFB (より高い精度のために修正された RFB モジュールが追加された) の 2 つのバージョンがあります。
  • さまざまなアプリケーション シナリオでより適切に動作するように、320 x 240 と 640 x 480 の異なる入力解像度でワイドフェイスを使用してトレーニングされた事前トレーニング済みモデルが提供されます。
  • 移植と推論を容易にするために onnx エクスポートをサポートします。

これまでテストされた通常の動作環境は次のとおりです。

  • Ubuntu 16.04、Ubuntu 18.04、Windows 10 (推論)
  • Python 3.6
  • パイトーチ 1.2
  • CUDA10.0 + CUDNN7.6

精度、速度、モデルサイズの比較

トレーニング セットは、Retinaface によって提供されるクリーンな wideface ラベルと wideface データセットを使用して生成され、VOC トレーニング セットが生成されます。

ワイドフェイステスト

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: 320*240 または最大辺長 320 に比例してスケーリング)

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: VGA 640*480 または最大辺長 640 に比例してスケーリング)

端末機器推論速度

Raspberry Pi 4B MNN推論テスト時間(単位:ms)(ARM/A72x4/1.5GHz/入力解像度:320x240/int8量子化)

モデルサイズの比較

画像効果は以下のとおりです。

<<:  AI は鉱業をどのように改善できるのでしょうか?

>>:  産業用ロボットを選択するための 9 つの主要なパラメータをご存知ですか?

ブログ    
ブログ    
ブログ    

推薦する

...

なぜ人工知能は第四次産業革命と呼ばれるのでしょうか?

[[234940]]過去2年間、世界のIT大手は人工知能の分野で展開してきました。GoogleはD...

ついにアルゴリズムが「修正」されました!

[[427083]] 9月29日、中国サイバースペース管理局は他の8つの中央部門とともに、「インタ...

...

Apple Carに関する8つの技術的推測

著名な情報機関IHS Markitは最近、Appleの自動車プロジェクトに関する簡潔かつ説得力のある...

自動運転は自動車産業の未来だが、これはドライバーが手を完全に自由にできることを意味するものではない。

自動運転車は未来を象徴しているが、運転手が全てを完全に機械に任せることはできないかもしれない。おそら...

2頭のアルパカが頭と尻尾を切り落とし、それをくっつけてハギングフェイスリストのトップに

HuggingFace が再びオープンソースの大規模モデルのリストのトップに躍り出ました。最前列は、...

ネイチャー誌の年間トップ10科学者・イベント:天問1号の主任設計者、張栄橋氏がリスト入り

Nature の年間トップ 10 科学者およびトップ 10 科学イベントが発表されました。今年の科学...

...

アマゾンがホームロボット「Vesta」を開発、2019年に販売開始

海外メディアの報道によると、アマゾンのハードウェア研究開発部門Lab126は、「Vesta」(ヴェス...

モバイクの尹大飛氏:人工知能が何百万台もの自転車の運行改善に貢献

[51CTO.comより引用] 2017年7月21日から22日まで、51CTO主催の人工知能をテーマ...

AIを活用したリアルタイムの脅威インテリジェンスでサイバー脅威に対抗する方法

多くの企業のセキュリティ運用センター チームにとって、サイバー攻撃に対する防御は、ますます高度化する...

AI エンジンが旅行の新時代を切り開きます。なぜ最初に恩恵を受けるのでしょうか?

AI(人工知能)を中心とした技術がインターネットのさまざまな分野を席巻し、旅行や位置情報サービスを...

人工知能企業が大規模なデータ漏洩事件に見舞われ、250万人以上のデータが流出

[[258473]]最近、セキュリティ分野に注力する国内の人工知能企業で大規模なデータ漏洩事件が発生...

女の子とのいちゃつきを例にとると、5分でディープラーニングが理解できます!

[[196604]] [51CTO.com からのオリジナル記事]現在、AI が業界で重要な役割を...