サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

サイズはたったの1MB!超軽量顔認識モデルがGithubで人気

最近、ユーザー Linzaer が、エッジ コンピューティング デバイス、モバイル デバイス、PC に適した超軽量のユニバーサル顔検出モデルを Github でオープンソース化しました。このモデル ファイルのサイズはわずか 1 MB で、オープンソース化されるとすぐに Github のトレンド リストのトップに躍り出ました。

わずか数日で、Github で 2.1K のスターと 398 のフォークを獲得しました (Github アドレス: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)

Linzaer氏によると、このモデルはエッジコンピューティングデバイスや低コンピューティングデバイス(ARM推論を使用するなど)向けに設計されており、ARMなどの低コンピューティングデバイスでの一般的なシナリオでリアルタイムの顔検出推論を実行できるほか、モバイル端末やPCにも適用できるという。

主な機能は次のとおりです。

  • モデルサイズに関しては、デフォルトの FP32 精度 (.pth) ファイルサイズは 1.04 ~ 1.1 MB で、int8 量子化後の推論フレームワークのサイズは約 300 KB です。
  • モデル計算に関しては、入力解像度は 320x240、スループットは約 90~109 MFlops です。
  • このモデルには、バージョン スリム (合理化されたバックボーンによりわずかに高速化) とバージョン RFB (より高い精度のために修正された RFB モジュールが追加された) の 2 つのバージョンがあります。
  • さまざまなアプリケーション シナリオでより適切に動作するように、320 x 240 と 640 x 480 の異なる入力解像度でワイドフェイスを使用してトレーニングされた事前トレーニング済みモデルが提供されます。
  • 移植と推論を容易にするために onnx エクスポートをサポートします。

これまでテストされた通常の動作環境は次のとおりです。

  • Ubuntu 16.04、Ubuntu 18.04、Windows 10 (推論)
  • Python 3.6
  • パイトーチ 1.2
  • CUDA10.0 + CUDNN7.6

精度、速度、モデルサイズの比較

トレーニング セットは、Retinaface によって提供されるクリーンな wideface ラベルと wideface データセットを使用して生成され、VOC トレーニング セットが生成されます。

ワイドフェイステスト

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: 320*240 または最大辺長 320 に比例してスケーリング)

WIDER FACE テスト セットでのテスト精度 (単一スケールの入力解像度: VGA 640*480 または最大辺長 640 に比例してスケーリング)

端末機器推論速度

Raspberry Pi 4B MNN推論テスト時間(単位:ms)(ARM/A72x4/1.5GHz/入力解像度:320x240/int8量子化)

モデルサイズの比較

画像効果は以下のとおりです。

<<:  AI は鉱業をどのように改善できるのでしょうか?

>>:  産業用ロボットを選択するための 9 つの主要なパラメータをご存知ですか?

ブログ    
ブログ    
ブログ    

推薦する

...

...

...

2022 年のビジネス インテリジェンス トレンド予測

調査では、テクノロジー主導の業界を推進する 2022 年までのビジネス インテリジェンスの主要なトレ...

人工知能はどのようにして自分自身に目標を設定するのでしょうか?

インテリジェントシステムは独自の初期目標を決定することはできませんが、経験に基づいて独自の派生目標を...

2021 年のロボティック プロセス オートメーション (RPA) 面接の 6 つの質問

[[379840]] [51CTO.com クイック翻訳] 求職者や採用担当者は、RPA 面接にどう...

...

顔認識を法的に規制する方法

[[359388]]政府機関による顔認識技術の利用に対する法的規制に関して、特別ライセンス制度は、顔...

タクシー無料!百度:北京の自動運転タクシーサービスが全面オープン

簡単に体験できるものではないため、自動運転技術が実用化にはまだ遠いと感じている人も多いでしょう。しか...

JavaScript による機械学習の例 10 選

機械学習ライブラリは時間の経過とともに高速化と使いやすさが向上しており、開発のペースが鈍化する兆候は...

AIはいかにして「医療の神様」となったのか?

[[236501]] 「彼はただ生き残りたいだけ。どんな罪を犯したのか?」黄茂さんが亡くなった後、...

人気の古い写真が動いたり歌ったり、Weishi はワンクリックで AI ビデオ特殊効果を実装

[[386434]]紙から携帯電話まで、このチームはワンクリックでますます楽しい特殊効果を実現してい...

任澤平:「新インフラ」は時代の痕跡を刻む

【51CTO.comオリジナル記事】今年、我が国では間違いなく新しいインフラがホットな話題です。 2...

李開復氏:将来、人間の仕事の半分はAIに奪われるが、失業しない分野は2つだけ

中関村オンラインニュース:李開復氏は先日、未来フォーラムで人工知能をテーマにしたメディアインタビュー...