深セン大学教授が顔検出ライブラリをオープンソース化、顔検出速度は最大1500FPS以上

深セン大学教授が顔検出ライブラリをオープンソース化、顔検出速度は最大1500FPS以上

先週、深セン大学コンピュータサイエンスおよびソフトウェア工学部の Yu Shiqi 教授が、最大 1500 FPS 以上の顔検出速度を誇る顔検出ライブラリを GitHub でオープンソース化しました。

[[260654]]

これは、画像内の CNN ベースの顔検出用のオープンソース ライブラリです。 CNN モデルは C ソース ファイル内の静的変数に変換されました。ソースコードは他のライブラリに依存しません。必要なのは C++ コンパイラだけです。 C++ コンパイラを使用して、Windows、Linux、ARM、および任意のプラットフォームでソース コードをコンパイルできます。

検出を高速化するために SIMD 命令が使用されます。 Intel CPU または NEON for ARM を使用する場合は、Advanced Vector Extensions 命令セットを有効にすることができます。モデル ファイルも ./models/ ディレクトリに提供されています。 examples/libfacedetectcnn-example.cpp はライブラリの使用方法を示しています。

コンパイル方法:

  • g++ でソース コードをコンパイルする場合は、最適化を有効にするために -O3 を追加します。
  • Microsoft Visual Studio でソース コードをコンパイルする場合は、「-O2」を選択します。

Windows 上の CNN に基づく顔検出

ARM Linux (Raspberry Pi 3 B+) での顔検出実験の結果

以前は、このプロジェクトはオープンソースではなく、ダイナミック リンク ライブラリ (include+lib) のみを提供していました。ユーザーは API を呼び出すことしかできませんでした。先週になってようやくオープンソース化されました。

<<:  AI+クラウドランディングBeifei Technology、Amazon Pollyの助けを借りて教育モードの変化を促進

>>:  将来人工知能に置き換えられる可能性が最も低い10の仕事

ブログ    

推薦する

AIが宇宙飛行士の健康を宇宙で監視する方法

[[286902]] ▲ 火星探査機ロゼッタが光学スペクトル赤外線リモートイメージングシステム(OS...

AI を人間の価値観に合わせるのはなぜ難しいのでしょうか?

何十年もの間、私たちは自分たちのイメージに合った人工知能を開発しようと努めてきました。一方で、私たち...

...

Google、AIアシスタント「Gemini」の修正を加速、拒否率を半減

2月18日、Googleは人工知能プロジェクトを大幅にアップデートし、BardをGeminiに改名し...

Meta がテキストを音声に変換するオープンソースライブラリ AudioCraft をリリース

最近、Meta は Llama シリーズのモデルやすべてを分割する SAM モデルなど、複数の AI...

人工知能の台頭でIT業界やその他の分野は失業の波に直面するかもしれない

[[237676]]画像ソース @Visual China以前、「AI従業員の最初の一団が解雇された...

Gluon は AI 開発者に自己調整型機械学習をもたらします

概要: Microsoft と Amazon の共同作業により、MXNet と Microsoft ...

MIT が夢を創るマシン「ドリーム インキュベーター」を開発、インセプションの現実版をカスタマイズ

目が覚めているのと眠っているのを同時に経験したことがありますか?実はここは現実と夢を繋ぐ中継駅なので...

...

...

...

交換されますか? GPT4コードインタープリター完全自動

こんにちは、みんな。今日は、GPT-4 コード インタープリターがデータ分析、科学研究の描画、機械学...

...

...

...