Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

[[439245]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました!

見てください!わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。

この速度はコンピューターの速度と同等のようですね?

自分で作ってみませんか?チュートリアルに進みます。

AndroidスマートフォンにYOLOv5を導入する

正確にはYOLOv5sです。

YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。

実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。

Android デバイスにデプロイするには、次の環境が必要です。

  • Ubuntu 18.04をホ​​ストする
  • ドッカー

テンソルフロー 2.4.0
パイトーチ 1.7.0
オープンヴィーノ2021.3

  • Androidアプリ

Android Studio 4.2.1
最小SDKバージョン28
ターゲットSDKバージョン29
TFライト2.4.0

  • Androidデバイス

Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB)
オペレーティング システム MUI 12.5.8

次に、GitHub で著者のプロジェクトを直接ダウンロードします。

git clone --recursive https://github.com/lp6m/yolov5s_android

ホストの評価とモデル変換には Docker コンテナを使用します。

cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash

アプリ フォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。

ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。

「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。

カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレーム レートは 15FPS です。

このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト(最終的に 2,000 ドルの賞金を獲得)であったため、パフォーマンス評価も実施しました。

評価には遅延と精度が含まれます。

  • 遅延時間

Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。

結果は次のとおりです。

モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。

△ フロート32

△ 整数8

お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。

  • 正確さ

さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。

最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜

プロジェクトアドレス:

https://github.com/lp6m/yolov5s_android

<<:  脳波を使って魔法ダメージをアップさせよう!プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動

>>:  顔認識が再び物議を醸す

ブログ    
ブログ    

推薦する

2021年、多くのAI企業が株式公開に向けて競争を始めました。どの企業がより有望だと思いますか?

[[382172]]人工知能企業が株式を公開すると、株主は成長の配当を分け合えるようになるのでしょ...

AIは観光業を良いビジネスにするでしょうか?

[[245713]]黄金の9月と銀の10月、観光業界は好景気の日々を待ち望んでいました。一方では、...

機械学習のアルゴリズム(2) - サポートベクターマシン(SVM)の基礎

SVM に関する論文や書籍は数多くあります。Qiang 兄弟の言葉を引用すると、「SVM は応用数学...

...

C/C++アルゴリズム設計における任意のビット幅の使用

固定小数点アルゴリズムを開発する場合、設計機能、数値的に正確なモデリング、検証 (シミュレーション)...

5G、AI、IoTが「インテリジェントな接続」を実現する方法

5G、人工知能(AI)、モノのインターネット(IoT)技術の発展により、あらゆるものがインテリジェン...

マイクロソフト、AIの高得点宿題を配布、オンラインでコピーを求める

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

産業用AIが製造業に革命を起こす5つの方法

人工知能 (AI) は、製造業において総合設備効率 (OEE) と生産時の初回歩留まりを向上させるた...

10億のデータから数字を素早く見つける方法 | 定番アルゴリズムBitMapの詳しい説明

序文多くの人は、BitMap は文字通りビットマップを意味すると考えています。実際、より正確には、ビ...

物流でGenAIを効果的に活用するための鍵は、ユースケースを理解することです。

GenAI を商品輸送という主要機能にどのように適用できるかは最初は明確ではないかもしれませんが、...

...

自然言語処理のためのニューラルネットワークモデルに関する予備的研究

ディープラーニング技術は、自然言語処理 (NLP) の分野に大きな影響を与えます。しかし、初心者の場...

グーグル元会長「人工知能だけでは市場を創出できない」

[[321190]]販売員からトラック運転手、医師に至るまで、経済全体の多くの仕事や役割が人工知能...

私たちは人工知能をどれほど深く誤解しているのか

[[320546]]人工知能技術には良い影響と悪い影響の両方があり、人類に利益をもたらす一方で、さま...

ボストン・ダイナミクスはまたもオーナーが変わる。ロボット界のトップスターを商業化するのはなぜ難しいのか?

序文:ロボット産業の研究者および愛好家として、私は産業や生活におけるロボットの実用化について常に考え...