Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

[[439245]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました！

見てください！わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。

この速度はコンピューターの速度と同等のようですね？

自分で作ってみませんか?チュートリアルに進みます。

AndroidスマートフォンにYOLOv5を導入する

正確にはYOLOv5sです。

YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。

実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。

Android デバイスにデプロイするには、次の環境が必要です。

Ubuntu 18.04をホストする
ドッカー

テンソルフロー 2.4.0
パイトーチ 1.7.0
オープンヴィーノ2021.3

Androidアプリ

Android Studio 4.2.1
最小SDKバージョン28
ターゲットSDKバージョン29
TFライト2.4.0

Androidデバイス

Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB)
オペレーティングシステム MUI 12.5.8

次に、GitHub で著者のプロジェクトを直接ダウンロードします。

git clone --recursive https://github.com/lp6m/yolov5s_android

ホストの評価とモデル変換には Docker コンテナを使用します。

cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash

アプリフォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。

ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。

「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。

カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレームレートは 15FPS です。

このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト（最終的に 2,000 ドルの賞金を獲得）であったため、パフォーマンス評価も実施しました。

評価には遅延と精度が含まれます。

遅延時間

Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。

結果は次のとおりです。

モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。

△ フロート32

△ 整数8

お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。

正確さ

さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。

最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜

プロジェクトアドレス:

https://github.com/lp6m/yolov5s_android

<<: 脳波を使って魔法ダメージをアップさせよう！プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動

>>: 顔認識が再び物議を醸す

余分な指などのバグを解決できる「人間のような」AI画像作成モデルをMetaがリリース

ブログ

生成 AI は企業の知識管理をどのように改善できるのでしょうか?

ブログ

パラメータは最大2兆個、GPT-4をはるかに超える！アマゾンの新型オリンパス大型モデルが公開、近日発表予定

ブログ

Google Geminiはリリース直後から疑問視されていた：テスト基準に偏りがあり、エフェクトビデオは編集されている疑いがある

ブログ

AIの技術的負債の解消は急務

ブログ

派手なものはやめましょう！ ChatGPT の最も強力な 7 つのプラグインをチェックしてください。プロンプトを書いたり、外国語を学んだり、ビデオを要約したり、ChatGPT を個人秘書にしたりできます。

ブログ

ハードウェアクラッキングに耐えられるハッシュアルゴリズムにはどのようなものがありますか?

ブログ

ネイチャー誌の年間トップ10科学者・イベント：天問1号の主任設計者、張栄橋氏がリスト入り

ブログ

Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

AndroidスマートフォンにYOLOv5を導入する

余分な指などのバグを解決できる「人間のような」AI画像作成モデルをMetaがリリース

生成 AI は企業の知識管理をどのように改善できるのでしょうか?

パラメータは最大2兆個、GPT-4をはるかに超える！アマゾンの新型オリンパス大型モデルが公開、近日発表予定

Google Geminiはリリース直後から疑問視されていた：テスト基準に偏りがあり、エフェクトビデオは編集されている疑いがある

AIの技術的負債の解消は急務

派手なものはやめましょう！ ChatGPT の最も強力な 7 つのプラグインをチェックしてください。プロンプトを書いたり、外国語を学んだり、ビデオを要約したり、ChatGPT を個人秘書にしたりできます。

ハードウェアクラッキングに耐えられるハッシュアルゴリズムにはどのようなものがありますか?

ネイチャー誌の年間トップ10科学者・イベント：天問1号の主任設計者、張栄橋氏がリスト入り

推薦する

2021年、多くのAI企業が株式公開に向けて競争を始めました。どの企業がより有望だと思いますか？

AIは観光業を良いビジネスにするでしょうか？

機械学習のアルゴリズム（2） - サポートベクターマシン（SVM）の基礎

C/C++アルゴリズム設計における任意のビット幅の使用

5G、AI、IoTが「インテリジェントな接続」を実現する方法

マイクロソフト、AIの高得点宿題を配布、オンラインでコピーを求める

産業用AIが製造業に革命を起こす5つの方法

10億のデータから数字を素早く見つける方法 | 定番アルゴリズムBitMapの詳しい説明

物流でGenAIを効果的に活用するための鍵は、ユースケースを理解することです。

自然言語処理のためのニューラルネットワークモデルに関する予備的研究

グーグル元会長「人工知能だけでは市場を創出できない」

私たちは人工知能をどれほど深く誤解しているのか

ボストン・ダイナミクスはまたもオーナーが変わる。ロボット界のトップスターを商業化するのはなぜ難しいのか？