10行のコードで物体検出を実行する方法

導入

人工知能の重要な分野はコンピュータービジョンです。コンピュータービジョンは、コンピューターとソフトウェアシステムが画像やシーンを認識して理解できる科学です。コンピュータービジョンには、画像認識、ターゲット検出、画像生成、画像超解像度などの側面も含まれます。物体検出は、現実世界での使用例が膨大にあることから、おそらくコンピュータービジョンの最も重要な側面です。

オブジェクト検出とは、コンピューターやソフトウェアシステムが画像/シーン内のオブジェクトを見つけて各オブジェクトを識別する機能を指します。物体検出は、顔検出、車両検出、歩行者カウント、ネットワーク画像、セキュリティシステム、自動運転車で広く使用されています。多くの実践分野において、物体検出には多くの方法が存在します。他のコンピュータ技術と同様に、物体検出の幅広い創造的で驚くべき用途は、コンピュータプログラマーとソフトウェア開発者の努力から生まれるに違いありません。

今回は、プログラマーやソフトウェア開発者がわずか数行のコードで最先端のコンピュータービジョンテクノロジーを既存および新規のアプリケーションに簡単に統合できるようにする Python ライブラリである ImageAI というプロジェクトを紹介します。

ImageAI導入工事

ImageAI でオブジェクト検出を実行するには、次の手順に従います。

コンピュータシステムにPythonをインストールする
ImageAIとその依存関係をインストールする
オブジェクト検出モデルファイルをダウンロードする
サンプルコードを実行する（10行のみ）

それでは、今すぐ始めましょう:

公式の Python 言語 Web サイトから Python 3 をダウンロードしてインストールします。
pip 経由でインストール: TensorFlow、OpenCV、Keras、ImageAI

 pip3 テンソルフローをインストール
pip3 opencv-python をインストール
pip3 keras をインストール
pip3 イメージAI をインストール--upgrade

3) この記事のリンクから、オブジェクト検出用の RetinaNet モデルファイルをダウンロードします。

https://towardsdatascience.com/object-detection-with-10-lines-of-code-d6cb4d86f606

プログラムを実行する

とても良い。依存関係がインストールされたので、最初のオブジェクト検出コードを記述できます。 Python ファイルを作成し、名前を付けて (たとえば、FirstDetection.py)、次のコードを記述します。検出したい RetinaNet モデルファイルイメージを、Python ファイルを含むフォルダーにコピーします。

 imageai.DetectionからObjectDetection をインポートします 
インポートOS 
 実行パス = os.getcwd()  
検出器 = オブジェクト検出()  
検出器.setModelTypeAsRetinaNet()  
 detector.setModelPath( os.path.join (execution_path, "resnet50_coco_best_v2.0.1.h5" ))  
検出器.loadModel()  
検出 = detector.detectObjectsFromImage( 入力イメージ = os.path.join (実行パス、 「image.jpg」 ) 、出力イメージパス= os.path.join (実行パス、 「imagenew.jpg」 )) 
 検出における各オブジェクトについて:  
 print(eachObject[ "name" ], ": " ,  
各オブジェクト[ "パーセンテージ確率" ] )

実行中にこのエラーが発生した場合は、次の点に注意してください。

 ValueError: バックエンドをインポートできません: theano python mymodel.py

次に、次のことを試すことができます。

 osos.environ[ 'KERAS_BACKEND' ] = 'tensorflow'をインポートします  
 imageai.Detection インポート ObjectDetection

次に、コードを実行し、結果がコンソールに表示されるまで待ちます。結果がコンソールに表示されたら、FirstDetection.py が保存されているフォルダーに移動すると、新しい画像が保存されていることがわかります。以下の 2 つのサンプル画像と、検出後に保存された新しい画像をご覧ください。

テスト前:

テスト後:

データ結果

プログラムは各オブジェクトの確率データを出力していることがわかります。

人 : 55.8402955532074
人 : 53.21805477142334
人: 69.25139427185059
人: 76.41745209693909
自転車: 80.30363917350769
人: 83.58567953109741
人: 89.06581997871399
トラック: 63.10953497886658
人: 69.82483863830566
人 : 77.11606621742249
バス: 98.00949096679688
トラック: 84.02870297431946
車: 71.98476791381836

プログラムは画像内の次のターゲットを検出できることがわかります。

人、バイク、トラック、車、バス。

検出したい写真をプログラムに直接入れて実行し、効果を確認することができます。

原理説明

それでは、この 10 行のコードがどのように機能するかを説明しましょう。

 imageai.DetectionからObjectDetection をインポートし、 osexecution_path をインポートします。
 = os.getcwd()

上記の 3 行のコードでは、最初の行で ImageAI オブジェクト検出クラスをインポートし、2 行目で python os クラスをインポートし、python ファイル、RetinaNet モデルファイル、および画像が配置されているフォルダーへのパスを保持する変数を定義しました。

検出器 = ObjectDetection() 検出器.setModelTypeAsRetinaNet() 検出器.setModelP
 ath( os.path.join (execution_path, "resnet50_coco_best_v2.0.1.h5" ))detector.loadModel()検出=
 detector.detectObjectsFromImage(input_image=os.path.join (実行パス
th 、 "image.jpg" ）、 output_image_path=os.path.join (実行パス、
 「imagenew.jpg」 ))

上記のコードでは、1 行目で Object Detection クラスを定義し、2 行目でモデルタイプを RetinaNet に設定し、3 行目でモデルパスを RetinaNet モデルのパスに設定し、4 行目でモデルを Object Detection クラスにロードし、検出関数を呼び出して、5 行目で入力画像パスと出力画像パスを解析します。

検出内の各オブジェクトについて: print(eachObject[ "name" ] , " : "       
 、各オブジェクト[ "percentage_probability" ] )

上記のコードでは、最初の行で detector.detectObjectsFromImage 関数によって返されたすべての結果を反復処理し、2 行目に画像内で検出された各オブジェクトのモデル名とパーセンテージ確率を出力します。

<<: 大手企業がどのように人工知能を活用し、実践しているのかご覧ください。

>>: 国産ディープラーニングフレームワーク「MegEngine」が3月末にオープンソース化

10行のコードで物体検出を実行する方法

AI機能をエッジに拡張する方法: ストレージが基盤となる

GPT-4 はロボットの手にペンを回したりルービックキューブで遊んだりすることを教えます。 RL コミュニティは衝撃を受ける: LLM 設計の報酬は人間を超えることができるのか?

過去20年間、Huilianは政府サービスにおけるグローバルインテリジェンスを実現してきました。

単一の GPU のみを使用して 7B モデルを微調整します。ユニバーサルマルチモーダルツール LLaMA-Adapter は閾値を取り除き、その効果は驚くべきものです

人民日報：教室規律における顔認識は目的ではなく手段

人工知能は将来の戦争を防ぐことができるのか？

人工知能のトップ10のアプリケーション

今日のアルゴリズム: 文字列内の隣接する重複をすべて削除する

人工知能を活用してより質の高い雇用を実現

いくつかの特徴選択方法を比較すると、どれが優れているでしょうか?

推薦する

Google は患者の質問に答える医療 AI チャットボット Med-PaLM 2 を病院でテスト中

マイクロソフト、仕事の効率化に役立つ 7 つの新しい AI 製品を発表

データ構造とアルゴリズム、グラフをトラバースする2つの方法を理解する

Nature Sub-Journal | NUS と ByteDance が初めて AI メタ学習を脳画像に導入

30秒で署名、上海の核酸採取ロボットが登場！

人工知能は人間の弱点を克服できる

ディープラーニングの未来に関する6つの予測

安定性AIの今年最初の大きなモデル：特別に書かれたコード、18のプログラミング言語をサポート、10万のコンテキストを持ち、Appleのラップトップでオフラインで実行可能

機械学習を利用するハッカーを心配していますか?データを盗む7つの新しい方法を知る

株式取引における人工知能の応用

人工知能が人々を失業させるのは悪いことではありません。それどころか、それは良い役割を果たします。