独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラル ネットワークを構築します。

 

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

  • 独自のデータセットの読み込みと前処理
  • Keras での CNN モデルの設計とトレーニング
  • 損失と精度の曲線のプロット
  • モデルを評価し、テスト画像の出力クラスを予測する
  • CNNの中間層出力の可視化
  • 結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

  1. PATH = os.getcwd()  
  2. #データパスを定義する 
  3. data_path = PATH + '/data'    
  4. data_dir_list = os.listdir(データパス)  
  5. データディレクトリリスト

出力:

  1. [ '自転車' '車' '猫' '犬' '花' '馬' '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

  1. #いくつかの画像を視覚化する 
  2. 画像 = X_train[1441,:].reshape((128,128))  
  3. plt.imshow(画像)  
  4. plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する 

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

  1. #入力シェイプの初期化 
  2. input_shape = img_data[0].shape  
  3. #CNNシーケンシャルモデルの設計 
  4. モデル = シーケンシャル ([  
  5. 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
  6. 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
  7. MaxPooling2D(プールサイズ = (2,2))、  
  8. ドロップアウト(0.5)、  
  9. 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
  10. MaxPooling2D(プールサイズ = (2,2))、  
  11. ドロップアウト(0.5)、  
  12. フラット化()、  
  13. 密度(64, 活性化 = 'relu' ),  
  14. ドロップアウト(0.5)、  
  15. 密度(num_classes、アクティベーション = 'softmax' )  
  16. ])  
  17. #モデルのコンパイル 
  18. モデル.コンパイル(  
  19. 損失 = 'カテゴリクロスエントロピー'  
  20. オプティマイザー = 'adadelta'  
  21. メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

  1. ist = model.fit(X_train, y_train,  
  2. バッチサイズ = 16、  
  3. nb_epoch = num_epoch、  
  4. 詳細=1、  
  5. 検証データ = (X_テスト、y_テスト)  



次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

  1. # テスト画像の予測 
  2. 印刷((モデル.予測(テストイメージ)))  
  3. print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0](自転車)に正しく分類しました。


  1. [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
  2. 3.0998811e-01 1.3129448e-02]]  
  3. 画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<:  機械学習: 密度ベースの外れ値検出アルゴリズム

>>:  200 の優れた機械学習チュートリアルの要約「史上最も完全」

ブログ    
ブログ    
ブログ    

推薦する

...

AIを活用した自動化が成果を上げる:自動化の破壊的イノベーションにより収益成長が1.5倍に増加

新型コロナウイルス感染症のパンデミックによって引き起こされた市場の混乱は、世界中の企業に引き続き重く...

Nvidia は 5 億ドル相当の巨額注文を獲得しました。インドのデータセンターが H100/GH200 を一気に 16,000 台購入

Nvidia は大きな注文を受けるのでしょうか? 1 回のトランザクションには 16,000 個の ...

参入から放棄までのデータマイニング:線形回帰とロジスティック回帰

「データマイニングのアルゴリズムは、線形代数、確率論、情報理論に基づいています。それらを深く掘り下げ...

AIがビデオ業界の変革を推進する方法

AI コンテンツ分析は、ビデオで取り上げられているトピックや、ビデオ内の登場人物が表現した感情を識別...

「脳制御+AI」で人は「本能」で運転できるようになる

「左に曲がれ、左に曲がれ、左に曲がれと言っただろう!」「ステップ!ステップ!ブレーキを踏め!」「手で...

エッジコンピューティングは産業界でどのような用途に使われていますか?

エッジ コンピューティングは、モバイル コンピューティングとモノのインターネット (IoT) テクノ...

心臓血管疾患における人工知能の応用

人工知能(AI)は、知識の学習、知識の保存、思考、計画という人間の脳の思考プロセスをシミュレートする...

アルトマン氏の地位は再び危険にさらされているのか? ! OpenAIの取締役会が競合他社の参加を呼びかけ、Google Geminiの幹部を引き抜いた

アルトマン氏の地位は再び危険にさらされているのか?事情に詳しい人物によると、オープンAIの取締役であ...

GenAI はクラウド コンピューティングの ROI を向上できますか?

既存企業は、クラウド コンピューティングの導入を検討する際、ジレンマに直面します。メリットは魅力的か...

ローコード機械学習ツール

機械学習は、ビジネスや世界中のさまざまな問題の解決に役立つ可能性があります。通常、機械学習モデルを開...

...