独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラル ネットワークを構築します。

 

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

  • 独自のデータセットの読み込みと前処理
  • Keras での CNN モデルの設計とトレーニング
  • 損失と精度の曲線のプロット
  • モデルを評価し、テスト画像の出力クラスを予測する
  • CNNの中間層出力の可視化
  • 結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

  1. PATH = os.getcwd()  
  2. #データパスを定義する 
  3. data_path = PATH + '/data'    
  4. data_dir_list = os.listdir(データパス)  
  5. データディレクトリリスト

出力:

  1. [ '自転車' '車' '猫' '犬' '花' '馬' '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

  1. #いくつかの画像を視覚化する 
  2. 画像 = X_train[1441,:].reshape((128,128))  
  3. plt.imshow(画像)  
  4. plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する 

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

  1. #入力シェイプの初期化 
  2. input_shape = img_data[0].shape  
  3. #CNNシーケンシャルモデルの設計 
  4. モデル = シーケンシャル ([  
  5. 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
  6. 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
  7. MaxPooling2D(プールサイズ = (2,2))、  
  8. ドロップアウト(0.5)、  
  9. 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
  10. MaxPooling2D(プールサイズ = (2,2))、  
  11. ドロップアウト(0.5)、  
  12. フラット化()、  
  13. 密度(64, 活性化 = 'relu' ),  
  14. ドロップアウト(0.5)、  
  15. 密度(num_classes、アクティベーション = 'softmax' )  
  16. ])  
  17. #モデルのコンパイル 
  18. モデル.コンパイル(  
  19. 損失 = 'カテゴリクロスエントロピー'  
  20. オプティマイザー = 'adadelta'  
  21. メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

  1. ist = model.fit(X_train, y_train,  
  2. バッチサイズ = 16、  
  3. nb_epoch = num_epoch、  
  4. 詳細=1、  
  5. 検証データ = (X_テスト、y_テスト)  



次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

  1. # テスト画像の予測 
  2. 印刷((モデル.予測(テストイメージ)))  
  3. print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0](自転車)に正しく分類しました。


  1. [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
  2. 3.0998811e-01 1.3129448e-02]]  
  3. 画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<:  機械学習: 密度ベースの外れ値検出アルゴリズム

>>:  200 の優れた機械学習チュートリアルの要約「史上最も完全」

ブログ    
ブログ    
ブログ    

推薦する

...

ランウェイの最強のライバルが登場、ワンクリックでショートビデオを生成、期間限定で無料

近年、AI による絵画のレベルは飛躍的に向上しています。 Midjourney と Adob​​e ...

...

文字の組み合わせをソートするJavaアルゴリズム

Java の文字の組み合わせソートは、特に難しい問題ではありません。ブルートフォースとグラフ理論 (...

ディープラーニングはオイラー方程式を「破壊」する準備ができている

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

生成型 AI は急速な発展期を迎えています。その応用はどのように実装されるのでしょうか?

先月、国際的に有名な学術誌「ネイチャー」が2023年のトップ10を発表しました。世界的な科学イベント...

もしかしたら「スパイ」していたのかもしれません!大規模モデルのプライバシー推論精度は 95.8% です。

Reddit のユーザーが通勤に関するステータスを投稿しました。通勤途中に、曲がり角を待つ厄介な交...

開発に重点を置き、革新を追求します。 LeaTech Global CTO Leadership Summit が始まりました!

[51CTO.comより]デジタル経済時代の到来が加速し、「第14次5カ年計画」が発表されるにつれ...

車が自動運転できるようになりました。運転免許試験はまだ半分しか終わっていません。引き続き試験を受ける必要がありますか?

自動運転は今とてもホットな話題です。一般の人々も自動車会社も自動運転に強い関心を持っています。現在、...

人工知能はすべての人のキャリアを置き換えるわけではないが、新たな雇用機会も生み出すだろう

非常に憂鬱な格言があります。「今年は過去 10 年間で最悪の年だが、今後 10 年間では最高の年だ」...

推理力が2倍にアップ!プリンストン大学と北京大学の卒業生がロング「メデューサ」を提供、33Bモデルは13Bと同等の速さ

LLM アーキテクチャに固有のメモリ制限により、生成は遅く、コストがかかります。この点に関して、多く...

AIがサプライチェーンを変革する7つの方法

ビジネスにおける AI の役割は拡大し続けています。これは、サプライ チェーンとビジネス プロセスの...

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...