独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラル ネットワークを構築します。

 

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

  • 独自のデータセットの読み込みと前処理
  • Keras での CNN モデルの設計とトレーニング
  • 損失と精度の曲線のプロット
  • モデルを評価し、テスト画像の出力クラスを予測する
  • CNNの中間層出力の可視化
  • 結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

  1. PATH = os.getcwd()  
  2. #データパスを定義する 
  3. data_path = PATH + '/data'    
  4. data_dir_list = os.listdir(データパス)  
  5. データディレクトリリスト

出力:

  1. [ '自転車' '車' '猫' '犬' '花' '馬' '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

  1. #いくつかの画像を視覚化する 
  2. 画像 = X_train[1441,:].reshape((128,128))  
  3. plt.imshow(画像)  
  4. plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する 

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

  1. #入力シェイプの初期化 
  2. input_shape = img_data[0].shape  
  3. #CNNシーケンシャルモデルの設計 
  4. モデル = シーケンシャル ([  
  5. 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
  6. 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
  7. MaxPooling2D(プールサイズ = (2,2))、  
  8. ドロップアウト(0.5)、  
  9. 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
  10. MaxPooling2D(プールサイズ = (2,2))、  
  11. ドロップアウト(0.5)、  
  12. フラット化()、  
  13. 密度(64, 活性化 = 'relu' ),  
  14. ドロップアウト(0.5)、  
  15. 密度(num_classes、アクティベーション = 'softmax' )  
  16. ])  
  17. #モデルのコンパイル 
  18. モデル.コンパイル(  
  19. 損失 = 'カテゴリクロスエントロピー'  
  20. オプティマイザー = 'adadelta'  
  21. メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

  1. ist = model.fit(X_train, y_train,  
  2. バッチサイズ = 16、  
  3. nb_epoch = num_epoch、  
  4. 詳細=1、  
  5. 検証データ = (X_テスト、y_テスト)  



次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

  1. # テスト画像の予測 
  2. 印刷((モデル.予測(テストイメージ)))  
  3. print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0](自転車)に正しく分類しました。


  1. [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
  2. 3.0998811e-01 1.3129448e-02]]  
  3. 画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<:  機械学習: 密度ベースの外れ値検出アルゴリズム

>>:  200 の優れた機械学習チュートリアルの要約「史上最も完全」

ブログ    

推薦する

ケンブリッジ 2020 人工知能パノラマレポート、将来予測される 8 つの AI トレンド

ケンブリッジ大学の「AIパノラマレポート」2020年版がこのほど正式に発表された。ケンブリッジ大学の...

3分レビュー! 2021年1月のドローン業界の重要な動向の概要

2020年の最初の月はあっという間に過ぎましたが、ドローン業界の発展は多くの原動力と章を残しました。...

グラフ畳み込みネットワークの作り方は?これは最小限のNumpy実装です

グラフは非常に複雑な構造を持ち、大量の情報を含んでいるため、グラフ上での機械学習は困難な作業です。こ...

ガートナーは、人間と機械の境界を曖昧にする5つの新たな技術トレンドを明らかにした。

世界有数の情報技術調査・コンサルティング会社であるガートナーが発表した「2018年新興技術ハイプサイ...

...

4つの主要な応用分野が開拓され、外骨格ロボットのブルーオーシャンが出現している

現在、ロボット産業の急速な発展に伴い、ロボット製品システムはより完成度が高まり、その用途も多様化して...

人工知能はテクノロジーとデータガバナンスの進化を推進する

2019年以降、アジア太平洋地域全体で政府主導のAIに関する取り組みが急増しています。これらの取り組...

...

Facebookの詐欺行為と戦う方法を学び、CopyCatchアルゴリズムがLockstepをどのように解決するかを見てみましょう

[51CTO.com クイック翻訳] インターネットが誕生して以来、あらゆる種類のジャンク情報や悪意...

...

没入型環境向けロボットの開発における3つの課題

[51CTO.com 速訳] 最近、FacebookはMessengerプラットフォーム上のチャット...

...

このアルゴリズムチームは 2020 年に何をしましたか?

[[383980]]冒頭に書いた私自身、毎年まとめを書く習慣があります。2020年は、私の職務が垂...

機械学習における線形代数の理解に役立つ 10 の例

線形代数は、ベクトル、行列、線形変換を扱う数学の分野です。これは機械学習の重要な基盤であり、アルゴリ...

AIの変革力:AI市場の探究

人工知能 (AI) は、急速に現代の最も変革的なテクノロジーの 1 つとなり、産業を再編し、生産性を...