独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像が猫、犬、または人のいずれであるかを予測できる畳み込みニューラルネットワークを構築します。

このCNN実装では、以下のトピックをカバーする独自の画像データセットを使用します。

独自のデータセットの読み込みと前処理
Keras での CNN モデルの設計とトレーニング
損失と精度の曲線のプロット
モデルを評価し、テスト画像の出力クラスを予測する
CNNの中間層出力の可視化
結果の混同行列をプロットする

独自のデータセットを読み込んで前処理します。

使用するデータセットは、インターネットから収集されラベル付けされた 7 つのクラスで構成されています。 Python コードは次のとおりです。

 PATH = os.getcwd()  
 #データパスを定義する 
 data_path = PATH + '/data'    
 data_dir_list = os.listdir(データパス)  
データディレクトリリスト

出力：

 [ '自転車' 、 '車' 、 '猫' 、 '犬' 、 '花' 、 '馬' 、 '人間' ]

いくつかの画像を視覚化すると、画像が 128 x 128 ピクセルであることがわかります。Python コードは次のとおりです。

 #いくつかの画像を視覚化する 
画像 = X_train[1441,:].reshape((128,128))  
 plt.imshow(画像)  
 plt.show()

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

次に、Keras で CNN モデルの設計とコンパイルを開始します。Python 実装は次のとおりです。

 #入力シェイプの初期化 
 input_shape = img_data[0].shape  
 #CNNシーケンシャルモデルの設計 
モデル = シーケンシャル ([  
 畳み込み2D(32,3,3, border_mode = 'same' 、 activation = 'relu' 、 input_shape = input_shape)、  
 畳み込み2D(32,3,3, アクティベーション = 'relu' )、  
 MaxPooling2D(プールサイズ = (2,2))、  
 ドロップアウト(0.5)、  
 畳み込み2D(64,3,3, アクティベーション = 'relu' )、  
 MaxPooling2D(プールサイズ = (2,2))、  
 ドロップアウト(0.5)、  
 フラット化()、  
 密度(64, 活性化 = 'relu' ),  
 ドロップアウト(0.5)、  
 密度(num_classes、アクティベーション = 'softmax' )  
 ])  
 #モデルのコンパイル 
モデル.コンパイル(  
 損失 = 'カテゴリクロスエントロピー' 、  
 オプティマイザー = 'adadelta' 、  
 メトリック = [ '精度' ])

モデルを適合させた後、反復を通してトレーニングと検証を視覚化できます。

 ist = model.fit(X_train, y_train,  
 バッチサイズ = 16、  
 nb_epoch = num_epoch、  
 詳細=1、  
 検証データ = (X_テスト、y_テスト)  
 ）

次のコードを使用して、モデルを使用して新しい画像の新しいクラスを予測できるようになりました。

 # テスト画像の予測 
印刷((モデル.予測(テストイメージ)))  
 print( '画像クラス:' , model.predict_classes(test_image))

以下に示すように、モデルは画像をクラス[0]（自転車）に正しく分類しました。

 [[3.6560327e-01 2.7960737e-06 1.2630007e-03 2.9311934e-01 1.6894026e-02  
 3.0998811e-01 1.3129448e-02]]  
画像クラス: [0]

これは正規化されていない混同行列である

これで、モデルと重みを保存して、実際のアプリケーションに実装できるようになりました。

<<: 機械学習: 密度ベースの外れ値検出アルゴリズム

>>: 200 の優れた機械学習チュートリアルの要約「史上最も完全」

すべてがAI+になる新しい形の人工知能があなたを待っています

ブログ

勝てないなら参加する：ChatGPT が収益に影響を及ぼしていると認めた最初の企業 Chegg は、AI を採用し従業員を 4% 削減することを選択しました。

ブログ

人工知能は航空宇宙に貢献しており、我が国の有人宇宙計画の宇宙ステーションの軌道上建設ミッションは着実に前進している。

ブログ

2024年の最大の落とし穴は？ディープラーニングに基づくエンドツーエンドの自動運転の最新レビュー

ブログ

人工知能は生産と生活の変革を加速させる

ブログ

輸送と物流における AI と自動化のユースケース

ブログ

CLImF アルゴリズムを使用して推奨システムを設計する方法

ブログ

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

すべてがAI+になる新しい形の人工知能があなたを待っています

勝てないなら参加する：ChatGPT が収益に影響を及ぼしていると認めた最初の企業 Chegg は、AI を採用し従業員を 4% 削減することを選択しました。

人工知能は航空宇宙に貢献しており、我が国の有人宇宙計画の宇宙ステーションの軌道上建設ミッションは着実に前進している。

2024年の最大の落とし穴は？ディープラーニングに基づくエンドツーエンドの自動運転の最新レビュー

人工知能は生産と生活の変革を加速させる

輸送と物流における AI と自動化のユースケース

CLImF アルゴリズムを使用して推奨システムを設計する方法

推薦する

AIを活用した自動化が成果を上げる：自動化の破壊的イノベーションにより収益成長が1.5倍に増加

Mojoプログラミング言語がダウンロード可能になりました。AI専用に設計されており、Pythonよりも68,000倍高速であると主張されています。

Nvidia は 5 億ドル相当の巨額注文を獲得しました。インドのデータセンターが H100/GH200 を一気に 16,000 台購入

参入から放棄までのデータマイニング：線形回帰とロジスティック回帰

AIがビデオ業界の変革を推進する方法

「脳制御＋AI」で人は「本能」で運転できるようになる

PyTorch が主要カンファレンスを席巻、TensorFlow が業界から撤退: 機械学習フレームワークは 1 年で変化しました

エッジコンピューティングは産業界でどのような用途に使われていますか?

心臓血管疾患における人工知能の応用

アルトマン氏の地位は再び危険にさらされているのか？！ OpenAIの取締役会が競合他社の参加を呼びかけ、Google Geminiの幹部を引き抜いた

GenAI はクラウドコンピューティングの ROI を向上できますか?

ローコード機械学習ツール

Microsoftの「ChatGPT Family Bucket」がAndroidで利用可能になりました。GPT-4はログインせずに無料でプレイでき、GPT-4V、Turbo、サードパーティのプラグインも組み込まれています。