TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

[[405128]]

このチュートリアルでは、TensorFlow (Keras API) を使用して、細胞の画像をマラリア感染の有無としてラベル付けするバイナリ分類タスク用のディープラーニングモデルを実装します。

データセットのソース: https://www.kaggle.com/iarunava/cell-images-for-detecting-malaria

データセットには2つのフォルダが含まれています

感染: 13780 枚の画像
感染なし: 13780 枚の画像

合計27558枚の画像。

このデータセットは、NIH の公式ウェブサイトから取得されています: https://ceb.nlm.nih.gov/repositories/malaria-datasets/

環境: Kaggle、Tianchi Lab、Gogole Colab のどれでも OK です。

関連モジュールのインポート

cv2をインポート
テンソルフローをtfとしてインポートする
tensorflow.keras.modelsからSequential をインポートします
tensorflow.keras.layersからDense、Conv2D、MaxPool2D、Flatten、Activation をインポートします。
 sklearn.model_selectionからtrain_test_split をインポートします
numpyをnpとしてインポートする
matplotlib.pyplot をpltとしてインポートします。
インポートグロブ
インポートOS

形状の異なる画像データの場合、画像の前処理を実行するために OpenCV が必要です。

画像を numpy 配列 (デジタル形式) の形式でグレースケールに変換し、(70x70) の形状にサイズを変更します。

 img_dir= "../input/マラリア検出用セルイメージ/cell_images"    
画像サイズ=70
 def load_img_data(パス):
    # データをシャッフルする
    image_files = glob.glob(os.path.join (path, "Parasitized/*.png" ) ) + \
                  glob.glob(os.path.join (path, "Uninfected/*.png" ) )
    x, y = [], []
 image_files内のimage_fileの場合:
        #感染していないタグには0 、感染しているタグには1 という名前を付けます
        「感染していない」場合はラベル = 0   image_file内、それ以外は1
        #画像をグレースケールで読み込む
        img_arr = cv2.imread(画像ファイル、cv2.IMREAD_GRAYSCALE)
        # 画像のサイズを(70x70)に変更します
        img_resized = cv2.resize(img_arr, (img_size, img_size))
        X.append(画像のサイズを変更)
        y.append(ラベル)
 X, yを返す
X, y = load_img_data(img_dir)

Xの形を確認してください。

印刷(X.shape)

X の形状は (27558, 70, 70, 1) です。ここで、27558 は画像データを表し、70*70 はピクセル単位の画像の長さと幅を表します。

さらに、ネットワークの収束を早めるには、データを正規化する必要があります。 sklearn にはいくつかのスケーリング方法があります。たとえば、次のとおりです。

ここで 255 で割るのは、ピクセルが持つことができる最大値が 255 であるためで、スケーリングが適用されると、ピクセルの範囲は 0 から 1 の間になります。

 X, y = load_img_data(img_dir)
 # (n_samples, 70, 70, 1)に再形成します ( NN に適合させるため)
 X = np.array(X).reshape(-1, 画像サイズ, 画像サイズ, 1)
 #ピクセルを[0, 255]から[0, 1]にスケーリングすると、ニューラルネットワークのトレーニングが速くなります
バツ = バツ / 255 
 
 # データセットをシャッフルして分割する
X_train、X_test、y_train、y_test = train_test_split(X、y、test_size=0.1、stratify=y)
 print( "合計トレーニングサンプル数: " , X_train.shape)
 print( "検証サンプルの合計数:" , X_test.shape[0])

sklearn の train_test_split() メソッドを使用して、データセットをトレーニングセットとテストセットに分割します。全体のデータの 10% を使用して後で検証します。

構築されたモデルでは、3 つの畳み込み層を追加し、次に層で構成される完全に接続された密な層である Flatten を追加します。

モデル = シーケンシャル()
モデル。 (Conv2D(64, (3, 3), input_shape=X_train.shape[1:])を追加します。
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Conv2D(64, (3, 3)))
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Conv2D(64, (3, 3)))
 model.add(アクティベーション( "relu" ))
モデルを追加します(MaxPool2D(pool_size=(2, 2))) 
 
モデルを追加します(Flatten()) 
 
モデル.add (密(64))
 model.add(アクティベーション( "relu" )) 
 
モデル.add (密(64))
 model.add(アクティベーション( "relu" )) 
 
モデル.add (密(1))
 model.add(アクティベーション( "シグモイド" )) 
 
 model.compile(損失= "binary_crossentropy" 、オプティマイザー= "adam" 、メトリック=[ "accuracy" ])
印刷(モデル.要約())

出力はバイナリ（感染しているか感染していないか）なので、出力層の活性化関数としてシグモイド関数を使用します。

 # 10エポック、64バッチサイズでモデルをトレーニングします 
 model.fit(X_train、np.array(y_train)、バッチサイズ=64、エポック=10、検証分割=0.2)

トレーニングデータセットとその検証分割では 94% の精度が達成されました。

次にevaluate()を使用してテストデータセットでモデルを評価します。

損失、精度 = model.evaluate(X_test, np.array(y_test), verbose=0)
 print(f "{len(X_test)} 枚の画像でテストした結果は次のとおりです\n 精度: {accuracy} | 損失: {loss}" )

出力は次のようになります

2756枚の画像でテストした結果は
精度: 0.9404934644699097 | 損失: 0.1666732281446457

このモデルはテストデータでも94%の精度で正常に動作した。

最後に、モデルを保存して、このすべてを終了します。

モデルを保存( "model.h5" )

【編集者のおすすめ】

Hongmengさん、たとえそれが単なるAndroidシェルだとしても、何が問題なのですか？
Kubernetes が Docker を放棄するのはなぜですか?
「PPT システム」から現実へ: HarmonyOS、あなたは本当にそれに惹かれますか?
これら 6 つの Python IDE とコードエディターを使用したことがありますか?
Kubernetes の実践: 正常な終了

<<: マッピングドローンは多くの「ファン」を獲得しており、これらの利点は刺激的です

>>: AIイノベーションを奨励する100万ドルの賞金：2021 DIGIXグローバルキャンパスAIアルゴリズムエリートコンペティションが開幕

ブログ

レッドハットのCEOがAIの取り組みとソースコードの混乱について語る

ブログ

「中東のシリコンバレー」として知られるイスラエルはスーパーチップを開発している

ブログ

李開復：人工知能に取って代わるのが最も難しい10の仕事

ブログ

高度な自動運転システムの開発において解決すべき課題についてお話しします

ブログ

コードスイッチングに7億5000万ドル？ Facebook TransCoder AI は 1 つで十分です。

ブログ

PythonでChatGPT APIを使用してリアルタイムデータを処理する方法

ブログ

Baidu は革命を起こしました!

ブログ

TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

レッドハットのCEOがAIの取り組みとソースコードの混乱について語る

「中東のシリコンバレー」として知られるイスラエルはスーパーチップを開発している

李開復：人工知能に取って代わるのが最も難しい10の仕事

高度な自動運転システムの開発において解決すべき課題についてお話しします

コードスイッチングに7億5000万ドル？ Facebook TransCoder AI は 1 つで十分です。

PythonでChatGPT APIを使用してリアルタイムデータを処理する方法

Baidu は革命を起こしました!

推薦する

機械学習にはどのような数学的基礎が必要ですか?

人工知能の未来は人間・機械・環境のシステム知能である

マイクロソフト、2023年までに8つの人工知能プロジェクトをオープンソース化へ

機械学習における特徴選択の3つの代替手法

MITのロボット犬がまた進化しました。砂利や氷の上でも滑らずに走れます。今回は本当に犬と同じくらい安定しています

Javaソートアルゴリズムの概要（I）：挿入ソート

AIによる高齢者介護についてどう思いますか？

データセンターの物理的セキュリティに AI を活用する方法

AIキーボード戦士が登場: DeepMindがエージェントのトレーニングを開始、コンピューターを人間のように「操作」

マイクロソフト、クラウド移行のための企業向けビジネス管理ツールを提供するAIMプログラムを開始

Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ？」

プログラマーはAIアルゴリズムを使用して3,000匹の新しいポケモンを生成した