独占 | R で Keras と TensorFlow を使用してディープラーニングモデルを構築する方法を教えます

[[197801]]

導入：

R と Python のどちらを選択するかは、常に熱く議論されているトピックです。機械学習の世界も言語の好みによって分かれています。しかし、ディープラーニングの人気が高まるにつれ、バランスは徐々に Python に傾いてきました。これは、これまでのところ Python には、R にはないディープラーニングリソースライブラリとフレームワークが多数あるためです。

私が個人的に R から Python に切り替えたのは、R だけを使用して機械学習の世界をさらに深く理解したいと思ったからです。これは R だけではほとんど不可能でした。しかし、それだけです！

R での Keras の実装により、言語選択の争いが再び中心的な位置に戻ってきました。 Python は徐々にディープラーニングモデリングのデフォルト言語となりつつありますが、TensorFlow (CPU と GPU の両方に対応) をバックエンドとする R の Keras フレームワークがリリースされたことで、ディープラーニングの分野でも R と Python の舞台を巡る戦いが再び始まりました。

次に、R で TensorFlow に基づく Keras フレームワークをインストールする方法を確認し、RStudio で従来の MNIST データセットに基づく最初のニューラルネットワークモデルを構築します。

コンテンツ：

TensorFlow をバックエンドとして Keras フレームワークをインストールする
RでKerasを使用してさまざまな種類のモデルを構築できます
R の MLP を使用して MNIST 手書き数字を分類する
MNIST の結果を Python の同等のコードと比較する
結論

1. TensorFlowをバックエンドとしてKerasフレームワークをインストールする

RStudio に Keras をインストールする手順は非常に簡単です。以下の手順に従うだけで、R で最初のニューラルネットワークモデルを構築できるようになります。

 install.packages( "devtools" ) 
 
 devtools::install_github( "rstudio/keras" )

上記の手順により、Github リポジトリから Keras がダウンロードされます。次に、keras を R にロードし、TensorFlow をインストールします。

ライブラリ(keras)

デフォルトでは、RStudio は TensorFlow の CPU バージョンをロードします。 TensorFlow の CPU バージョンが正常にロードされない場合は、次のコマンドを使用してダウンロードします。

インストール_tensorflow()

単一ユーザーまたはデスクトップシステムに GPU サポート付きの TensorFlow をインストールするには、次の手順に従います。

 install_tensorflow(gpu= TRUE )を実行します。

マルチユーザーインストールについては、このガイドを参照してください: https://tensorflow.rstudio.com/installation_gpu.html。

現在、RStudio には keras と TensorFlow の両方がインストールされています。まず、R で最初のニューラルネットワークを構築し、MNIST データセットを処理してみましょう。

2. Rでkerasを使用して構築できるさまざまな種類のモデル

以下は、RでKerasを使用して構築できるモデルのリストです。

多層パーセプトロン
畳み込みニューラルネットワーク
リカレントニューラルネットワーク
スキップグラムモデル
事前トレーニング済みモデル（VGG16、RESNETなど）を使用する
事前学習済みモデルの微調整

まず、隠し層が 1 つだけのシンプルな MLP モデルを構築して、手書きの数字を分類してみましょう。

3. R の MLP を使用して MNIST 手書き数字を分類する

#kerasライブラリの読み込み
 
ライブラリ(keras) 
 
 #keras に組み込まれている mnist データセットをロードする
 
データ<-dataset_mnist() 
 
 #トレーニングファイルとテストファイルを分離する
 
 train_x<-データ$train$x 
 
 train_y<-データ$train$y 
 
 test_x<-データ$テスト$x 
 
 test_y<-データ$test$y 
 
 rm(データ) 
 
 # 2D配列を1D配列に変換してMLPに入力し、行列を正規化する
 
 train_x <- 配列(train_x, dim = c(dim(train_x)[1], prod(dim(train_x)[-1]))) / 255 
 
 test_x <- 配列(test_x, dim = c(dim(test_x)[1], prod(dim(test_x)[-1]))) / 255 
 
 #keras の組み込み関数を使用して、ターゲット変数を 1 回だけホットエンコードされたベクトルに変換します  
 
 train_y<-to_categorical(train_y,10) 
 
 test_y<-to_categorical(test_y,10) 
 
 #Keras シーケンシャル モデルの定義
 
モデル <- keras_model_sequential() 
 
 # 入力層 1 つ [784 ニューロン]、ドロップアウト率 0.4の隠れ層 1 つ [784 ニューロン] 、出力層1 つ[10 ニューロン]でモデルを定義
 
 #つまり0から9までの数字の数
 
モデル %>% 
 
レイヤー密度(単位 = 784、入力形状 = 784) %>% 
 
レイヤードロップアウト(率=0.4)%>% 
 
レイヤーアクティベーション(アクティベーション = 'relu' ) %>% 
 
レイヤー密度(単位 = 10) %>% 
 
レイヤーアクティベーション(アクティベーション = 'softmax' ) 
 
 #メトリック= 精度、オプティマイザーをAdamとして定義したモデルをコンパイルします。 
 
モデル %>% コンパイル( 
 
損失 = 'カテゴリクロスエントロピー' 、 
 
オプティマイザー = 'adam' 、 
 
メトリック = c( '精度' ) 
 
 ） 
 
 #トレーニングデータセットにモデルを適合させる
 
モデル %>% fit(train_x, train_y, エポック = 100, batch_size = 128) 
 
 #クロスバリデーションデータセットでのモデルの評価
 
 loss_and_metrics <- モデル %>% 評価(test_x、test_y、batch_size = 128)

上記のコードは、99.14% のトレーニング精度と 96.89% の検証精度を達成しました。このコードを i5 プロセッサで実行すると、トレーニング実行が完了するまでに 13.5 秒かかりますが、TITANx GPU では検証精度は 98.44% に達し、実行あたりのトレーニング時間は平均 2 秒です。

4. keras を使用して MLP モデルを構築する — R と Python

より良い比較のために、私は Python を使用して上記の MINIST 分類問題を解きました。 R はプロセス (conda インスタンス) を作成し、その中で keras を実行するため、結果に違いはありません。ただし、次の同等の Python コードを試すことはできます。

 #MLPモデルに必要なライブラリをインポートする
 
 kerasをインポートする
 
 keras.modelsからSequentialをインポートする
 
 numpyをnpとしてインポートする
 
 #kerasからMNISTデータセットを読み込む
 
 keras.datasetsからmnistをインポートする
 
 (x_train, y_train)、(x_test, y_test) = mnist.load_data() 
 
 #x_train、y_train、x_test 、 y_testをMLP入力に適合するように再形成し、  出力寸法
 
 x_train = np.reshape(x_train,(x_train.shape[0],-1))/255 
 
 x_test = np.reshape(x_test,(x_test.shape[0],-1))/255 
 
 pandasをpdとしてインポートする
 
 y_train = pd.get_dummies(y_train) 
 
 y_test = pd.get_dummies(y_test) 
 
 #トレーニングとテストのターゲット変数にワンホットエンコーディングを実行する
 
 y_train = np.array(y_train) 
 
 y_test = np.array(y_test) 
 
 #入力層 1 つ [784 ニューロン]、ドロップアウト率 0.4の隠れ層 1 つ [784 ニューロン] 、出力層1 つ[10 ニューロン]を持つモデルの定義
 
モデル=シーケンシャル() 
 
 keras.layersからDenseをインポート
 
モデルを追加します(Dense(784, input_dim=784, activation= 'relu' )) 
 
 keras.layers.core.Dropout(レート=0.4) 
 
モデルを追加します(Dense(10,input_dim=784,activation= 'softmax' )) 
 
 # Adam オプティマイザーと精度を基準としてモデルをコンパイルする
 
 model.compile(損失= 'categorical_crossentropy' 、オプティマイザー= "adam" 、メトリック=[ 'accuracy' ]) 
 
 # モデルの適合と検証の実行
 
モデルを適合(x_train、y_train、エポック=50、バッチサイズ=128、検証データ=(x_test、y_test))

上記のモデルは、同じ GPU 上で 98.42% の検証精度を達成しました。したがって、最初に推測したとおり、結果は同じです。

V. 結論

これが R で構築された最初のディープラーニングモデルである場合は、プロセスを楽しんでいただければ幸いです。非常にシンプルなコードを使用して、手書きの値を 98% の精度で分類できます。これにより、機械学習の分野を探求する十分な動機が得られるはずです。

Python で keras ディープラーニングフレームワークを使用したことがある場合は、R の keras フレームワークの構文と構造が Python のものと非常に似ていることがわかります。実際、R の keras パッケージは conda 環境を作成し、その環境で keras を実行するために必要なものをすべてインストールします。しかし、私がさらに興奮するのは、データサイエンティストが R を使用して現実の状況に合わせたディープラーニングモデルを構築しているのを見ることです。諺にあるように、競争は決して終わらない。

<<: ひどい、顔認識の練習のための40行のコード

>>: 人工知能やビッグデータ製品の開発において、特に注意すべき点は何でしょうか?