5分で強力で使いやすいディープラーニング環境を構築

ディープラーニングプロジェクトに適した環境を構築するのは簡単な作業ではありません。処理すべきことはたくさんあります。ライブラリは特定のバージョンと一致する必要があり、環境全体を他のマシンに複製でき、すべてがマシン内のすべてのドライバーと通信できる必要があります。つまり、NVIDIA GPU 用の特定のドライバーをインストールする必要があり、CUDA ライブラリはドライバーおよび使用するフレームワークと互換性がある必要があります。

[[385488]]

コンテナはソフトウェア開発の世界に革命をもたらしましたが、今ではデータサイエンティストがより堅牢な環境を構築するのにも役立ちます。

一つ確かなことは、データサイエンスはソフトウェア開発の世界から学ぶべきことがあるということです。

NVIDIA NGC は、AI を本番環境でトレーニングおよび展開するための GPU に最適化されたフレームワーク、事前トレーニング済みモデル、ツールキットを提供するソフトウェアハブです。これは、モデルのトレーニングに必要なすべてのツールを備えたコンテナレジストリです。caffee2、Pytorch、Tensorflow、Keras、Julia など、どのツールを使用するかは関係ありません。

NGC カタログには、生産に使用できるコンテナが多数用意されています。使用するコンテナを選択するだけです。

Nvidia NGC はコンテナレジストリであるだけでなく、組織がモデルを本番環境に導入するのに役立つ多くの組み込み機能を備えています。

ゼロから始める

まず、GPU を搭載した Linux マシンから始めましょう (GPU は必須ではありませんが、モデルをトレーニングする場合は強くお勧めします)。この機能を Ubuntu 20.04 LTS と 18.04 LTS でテストしましたが、他の Linux ディストリビューションにも簡単に適応できます。

私たちは何をする必要がありますか?

手順は簡単で、NVIDIA ドライバーと Docker をインストールするだけです。次に、必要な Docker イメージをダウンロードして作業を開始します。

ステップ1: Ubuntu 20.04にNVIDIAドライバーをインストールする

注意: 別の Ubuntu バージョンを使用している場合は、それに応じてスクリプトを変更してください。また、セキュアブートが有効になっている場合、この方法は機能しません。

 sudo apt install linux-headers-$(uname -r)
 curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
 sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
 sudo apt- key adv- fetch -keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub を実行します。
 sudo add -apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"  
 sudo aptアップデート 
 sudo apt -y cudaをインストールします

nvidia-smi コマンドを使用してインストールを確認します。次のような画面が表示されます。

ステップ2: Ubuntu 20.04にDockerをインストールする

#!/bin/sh
 #リポジトリを設定する
sudo apt-getアップデート 
 sudo apt-get install -y \
 apt-transport-https \
 ca証明書\
カール\
 gnupgエージェント\
ソフトウェアプロパティ共通
# Dockerの公式GPGキーを追加します:
 curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-キー 追加-
 #安定リポジトリをセットアップする
sudo -apt-リポジトリを追加します\
 "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
 $(lsb_release -cs) \
安定した"
 sudo apt-getアップデート 
 sudo apt-get install -y docker-ce docker-ce-cli containerd.io
 # ubuntuをユーザー名に置き換えてください
sudo usermod -aG docker ubuntu

注意: sudo 権限なしで docker コマンドを使用するには、ログアウトして再度ログインする必要があります。

ステップ3: DockerがNVIDIAドライバーと通信できるようにする

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
 sudo apt-キー 追加-
 curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu16.04/amd64/nvidia-docker.list | \
 sudo tee /etc/apt/sources.list.d/nvidia-docker.list
 sudo aptアップデート 
 sudo apt-get install -y docker nvidia-container-toolkit

ここで、Docker が NVIDIA ドライバーと通信できるかどうかをテストします。これを行うには、次のコマンドを実行するだけで、手順 1 と同様の結果が表示されます。

 sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

注: さまざまなクラウドホスティングプロバイダーを試しましたが、OS、VM タイプ、GPU によっては、この時点で再起動が必要になる場合があります。したがって、エラーが発生した場合は、sudo reboot を試して、上記のコマンドを再度実行してください。すべてが正常であれば、nvidia-smi の結果が表示されます。

ステップ 4: イメージを取得して実行してみましょう。

 #NGC Tensorflow 2 イメージをダウンロード
docker pull nvcr.io/nvidia/tensorflow:20.12-tf2-py3
 #コンテナ内の/container_dirにマウントされる local_dir フォルダを作成します
mkdir /home/ubuntu/local_dir
 docker run --gpus all --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 -it --rm -v /home/ubuntu/local_dir:/container_dir nvcr.io/nvidia/tensorflow:20.10-tf2-py3

注: オペレーティングシステムが Docker コンテナーに割り当てられたリソースを制限するのを回避するには、フラグ - shm-size=1g - ulimit memlock=-1 - ulimit stack=67108864 が必要です。

コンテナ内に入りましたので、すべてが動作しているかどうか確認してみましょう。

画像からわかるように、GPU は利用可能であり、TensorFlow はそれを使用できます。

最後に: docker環境にアクセスする

マシンから切断すると、コンテナ内にいないことに気付くでしょう。

再度接続するには、docker ps を使用して実行中のコンテナの container_ id を見つけて、次の操作を行う必要があります。

 docker exec -it <コンテナID> /bin/bash

最終まとめ

このチュートリアルでは、NVIDIA NGC のイメージを使用して、すべてのライブラリとツールを備えた本番環境対応環境を簡単に作成できることを学びました。

NVIDIA ドライバーおよび必要なフレームワークと通信するように Docker を構成するのがいかに簡単かを確認しました。

これをすべて 5 分で完了しました。

<<: 手紙を開かずに読むことはできますか？ MITのX線技術がネイチャー誌に掲載される

>>: 女性が30時間以上浴室に閉じ込められた。この危機的状況でAIは彼女を危険から救うことができるのか？

ブログ

ビッグデータ、クラウドコンピューティング、人工知能が統合され、セキュリティ分野に応用されている

5分で強力で使いやすいディープラーニング環境を構築

ゼロから始める

私たちは何をする必要がありますか?

最終まとめ

ビッグデータ、クラウドコンピューティング、人工知能が統合され、セキュリティ分野に応用されている

Ocado が機械学習を活用して食品廃棄を減らし、飢餓と闘う方法

5G+AIは通信とコンピューティングを統合する

GPT-4 は上司とプログラマーに取って代わります。この GitHub プロジェクトは最も検索されています。著者: AI に反復処理を学習させる

今からAIについて学ぶのは遅すぎますか？

シナリオイノベーションがスマート発電所を強化 | Ruijie Networks が 2021 年スマート発電所フォーラムに登場

Google がオールラウンドな音楽転写 AI を発表: 曲を一度聴くだけでピアノとバイオリンの楽譜がすべて手に入る

ドローンのバッテリー寿命の悩みをどう解決するか？答えは3つの主要な方向から得られる

推薦する

ディープラーニング（CNN RNN Attention）を使用して大規模なテキスト分類問題を解決する - 概要と実践

マイクロソフトがOpenAIの理事に就任、アルトマン氏が初めてQ*に回答：残念なリーク

日本生命保険は6年間にわたりRPAを導入し、1万人の従業員の2,000万時間以上の工数を節約した。

運輸・物流におけるAIと自動化のユースケース

DeepMind、囲碁、チェス、ポーカーをプレイするための汎用学習アルゴリズムSoGを発表

独自の大規模言語モデルを展開する 5 つの方法

人工知能はソフトウェア開発業界にどのような影響を与えるでしょうか? AIはクリエイティブな労働者に取って代わることはできない

ゲームにおける経路探索アルゴリズムの深い理解

あなたの将来の子供はどんな風になるでしょうか？このAIミニプログラムは海外のDouyinアプリで大人気となり、数え切れないほどのネットユーザーが感動して涙しました！

ヨシュア・ベンジオ：私は国家間のAI競争を見たくないし、現在のAIの考え方を心配している。

2020年のロボットとドローンに関する7つの予測

GPT-4Vを試した後、マイクロソフトは166ページに及ぶ評価レポートを作成した。業界関係者：上級ユーザー必読

顔認識に関する国家基準では、顔のスキャンは必須ではなく、14歳未満の人の顔認識は許可されないと規定されています。

量子コンピューティングがサプライチェーン管理を改善する方法