新しいプロジェクトを始めるたびに、私はディープラーニング マシンを何度も何度も作成していることに気づきます。
まず Anaconda をインストールし、Pytorch と Tensorflow が互いに干渉しないように、それぞれに異なる環境を作成します。そして、途中で必ず失敗してしまい、最初からやり直さなければならなくなります。これは何度も起こることがよくあります。 これは時間の大きな無駄であるだけでなく、イライラさせられます。 Stack Overflow のすべてのスレッドを見ると、いったい何が間違っていたのかと疑問に思うことがよくあります。 では、これをより効率的に行う方法はあるのでしょうか? このブログでは、より重要なことに集中できるように、最小限の労力で EC2 上にディープラーニング サーバーをセットアップしてみたいと思います。 このブログは、明確に 2 つの部分から構成されています。
心配しないでください。思ったほど難しくはありません。手順に従って「次へ」をクリックしてください。 Amazon EC2 マシンのセットアップ AWS アカウントをお持ちで、AWS コンソールにアクセスできることを前提としています。そうでない場合は、Amazon AWS アカウントにサインアップする必要があります。
EC2 ダッシュボードでは、インスタンスの作成から始めることができます。 Amazon は、ディープラーニング ソフトウェアがプリインストールされたコミュニティ AMI (Amazon マシンイメージ) を提供しています。これらの AMI にアクセスするには、コミュニティ AMI を調べて、検索タブで「Ubuntu Deep Learning」を検索する必要があります。他の Linux フレーバーを選択することもできますが、私のディープラーニングのニーズには Ubuntu が最も役立つことがわかりました。現在のセットアップでは、Deep Learning AMI(Ubuntu 18.04)バージョン27.0を使用します。 AMI を選択したら、インスタンス タイプを選択できます。ここで、システムに必要な CPU、メモリ、GPU の数を指定できます。 Amazon では、お客様の個々のニーズに応じて選択できるオプションを多数提供しています。 「フィルター条件」フィルターを使用して GPU インスタンスをフィルターできます。 このチュートリアルでは、2,496 個の並列処理コアと 12 GiB の GPU メモリを備えた NVIDIA K80 GPU を提供する p2.xlarge インスタンスを使用しました。さまざまなインスタンス タイプについて詳しくは、以下のリンクにあるドキュメントを参照して価格を確認してください。 ドキュメントを見る: https://aws.amazon.com/ec2/instance-types/ 価格: https://aws.amazon.com/emr/pricing/ 手順 4 でマシンに接続されているストレージを変更できます。事前にストレージを追加しなくても、後から追加できるので問題ありません。ほとんどのディープラーニングのニーズには十分なストレージ容量が必要なため、ストレージ容量を 90 GB から 500 GB に変更しました。 これで完了です。インスタンス設定の最終確認画面に到達したら、インスタンスを起動できます。 「起動」をクリックすると、この画面が表示されます。 「キーペア名」に任意のキー名を入力し、「キーペアのダウンロード」をクリックするだけです。指定した名前でキーがコンピューターにダウンロードされます。私の場合は「aws_key.pem」として保存されました。完了したら、「インスタンスの起動」をクリックしてインスタンスを起動できます。 このキー ペアはインスタンスにログインするときに必要になるため、安全に保管してください。 次のページで「インスタンスの表示」をクリックすると、インスタンスを表示できます。インスタンスは次のようになります。 インスタンスに接続するには、ローカル コンピューターでターミナル ウィンドウを開き、キー ペア ファイルを保存したフォルダーを参照して、いくつかの権限を変更します。
これが完了すると、SSH 経由でインスタンスに接続できるようになります。 SSH コマンドの形式は次のとおりです。
私の場合のコマンドは次の通りです:
また、インスタンスをシャットダウンするとパブリック DNS が変更される可能性があることに注意してください。 マシンの準備が完了し、準備完了です。このユニットには、必要となる可能性のあるさまざまなライブラリを備えたさまざまな環境が含まれています。このマシンには、MXNet、Tensorflow、Pytorch と、さまざまなバージョンの Python が搭載されています。最も優れている点は、これらすべての機能がプリインストールされているため、箱から出してすぐに使用できることです。 Jupyter Notebookの設定 ただし、コンピューターを完全に使用するために、使用する必要があるものがいくつかあります。その1つがJupyter Notebookです。コンピューターに Jupyter Notebook をセットアップするには、TMUX とトンネリングを使用することをお勧めします。 Jupyter Notebook をセットアップする手順を見ていきましょう。 TMUX で Jupyter Notebook を実行する まず、TMUX を使用してインスタンス上で Jupyter Notebook を実行します。これを主に使用するのは、端末接続が失われた場合でもラップトップが機能し続けるようにするためです。 これを行うには、次のコマンドを使用して新しい TMUX セッションを作成する必要があります。
完了すると、下部に緑色の枠線が付いた新しい画面が表示されます。 jupyter notebook コマンドを使用して、このコンピューターで Jupyter Notebook を起動できます。次のような画面が表示されます。 ログイン URL をコピーしておくと、後で Jupyter Notebook にログインするときにトークンを取得できるようになります。私の場合は次のとおりでした:
次のステップは、ssh シェルを終了してもバックグラウンドで実行を継続できるように、TMUX セッションをデタッチすることです。これを行うには、Ctrl + B を押してから D を押します (D を押すときに Ctrl キーを押したままにしないでください)。すると、tmux セッションから切断されたことを示すメッセージが表示された初期画面に戻ります。 必要に応じて、次の方法でセッションに再接続できます。
ローカルブラウザでノートブックにアクセスするためのSSHトンネル 2 番目のステップは、Amazon インスタンスに SSH 接続して、ローカル ブラウザーで Jupyter ノートブックを取得することです。ご覧のとおり、Jupyter ノートブックは実際にはクラウド インスタンスのローカル ホスト上で実行されています。どうやってアクセスするのでしょうか? SSH トンネリングを使用します。心配しないでください、簡単です。ローカルマシンのターミナルウィンドウで次のコマンドを使用します。
この場合、私は以下を使用しました:
つまり、ローカルマシンのブラウザで localhost:8001 を開くと、Jupyter Notebook を使用できるということです。もちろんできますよ。これで、前の手順のいずれかで保存したトークンを入力するだけで、ノートブックにアクセスできるようになります。私の場合、トークンは5ccd01f60971d9fc97fd79f64a5bb4ce79f4d96823ab7872です
トークンを使用してログインするだけです。 これで、必要なさまざまな環境を選択して、新しいプロジェクトを選択できるようになりました。 Tensorflow または PyTorch、あるいはその両方から始めることができます。このノートブックはあなたを失望させません。 トラブルシューティング コンピュータを再起動した後、NVIDIA グラフィック カードに問題が発生する場合があります。具体的には、私の場合、nvidia-smi コマンドが機能しなくなりました。この問題が発生した場合の解決策は、NVIDIA Web サイトからグラフィック ドライバーをダウンロードすることです。
上記は私が選択した特定の AMI の設定です。 「検索」をクリックすると、次のページが表示されます。 右クリックしてリンク アドレスをコピーするだけで、ダウンロード リンクをコピーできます。そして、コンピューター上で次のコマンドを実行します。リンクアドレスとファイル名を変更する必要がある場合があります。
インスタンスを停止する それでおしまい。ディープラーニングマシンが稼働しており、自由に使用できます。作業を停止するときは必ずインスタンスを停止し、インスタンスで作業していないときに Amazon に料金を支払わないように注意してください。これは、インスタンスを右クリックしてインスタンス ページで実行できます。このマシンに再度ログインする必要がある場合、パブリック DNS (IPv4) アドレスが変更されている可能性があるため、インスタンス ページからパブリック DNS (IPv4) アドレスを再度取得する必要がある場合があります。 結論は ディープラーニング環境の構築は非常に面倒だといつも思っていました。 このブログでは、Deep Learning Community AMI、TMUX、Jupyter Notebook のトンネリングを使用して、EC2 上に新しいディープラーニング サーバーを最短時間でセットアップしました。サーバーには、作業に必要なすべてのディープラーニング ライブラリがプリインストールされており、すぐに使用できます。 では、何を待っていますか? 独自のサーバーでディープラーニングを使い始めましょう。 |
<<: Microsoft Flight SimulatorはAIを使って15億の建物を復元、宮殿がオフィスビルに変わる際にバグが発生
>>: 烏鎮百度脳オープンデーが開催、EasyDL業界インテリジェンスイノベーションコンペティションを開始
GPT-4 が怠惰になる問題の解決に新たな進歩があります。今朝、ウルトラマンが、新年には GPT-4...
この号では、Kuaishouがコミュニティサイエンスラインで独自開発した論文「TWIN:Kuaish...
現在、ナビゲーションや通信などの技術が継続的に進歩し、ドローンの開発はより成熟し、業界の規模も拡大し...
ビッグデータの出現、クラウド コンピューティング テクノロジーの成熟度の向上、ディープラーニング ア...
企業がクラウド管理について考えるとき、主にパフォーマンスの監視、セキュリティの維持、コンプライアンス...
AI動画モデルSoraが人気を博して以降、MetaやGoogleなどの大手企業もOpenAIに追いつ...
過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニン...
市場には優れた AI ソフトウェア ツールが数多く存在しますが、プロジェクトを実装する際には強力なチ...
[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...
[[336522]]ビッグデータダイジェスト制作編集者: ルナ教科書で習ったことと実際の業務に乖離...
生産における安全は社会発展の永遠のテーマであり、すべての仕事の本質です。工業製造企業の場合、事業継続...
モノのインターネットは、私たちの生活様式を変えるのと同様に、学習方法も変えています。 AI の専門家...
今日、タイムクリスタルは再び新しいスターを迎え、Sceinceサブマガジンに登場しました。 タイムク...
【51CTO.com クイック翻訳】調査機関Forrester Researchが最近発表した調査レ...