PyTorch を軽量化します。このディープラーニングフレームワークは価値があります。 GitHub 6.6k スター

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

PyTorch は、そのシンプルさと使いやすさから、 AI 研究者の間で常に人気があります。

ただし、タスクが複雑になると、一連のエラーが発生する可能性があり、時間がかかります。

こうして、このような「フレンドリーな」PyTorch Lightning が誕生しました。

GitHub で直接 6.6k 個のスターを獲得しました。

まず、研究コードとエンジニアリングコードを分離し、PyTorch コードを構造化して、データ操作プロセスをより直感的に表示します。

こうすることで、理解しやすくなり、エラーも起こりにくくなります。元々長かったコードが突然軽量になり、AI 研究者にとって非常に使いやすくなります。

では早速、「PyTorch」の軽量バージョンを見てみましょう。

ライトニングについて

Lightning は、DL/ML コードを研究コード、エンジニアリングコード、非必須コードの 3 つのタイプに分類します。

Lightning では、コードごとに異なる処理方法があります。

ここでの研究コードは、GAN、VAE などの特定のシステムとそのトレーニング方法を参照します。このタイプのコードは、LightningModule によって直接抽象化されます。

MNIST 生成を例に挙げてみましょう。

 l1 = nn.Linear(...)
 l2 = nn.Linear(...)
デコーダー = デコーダー()
 x1 = l1(x)
 x2 = l2(x2)
出力 = デコーダー(特徴, x)
損失 = perceptual_loss(x1, x2, x) + CE(出力, x)

エンジニアリングコードとは、早期停止、GPU による割り当て、16 ビット精度など、このシステムのトレーニングに関連するすべてのコードです。

これらのコードはほとんどのプロジェクトで同じであることがわかっているので、ここでは Trainer によって直接抽象化されます。

モデル.cuda( 0 )
 x = x.cuda( 0 )
分散 = 分散並列(モデル)
 gpu_zeroの場合:
ダウンロードデータ()
 dist.barrier()

残りは、研究プロジェクトには役立つものの、研究プロジェクトとは関係のない、おそらく勾配をチェックしたり、テンソルボードにログを記録したりする、必須ではないコードです。このコードはコールバックによって抽象化されます。

 # ログサンプル
z = Q.rsample()
生成された = デコーダー(z)
 self.experiment.log( 'images' , 生成)

さらに、PyTorch コードを 1 行も変更せずに CPU、GPU、複数の GPU、または TPU でモデルをトレーニングできる、16 ビットの精度でトレーニングできる、Tensorboard を使用して 5 つの方法で記録できるなどの追加機能もあります。

これは明らかではないかもしれないので、PyTorch と PyTorch Lightning の違いを直感的に比較してみましょう。

PyTorch と PyTorch Lightning の比較

写真を見てください。

モデル、データ、損失関数、最適化という 4 つの主要部分から始めて、単純な MNIST 分類器を構築する例を見てみましょう。

モデル

最初のステップはモデルを構築することです。今回は、28×28 の画像を入力として受け取り、0～9 の数字の 10 カテゴリの確率分布に変換する 3 層の全接続ニューラルネットワークを設計します。

コードは両方ともまったく同じです。つまり、PyTorchモデルをPyTorch Lightningに変換するには、nn.Moduleをpl.LightningModuleに置き換えるだけでよいのです。

おそらくこの時点では、まだ Lightning の魔法は見えていないでしょう。心配しないで、見続けましょう。

データ

次はデータ準備の部分です。Lightning がこの処理を実行する点を除けば、コードはまったく同じです。

PyTorchコードを4つの関数、prepare_data、train_dataloader、val_dataloader、test_dataloaderに整理します。

準備データ

この機能により、複数の GPU を使用するときに、複数のデータセットをダウンロードしたり、データに対して複数の操作を実行したりすることがなくなります。この方法により、すべてのコードで、重要なセクションが 1 つの GPU からのみ呼び出されることが保証されます。

これにより、PyTorch が常にデータを繰り返し処理するという問題が解決され、速度が向上します。

トレーニングデータローダー、val_dataloader、テストデータローダー

それぞれが対応するデータセグメンテーションを返す役割を担っているため、データがどのように操作されるかを明確に把握できます。これまでのチュートリアルでは、データがどのように操作されるかはほとんどわかりませんでした。

さらに、Lightning では、テストや検証に複数のデータローダーを使用できます。

最適化

次は最適化です。

違いは、Lightning が Configuration Optimizer の機能に編成されていることです。複数のオプティマイザーを使用する場合は、両方を返すことができます。

損失関数

n 項目の分類では、クロスエントロピー損失を計算します。両方のコードはまったく同じです。

さらに、より直感的な検証とトレーニングのループもあります。

PyTorch では、for ループを自分で構築する必要があることはわかっています。単純なプロジェクトでは問題ないかもしれませんが、より複雑で高度なプロジェクトに遭遇すると、失敗しやすくなります。

Lightning の抽象コードは、Lightning の強力なトレーナーチームによって管理されます。

PyTorch Lightning インストールチュートリアル

これを読んで、あなたもインストールして試してみませんか？

PyTorch Lightning はインストールが非常に簡単です。

コードは次のとおりです。

 conda をアクティブ化 my_env
 pip pytorch-lightning をインストールします

または、conda 環境がなくても pip を使用できます。

コードは次のとおりです。

 pip pytorch-lightning をインストールします

作者も大物

PyTorch Lightning の作者である William Falcon 氏は、現在ニューヨーク大学で人工知能の博士号を取得しており、Forbes の AI に関する寄稿ライターでもあります。

2018 年にコロンビア大学を卒業し、コンピューターサイエンスと統計学の学位を取得しました。学部在学中は数学も副専攻していました。

彼は現在、博士号取得のためにGoogle Deepmindから奨学金を受け取っており、昨年はFacebook AI Researchからインターンシップの招待も受けています。

さらに、彼は海軍士官であり、アメリカ海軍特殊部隊SEALsから訓練を受けていました。

少し前にウォールストリートジャーナルが、呼吸器疾患と呼吸パターンの関係を研究しているこのチームについて言及しました。考えられる応用シナリオとしては、電話で COVID-19 の症状を診断することが挙げられます。現在、チームはまだデータ収集段階にあります。

確かに、優秀な人は何をするにも優秀です。はぁ……

どうですか、試してみませんか？下のリンクをクリックしてダウンロードしてご覧ください!

ポータルを使い始める

https://github.com/PyTorchLightning/pytorch-lightning

pytorch-lightning.readthedocs.io/en/latest/index.html を参照してください。

<<: ファーウェイアセンドアカデミーテクノロジーオープンデーが成都で開催され、開発者とともにAIの新時代を創造

>>: 中国がAI技術をリードしているのは数学が優れているからでしょうか？米誌、中国と米国の数学教育の格差を指摘

アリババに採用された中国の高レベル科学者がAIがもたらす想像力の空間について語る

PyTorch を軽量化します。このディープラーニングフレームワークは価値があります。 GitHub 6.6k スター

ライトニングについて

PyTorch と PyTorch Lightning の比較

モデル

データ

最適化

損失関数

PyTorch Lightning インストールチュートリアル

作者も大物

ポータルを使い始める

アリババに採用された中国の高レベル科学者がAIがもたらす想像力の空間について語る

IEEE年末AIレビュー：ネットユーザーがGPT-3に悪態をつくよう教える、DeepMindが再びロボットを作る

Google のコード生成システムはプログラマーの半分を「飲み込んだ」のでしょうか?人類は長い間AIに「負けて」きました！

自動運転のベテラン、UberのためにGoogleの機密文書14,000件を盗んだとして訴えられる

AIは新型コロナウイルスという「ブラックスワン」をいかにして「飼いならす」ことができるのか？

若者がAI倫理について語り始めるとき

従来の銀行は人工知能をどのように活用しているのでしょうか? ——2017年中国国際金融博覧会で光り輝く民生銀行の技術革新に関するメモ

「小さいけれど優秀」な大規模言語モデル Zephyr 7B の詳細な説明

謎を解く：AI の神話と現実

推薦する

ベクトル検索エンジン: 大規模な言語モデルの検索と強化された生成のための強力なツール

トップエキスパートが語る: 生成型AIとロボット工学の未来

サイバーセキュリティにおける人工知能の動向

柔らかいロボットの進化：優しくて怖い

1 つのバグが原因で 200 億ドルの損失が発生しました。ビジネス異常検出システムを構築するにはどうすればよいでしょうか?

AI と ML はデータの理解方法をどのように変えているのでしょうか?

AIとローコード/ノーコードのすべきこと、すべきでないこと

退屈な「機械学習」がこのように学べるとは思ってもいませんでした！

研究によると、人工知能が書いたツイートに騙される可能性が高くなる

マスク氏がxAIの目標を設定：汎用人工知能の実現期限は2029年

現実世界の問題を解決するための 4 つの機械学習戦略

ビル・ゲイツ: 生成AIは限界に達した