大規模なデータセットを扱う場合、データ全体を一度にメモリにロードすることが非常に困難になることがあります。 したがって、唯一の方法は、処理のためにデータをバッチでメモリにロードすることであり、これを行うには追加のコードを記述する必要があります。この目的のために、PyTorch はすでに Dataloader 関数を提供しています。 データローダーPyTorch ライブラリの DataLoader 関数の構文とそのパラメータ情報を以下に示します。
いくつかの重要なパラメータ
組み込みのMNISTデータセットをロードするMNIST は手書きの数字を含む有名なデータセットです。 DataLoader 機能を使用して PyTorch の組み込み MNIST データセットを処理する方法を説明します。
上記のコードは、torchvision の torch コンピュータ ビジョン モジュールをインポートします。これは画像データセットを操作するときによく使用され、画像の正規化、サイズ変更、切り抜きに役立ちます。 MNIST データセットの場合、次の正規化手法が使用されます。 ToTensor() は、0〜255 のグレースケール範囲を 0〜1 に変換できます。
必要なデータセットを読み込むには、次のコードを使用します。 PyTorchDataLoader を使用して、batch_size = 64 を指定してデータをロードします。 shuffle=True はデータをシャッフルします。
データセット内のすべての画像を取得するには、通常、iter 関数とデータ ローダー DataLoader を使用します。
カスタムデータセット次のコードは、1000 個の乱数を含むカスタム データセットを作成します。
ここに画像の説明を挿入 最後に、カスタム データセットでデータローダー関数を使用します。 batch_size は 12 に設定され、num_workers = 2 で並列マルチプロセス データ ロードも有効になります。
以下では、いくつかの例を通して、大量のデータをバッチでメモリにロードする際の PyTorch Dataloader の役割について学習します。 |
<<: 再帰アルゴリズム: 不可解なスイッチ「ライトを引く」
[[377158]]研究によれば、コロナウイルスのパンデミック中に組織が確立したビジネス規範は、パン...
コンピュータグラフィックスでは、「三角メッシュ」は 3D 幾何学的オブジェクトの主な表現であり、ゲー...
1950 年代のコンピューティング ブームにより、「人工知能」という用語が誕生しました (1956 ...
[[203631]]今年はiPhone発売10周年の年です。 9月13日午前1時(北京時間)、アップ...
OpenAIはDALL-Eに関するいくつかの論文と実装コードを公開しました。今年初め、OpenAI...
COVID-19の流行、メンタルヘルスの危機、医療費の高騰、人口の高齢化により、業界のリーダーたちは...
4月23日は第25回「世界本の日」です!今日は本を読みましたか?ゴーリキーはかつてこう言った。「本は...
大規模な人工知能 (AI) により、容量とパフォーマンスの面でストレージ インフラストラクチャの水準...
人工知能の進歩は前例のない機会をもたらすと同時に、経済的、政治的、社会的混乱ももたらします。専門家は...
最近、数年間業界で働いているスタンフォード大学の AI 卒業生が、AI と機械学習のキャリアのために...