大規模なデータセットを扱う場合、データ全体を一度にメモリにロードすることが非常に困難になることがあります。 したがって、唯一の方法は、処理のためにデータをバッチでメモリにロードすることであり、これを行うには追加のコードを記述する必要があります。この目的のために、PyTorch はすでに Dataloader 関数を提供しています。 データローダーPyTorch ライブラリの DataLoader 関数の構文とそのパラメータ情報を以下に示します。
いくつかの重要なパラメータ
組み込みのMNISTデータセットをロードするMNIST は手書きの数字を含む有名なデータセットです。 DataLoader 機能を使用して PyTorch の組み込み MNIST データセットを処理する方法を説明します。
上記のコードは、torchvision の torch コンピュータ ビジョン モジュールをインポートします。これは画像データセットを操作するときによく使用され、画像の正規化、サイズ変更、切り抜きに役立ちます。 MNIST データセットの場合、次の正規化手法が使用されます。 ToTensor() は、0〜255 のグレースケール範囲を 0〜1 に変換できます。
必要なデータセットを読み込むには、次のコードを使用します。 PyTorchDataLoader を使用して、batch_size = 64 を指定してデータをロードします。 shuffle=True はデータをシャッフルします。
データセット内のすべての画像を取得するには、通常、iter 関数とデータ ローダー DataLoader を使用します。
カスタムデータセット次のコードは、1000 個の乱数を含むカスタム データセットを作成します。
ここに画像の説明を挿入 最後に、カスタム データセットでデータローダー関数を使用します。 batch_size は 12 に設定され、num_workers = 2 で並列マルチプロセス データ ロードも有効になります。
以下では、いくつかの例を通して、大量のデータをバッチでメモリにロードする際の PyTorch Dataloader の役割について学習します。 |
<<: 再帰アルゴリズム: 不可解なスイッチ「ライトを引く」
[51CTO.comより引用] Alimamaは、誰もが簡単にマーケティングを行えるようにすることを...
[原文は51CTO.comより] 最近、AI分野のブラックテクノロジーは、人々の人工知能に対する認識...
2022年全国人民代表大会と中国人民政治協商会議が開幕した。3月5日には2022年政府活動報告が発...
私は Unix オペレーティング システムに関する知識を頻繁に学んでおり、Unix オペレーティング...
製造業は急速にインテリジェント化の新たな段階に入りつつあり、ますます多くの製造企業が「インテリジェン...
生体認証市場を見ると、顔認証や虹彩認証などの割合が増加しており、一般の人々のこれらの技術に対する理解...
[[248236]]皆さんは、イ・セドルと柯潔を破った Google の「Alpha Go」をまだ覚...
2018年、国内の人工知能とビッグデータ産業は引き続き急速な発展を遂げ、国家計画の導入に伴い、各地...
北京や上海などの街では、特別な車をよく見かけます。これらの車は車体の上部と側面に特別な装置が付いてい...
GPT-4 のマルチモーダル機能については、もう少し待たなければならないかもしれません。最近、CMU...
エッジ コンピューティングへの期待が高まる中、業界では「エッジがクラウドを飲み込む」や、医療、小売、...