大規模なデータセットを扱う場合、データ全体を一度にメモリにロードすることが非常に困難になることがあります。 したがって、唯一の方法は、処理のためにデータをバッチでメモリにロードすることであり、これを行うには追加のコードを記述する必要があります。この目的のために、PyTorch はすでに Dataloader 関数を提供しています。 データローダーPyTorch ライブラリの DataLoader 関数の構文とそのパラメータ情報を以下に示します。
いくつかの重要なパラメータ
組み込みのMNISTデータセットをロードするMNIST は手書きの数字を含む有名なデータセットです。 DataLoader 機能を使用して PyTorch の組み込み MNIST データセットを処理する方法を説明します。
上記のコードは、torchvision の torch コンピュータ ビジョン モジュールをインポートします。これは画像データセットを操作するときによく使用され、画像の正規化、サイズ変更、切り抜きに役立ちます。 MNIST データセットの場合、次の正規化手法が使用されます。 ToTensor() は、0〜255 のグレースケール範囲を 0〜1 に変換できます。
必要なデータセットを読み込むには、次のコードを使用します。 PyTorchDataLoader を使用して、batch_size = 64 を指定してデータをロードします。 shuffle=True はデータをシャッフルします。
データセット内のすべての画像を取得するには、通常、iter 関数とデータ ローダー DataLoader を使用します。
カスタムデータセット次のコードは、1000 個の乱数を含むカスタム データセットを作成します。
ここに画像の説明を挿入 最後に、カスタム データセットでデータローダー関数を使用します。 batch_size は 12 に設定され、num_workers = 2 で並列マルチプロセス データ ロードも有効になります。
以下では、いくつかの例を通して、大量のデータをバッチでメモリにロードする際の PyTorch Dataloader の役割について学習します。 |
<<: 再帰アルゴリズム: 不可解なスイッチ「ライトを引く」
Google のアルゴリズムは毎年何百回も更新されます (Google は通常、これらの更新について...
9月27日、ネイチャー誌は45の機関からなる国際科学研究チームの最新の研究成果を発表した。 200...
1. 概要大規模言語モデル (LLM) の急速な発展に伴い、LLM が人工知能業界の発展に与える影...
セキュリティ オペレーション センター (SOC) のアナリストは推論と意思決定に優れていますが、2...
人工知能は急速に発展しています。データによると、2016年から2020年にかけて、中国の人工知能市場...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
【51CTO.comオリジナル記事】 [[344118]]近年、ロボティック・プロセス・オートメーシ...
金融分野で AI を適切に導入するには、単に時間や資金を最も多く投資すればよいという問題ではありませ...
海外メディアの報道によると、アップルは最近シアトルの人工知能研究開発センターのオフィススペースを拡大...
今日では、機械学習に大きく依存せずに強力なサイバーセキュリティ ソリューションを展開することは不可能...
2019年5月18日、YC Chinaが開催したYC China起業家会議において、YC China...