PyTorch でテンソルを操作するための 5 つの基本関数

ニューラルネットワークを正確かつ効率的に構築する能力は、ディープラーニングエンジニアの採用担当者が最も求めるスキルの 1 つです。 PyTorch は、主にディープラーニングに使用される Python ライブラリです。 PyTorch の最も基本的で重要な部分の 1 つは、数値、ベクトル、行列、または任意の n 次元配列であるテンソルを作成することです。ニューラルネットワークを構築する際の計算速度を下げるには、明示的なループの使用を避ける必要があります。このようなループを回避するには、ベクトル化された操作を使用できます。ニューラルネットワークを構築する場合、行列演算を十分速く計算する能力が重要です。

「NumPy ライブラリを使わないのはなぜですか?」

ディープラーニングでは、モデルパラメータの導関数を計算する必要があります。 PyTorch はバックプロパゲーション中に導関数を追跡する機能を提供しますが、NumPy にはこの機能がありません。これは PyTorch では「Auto Grad」と呼ばれます。 PyTorch は、GPU を使用した高速実行のための組み込みサポートを提供します。これはモデルのトレーニングにおいて非常に重要です。 Numpy には計算を GPU にオフロードする機能がないため、モデルのトレーニングにかかる時間が非常に長くなってしまいます。

PyTorch を使用したすべてのディープラーニングプロジェクトは、テンソルの作成から始まります。ニューラルネットワークの構築を含むあらゆるディープラーニングプロジェクトのバックボーンとなる、知っておくべき機能をいくつか見てみましょう。

トーチ.テンソル()
トーチ.合計()
トーチ.index_select()
トーチ.スタック()
トーチ.mm()

Pytorch をインストールしたら、コードに直接インポートできます。

 # torchとその他の必要なモジュールをインポートする
輸入トーチ

トーチ.テンソル()

まず、テンソルの型、テンソルの次元、テンソルの内容など、テンソル x のさまざまなプロパティを要約するヘルパー関数 describe(x) を定義します。

 # ヘルパー関数 
 def 記述(x):
  print( "タイプ: {}" .format(x.type()))
  print( "形状/サイズ: {}" .format(x.shape))
  print( "値: \n{}" .format(x)

torch.Tensor を使用して PyTorch でテンソルを作成する

PyTorch では、torch パッケージを使用してさまざまな方法でテンソルを作成できます。テンソルを作成する1つの方法は、次元を指定してランダムテンソルを初期化することです。

記述(torch.Tensor(2, 3))

Python リストを使用して宣言的にテンソルを作成する

Python リストを使用してテンソルを作成することもできます。リストを関数の引数として渡すだけで、テンソル形式が得られます。

 x = トーチ.テンソル([[1, 2, 3],[4, 5, 6]])  
記述(x)

NumPy 配列を使用してテンソルを作成する

NumPy 配列から PyTorch テンソルを作成することもできます。テンソルの型は、デフォルトの Float Tensor ではなく Double Tensor です。これは、以下に示すように、NumPy データ型 float64 に対応します。

 numpyをnpとしてインポートする
npy = np.random.rand(2, 3)
 torch.from_numpy(npy) を記述します。

テンソルでできないことは何でしょうか? テンソルは実数または複素数である必要があり、文字列や文字であってはなりません。

トーチ.テンソル([[1, 2], [3, 4, 5]]) 
 
 
 ---------------------------------------------------------------------------  
 ValueError トレースバック (最新の呼び出しが最後)
 <ipython-input-5-28787d136593> は<module>にあります
      1 # 例 3 - 破壊 (破壊されるタイミングを示す)
 ----> 2 torch.tensor([[1, 2], [3, 4, 5]])   
 
 ValueError: 期待されるシーケンス 長さ 2、次元1 (3 を取得)

torch.tensor() はテンソルであるため、文字通りあらゆる PyTorch プロジェクトの中核を形成します。

トーチ.合計()

この関数は、入力テンソル内のすべての要素の合計を返します。

記述(torch.sum ( x, dim=0, keepdims= True ))

NumPy に精通している場合は、2D テンソルの場合、行を次元 0、列を次元 1 として表すことに気付いたかもしれません。 torch.sum() 関数を使用すると、行と列の合計を計算できます。

また、結果の次元を保持するために、keepdims に True を渡します。 dim = 1 を定義することで、関数に配列を列ごとに折りたたむように指示します。

 torch.sum ( npy 、dim=1、keepdims= True ) 
 
 ---------------------------------------------------------------------------  
 TypeError トレースバック (最新の呼び出しが最後)
 <ipython-input-17-1617bf9e8a37> は<module>()にあります
      1 # 例 3 - 破壊 (破壊されるタイミングを示す)
 ----> 2 torch.sum(npy,dim=1,keepdims=True)   
 
 TypeError: sum () は無効な引数の組み合わせを受け取りました- (numpy.ndarray、keepdims=bool、dim= int ) を取得しましたが、次のいずれかが期待されていました:
 * (テンソル入力、*、torch.dtype dtype)
      一致しなかったのは キーワードの内、正しくないもの: keepdims、dim
 * (テンソル入力、intのタプルdim、bool keepdim、*、torch.dtype dtype、テンソル出力)
 * (テンソル入力、名前のタプルdim、bool keepdim、*、torch.dtype dtype、テンソル出力)

この関数は、メトリックと損失関数の計算に非常に役立ちます。

トーチ.index_select()

この関数は、indices のエントリを使用して次元 dim に沿って入力テンソルをインデックス付けする新しいテンソル (LongTensor) を返します。

インデックス = torch.LongTensor([0, 2])
記述します(torch.index_select(x, dim=1, index =インデックス))

インデックスをテンソルとして渡し、軸を 1 と定義できます。この関数は、サイズが rows_of_original_tensor x length_of_indices_tensor の新しいテンソルを返します。

インデックス = torch.LongTensor([0, 0])
記述します(torch.index_select(x, dim=0, index =インデックス))

インデックスをテンソルとして渡し、軸を0と定義すると、関数はサイズが

columns_of_original_tensor x length_of_indices_tensor の新しいテンソル。

インデックス = torch.FloatTensor([0, 2])
記述します(torch.index_select(x, dim=1, index =インデックス))

この関数は、テンソルの非連続インデックスなどの複雑なインデックス作成に役立ちます。

トーチ.スタック()

これにより、新しい次元に沿ってテンソルのシーケンスが連結されます。

記述(torch.stack([x, x, x], dim = 0))

連結したいテンソルを dim 0 のテンソルのリストとして渡し、行に沿って積み重ねることができます。

記述(torch.stack([x, x, x], dim = 1))

連結したいテンソルを、dim が 1 のテンソルのリストとして渡し、列に沿って積み重ねることができます。

 y = トーチ.テンソル([3,3])
記述(torch.stack([x, y, x], dim = 1)) 
 
 --------------------------------------------------------------------------  
 RuntimeError トレースバック (最新の呼び出しが最後)
 <ipython-input-37-c97227f5da5c> は<module>()にあります
      1 # 例 3 - 破壊 (破壊されるタイミングを示す)
      2 y = トーチ.テンソル([3,3])
 ----> 3 記述(torch.stack([x, y, x], dim = 1))   
 
 RuntimeError: スタックは各テンソルが同じサイズであると想定していますが、エントリ 0では[2, 3] 、エントリ 1では[2]です。

この関数は、行列を平坦化するために torch.index_select() と組み合わせて使用すると便利です。

トーチ.mm()

この関数は行列間の乗算を実行します。

 mat1 = トーチ.randn(3,2)
記述(torch.mm(x, mat1))

行列を引数として渡すだけで簡単に行列乗算を実行でき、関数は 2 つの行列の積として新しいテンソルを生成します。

 mat1 = np.random.randn(3,2)
 mat1 = torch.from_numpy(mat1) .to (torch.float32)
記述(torch.mm(x, mat1))

上記の例では、NumPy 配列を定義し、それを float32 テンソルに変換しました。これで、テンソルの行列乗算を正常に実行できるようになりました。操作が成功するには、2 つのテンソルのデータ型が一致している必要があります。

 mat1 = トーチ.randn(2,3)
記述(torch.mm(x, mat1)) 
 
 ---------------------------------------------------------------------------  
 RuntimeError トレースバック (最新の呼び出しが最後)
 <ipython-input-62-18e7760efd23> は<module>()にあります
      1 # 例 3 - 破壊 (破壊されるタイミングを示す)
      2 mat1 = torch.randn(2,3)
 ----> 3 記述(torch.mm(x, mat1))   
 
ランタイムエラー: mat1とmat2 の形状を乗算できません (2x3と2x3)