
高级索引
在numpy或pytorch等框架中的对张量的操作不只提供了类似python列表的切片索引等操作,还提供了高级索引。
高级索引大致可分为整数数组索引、布尔索引及花式索引三类:
整数数组索引
整数数组索引指使用同形状的多个数组分别指定元素的所有维度(不指定的维度也可以用切片:
或省略号...
与索引数组组合),可精准取出一批指定位置的元素,按照给定数组形状返回。
如给定4*3 的二维数组
x = np.arange(12).reshape(4,3)
print(x)
输出为:
[[ 0 1 2]
[ 3 4 5]
[ 6 7 8]
[ 9 10 11]]
1.取出其(0,0),(1,1)和(2,0)位置处的元素。
给出两个一维数组分别指定第0维和第1维
y = x[[0,1,2], [0,1,0]]
print(y)
#[0 4 6]
2.传入的位置指定数组也可为多维,取出其[[(0,0),(0,2)],[3,0, 3,2]]的元素
rows = np.array([[0,0],[3,3]])
cols = np.array([[0,2],[0,2]])
y = x[rows,cols]
print (y)
输出为
[[ 0 2]
[ 9 11]]
举例应用场景:
改变矩阵对角线元素,高级索引除了用来得到元素,也可以像平常索引一样对原张量进行操作。
给定一个33 3 的矩阵
x = np.arange(27).reshape(3,3,3)
print(x)
输出:
array([[[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8]],
[[ 9, 10, 11],
[12, 13, 14],
[15, 16, 17]],
[[18, 19, 20],
[21, 22, 23],
[24, 25, 26]]])
将其选定的对角线元素改变
items = range(3)
x[items,1:, items] = -2
print(x)
输出
array([[[ 0, 1, 2],
[-2, 4, 5],
[-2, 7, 8]],
[[ 9, 10, 11],
[12, -2, 14],
[15, -2, 17]],
[[18, 19, 20],
[21, 22, -2],
[24, 25, -2]]])
2.布尔索引
我们可以通过一个布尔数组来索引目标数组。
布尔数组性状为目标数组的维度
给定一个33 3 的矩阵
x = np.arange(27).reshape(3,3,3)
print(x)
输出:
array([[[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8]],
[[ 9, 10, 11],
[12, 13, 14],
[15, 16, 17]],
[[18, 19, 20],
[21, 22, 23],
[24, 25, 26]]])
使用布尔数组索引位置:
idx1 = np.array([0,1,1], dtype=bool)
idx2 = np.array([[[ 0, 0, 0],
[ 0, 0, 0],
[ 0, 0, 0]],
[[ 0, 1, 1],
[ 0, 0, 0],
[ 0, 0, 0]],
[[ 0, 0, 0],
[ 0, 0, 0],
[ 0, 0, 0]]], dtype=bool)
print(x[idx1])
print(x[idx2])
输出为
[[[ 9 10 11]
[12 13 14]
[15 16 17]]
[[18 19 20]
[21 22 23]
[24 25 26]]]#x[idx1]
[10 11] #x[idx2]
布尔索引也通过布尔运算(如:比较运算符)来获取符合指定条件的元素的数组。
以下实例获取大于 5 的元素:
x = np.array([[ 0, 1, 2],[ 3, 4, 5],[ 6, 7, 8],[ 9, 10, 11]])
print ('我们的数组是:')
print (x)
print ('n')
# 现在我们会打印出大于 5 的元素
print ('大于 5 的元素是:')
print (x[x > 5])
输出
我们的数组是:
[[ 0 1 2]
[ 3 4 5]
[ 6 7 8]
[ 9 10 11]]
大于 5 的元素是:
[ 6 7 8 9 10 11]
以下实例使用了 ~(取补运算符)来过滤 NaN。
a = np.array([np.nan, 1,2,np.nan,3,4,5])
print (a[~np.isnan(a)])
输出
[ 1. 2. 3. 4. 5.]
以下实例演示如何从数组中过滤掉非复数元素。
a = np.array([1, 2+6j, 5, 3.5+5j])
print (a[np.iscomplex(a)])
输出
[2.0+6.j 3.5+5.j]
花式索引
花式索引与整数数组索引不同,一次使用一个索引数组指定一个维度来指定某个轴的下标,其他维度可以用切片:
或省略号...
与常规索引。
花式索引跟切片不一样,它总是将数据复制到新数组中,是原张量的副本。
1、传入顺序索引数组
x=np.arange(32).reshape((8,4))
print (x[[4,2,1,7]])
输出
[[16 17 18 19]
[ 8 9 10 11]
[ 4 5 6 7]
[28 29 30 31]]
2、传入倒序索引数组
x=np.arange(32).reshape((8,4))
print (x[[-4,-2,-1,-7]])
输出结果为:
[[16 17 18 19]
[24 25 26 27]
[28 29 30 31]
[ 4 5 6 7]]
3、也可指定多维,传入多个索引数组(要使用np.ix_)
np.ix_分别指定其两个维度1,5,7,2行,和0,3,1,2列
x=np.arange(32).reshape((8,4))
print (x[np.ix_([1,5,7,2],[0,3,1,2])])
输出结果为:
[[ 4 7 5 6]
[20 23 21 22]
[28 31 29 30]
[ 8 11 9 10]]
举例,类似multi-head,假设一句话的隐藏矩阵为(50,200), 50为句子长,200为隐藏维度,构建两个词两两组合的矩阵。meshgrid生成两个(50,50)的矩阵,元素值分别为行号和列号的广播形式
import torch
h = torch.randn(50,200)
r_idx, c_idx = torch.meshgrid(torch.arange(50), torch.arange(50))
muilti_h = torch.cat(h[r_idx], h[c_idx],dim=-1)# (50,50,200)