ndarray对象的使用方法

2022-01-19 03:45:25

ndarray的基本操作

1.索引

基本索引:一维与list完全一致多维同理

例如:

import numpy

ndarr1 = numpy.random.randint(0,10.size=5)

ndarr1[0] # 取数组中的第一个值, 以此类推

ndarr1[1]

ndarr1[-1]

高级索引:整数数组形式的索引

例如:

nd = np.random.randint(0,10,size=(5,6))

nd
array([[0, 4, 7, 5, 9, 7],

       [5, 3, 2, 9, 5, 5],

       [9, 2, 6, 2, 7, 7],

       [0, 3, 5, 4, 3, 9],

       [9, 1, 9, 7, 1, 3]])

nd[0][0]  # 普通的索引

# 整数数组索引

nd[0,0]

nd[-1,0]

nd[-1,]

# 往里一个维度 要同时 取出 0 2 4

nd[-1,[0,2,4]]

nd[-1,[4,2,0]]  # 顺序任意 可以正向取 也可以反向取 还可以随便取 而且可以重复取

nd[-1,[2,4,0]]

nd[-1,[2,4,0,0,0,0]]

2.切片

一维与列表切片完全一致多维时同理

例如:

ndarr = np.random.randint(0,10,size=5)

ndarr

array([8, 6, 5, 3, 6])

ndarr[1:4]

ndarr[0:4]

ndarr[:4]

ndarr[:]

而且ndarray还支持用,一级一级往里找

ndarr[:2]

# 切片也是 从外往里 一级一级切

ndarr[:,0:2]

ndarr[1:3,1:4]

ndarr[1:3,1:-1]

使用两个:: 的形式进行切片和翻转

例如:

nd = np.random.randint(0,10,size=9)

nd

array([0, 0, 4, 9, 0, 3, 8, 6, 5])

nd[1:-1:2]  # start:stop:step

nd[::-1]

nd[::-2]

3.变形

使用reshape函数，注意参数是一个tuple！

nd = np.random.randint(0,10,size=(4,5))

nd

array([[2, 5, 0, 9, 6],

       [0, 1, 3, 3, 8],

       [5, 3, 9, 7, 8],

       [6, 0, 9, 8, 8]])

nd.size

20

nd.reshape((5,4))  # 形状可以任意改变 但是size不能变化

nd.reshape((10,2))

nd.reshape((2,10))

# nd.reshape((5,5))  # 25

nd.reshape((20,1))

nd.reshape((-1,1))  # -1指的是自动计算的意思

nd.reshape((1,20))

nd.reshape((1,-1))

4.连结

np.concatenate()

连结需要注意的点：

连结的参数是列表：一定要加小括号
必须维度相同形状相符
连结的方向默认是shape这个tuple的第一个值所代表的维度方向
可通过axis参数改变连结的方向

# 第一个参数 以元组的形式 传入要拼接的多个ndarr

np.concatenate((nd,nd))  # 默认按照纵向拼接

# 第二个参数 axis 用来指定 拼接方向

# np.concatenate((nd,nd),axis=0)

# np.concatenate((nd,nd),axis=1)

# np.concatenate((nd,nd),axis=-1)  # -1是最里层

np.concatenate((nd,nd),axis=-2)  #

5.切分

与级联类似，三个函数完成切分工作：

np.split 默认是axis=0
np.vsplit 横向切与axis=0相同
np.hsplit 纵向切与axis=1相同
返回值是一个列表

# ary, indices_or_sections, axis=0

# ary 要切分的数组

# indices_or_sections 用来指定 分成几份 或者 从哪里分

# axis 用来指定切分的方向

np.split()

6.副本

所有赋值运算不会为ndarray的任何元素创建副本。对赋值后的对象操作也会影响原数组。

可使用copy()函数创建副本,类似于python中的deepcopy

# 对于ndarray对象 凡是涉及到复制后改变 又不希望影响原数组的 都用copy （这是最保险的）

nd2 = nd.copy()  # 深层copy

ndarray的聚合操作

1.求和numpy.sum()

2. 最大最小值：numpy.max/ np.min

3. 其他聚合操作

Function Name    NaN-safe Version    Description

np.sum    np.nansum    Compute sum of elements 所有元素的和

np.prod    np.nanprod    Compute product of elements 所有元素的乘积

np.mean    np.nanmean    Compute mean of elements

np.std    np.nanstd    Compute standard deviation

np.min    np.nanmin    Find minimum value

np.max    np.nanmax    Find maximum value

np.argmin    np.nanargmin    Find index of minimum value

np.argmax    np.nanargmax    Find index of maximum value

np.any    N/A    Evaluate whether any elements are true

np.all    N/A    Evaluate whether all elements are true

ndarray的矩阵操作

1.基本矩阵操作

1) 算术运算符：

加减乘除

ndarr = np.random.randint(0,10,size=(4,5))

ndarr

array([[4, 5, 8, 3, 0],

       [9, 4, 4, 1, 5],

       [9, 6, 4, 0, 1],

       [6, 1, 6, 4, 9]])

ndarr+1 ...

ndarr-1 ...

ndarr*2

array([[ 8, 10, 16,  6,  0],

       [18,  8,  8,  2, 10],

       [18, 12,  8,  0,  2],

       [12,  2, 12,  8, 18]])

2) 矩阵积np.dot()

ndarr

array([[4, 5, 8, 3, 0],

       [9, 4, 4, 1, 5],

       [9, 6, 4, 0, 1],

       [6, 1, 6, 4, 9]])

# 矩阵的点积

# A矩阵 和 B矩阵 做点积

# A矩阵是m行n列的矩阵

# B矩阵是i行j列的矩阵

# B的行数必须得等于A的列数 i要等于n

# 结果是一个 m行 j列的一个矩阵

ndarr2 = np.random.randint(0,10,size=(5,2))

ndarr2

array([[4, 4],

       [0, 9],

       [0, 8],

       [1, 5],

       [6, 2]])
np.dot(ndarr,ndarr2)

array([[ 19, 140],

       [ 67, 119],

       [ 42, 124],

       [ 82, 119]])

2.广播机制

ndarray的排序

1.快速排序

np.sort()与ndarray.sort()都可以，但有区别：

np.sort(ndarray) 不改变输入
ndarray.sort() 本地处理，不占用空间，但改变输入

2.部分排序

np.partition(a,k)

有的时候我们不是对全部数据感兴趣，我们可能只对最小或最大的一部分感兴趣。

当k为正时，我们想要得到最小的k个数
当k为负时，我们想要得到最大的k个数

示例:

nd = np.random.randint(0,100,size=15)

ndarr = np.random.randint(0,100,size=15)

ndarr

array([83, 57, 43, 83, 95, 73, 95,  7, 46, 26, 86, 47, 59, 45, 64])

# 10个数据库 里面分别有10000商品

# 计算销量最大的前三个

# a, kth a是要排序的数组 kth是要找最大的几个

# np.partition(ndarr,3)  # k是3 表示寻找 最小的3个

# np.partition(ndarr,5)  # 顺序可能是没有排好的 但是最前面的5个一定是最小的5个

np.partition(ndarr,-5)

np.partition(ndarr,-4)

array([46,  7, 43, 45, 59, 47, 26, 57, 64, 73, 83, 83, 95, 86, 95])

码农公寓