Numpy(Numerical Python)是高性能科学计算和数据分析的基础包。
1.Numpy的ndarray:一种多维数组对象
对于每个数组而言,都有shape和dtype这两个属性来获取数组的形状(元组表示)和类型。
创建ndarray: 可直接用np.array()着函数进行创建,往其中传入一维或者多维列表。
利用zeros()和ones()可以创建指定形状的全1或者全0数组。传入的参数为元组(1,2,3)
np.arange()是python内置函数的数组版本。
改变ndarray类型:.astype(float) 对数组内的数据类型进行转变,如将字符串转换成数字就便于后续的使用。
数组的索引和切片:数组的切片是原始数据的试图,操作直接作用在原始数据上。
数组的调用: arr2d[2][3]等价于arr2d[2,3]
多维数组的表示方法(3维):arr3d = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
切片: 按照数组的轴进行切片。arr2d[:2,1:]
布尔值可用于数组索引: 布尔数组的长度必须要和被索引的轴长度一致 data[data<0] = 0 data<0 返回的是布尔值,可直接用于索引。
花式索引(Fancy indexing):为了能够以特定顺序选取行子集,只需传入一个用于指定顺序的整数列表或ndarray即可。 arr[[4,3,0,6]]
对于花式索引而言,一次传入多个索引数组会有一点特别。
数组的转置和周对换: 转置 arr.T arr.transpose(1,0,2)
通用函数:快速的元素级数组函数。有一元和二元ufunc函数。
排序:arr.sort()多维数组可以填入轴的值,根据轴进行排序。
唯一化以及其他的集合逻辑:np.unique(填入数组)