用python自带的list去处理数组效率很低, numpy就诞生了, 它提供了ndarry对象,N-dimensional object, 是存储单一数据类型的多维数组,即所有的元素都是同一种类型。索引是一个正整数元组。
秩,rank==轴, axes ==维度, dimensions ==ndim==len(shap)
一, 简单介绍:
>>> from numpy import *
>>> a = arange(10).reshape(2,5)
>>> a
array([[0, 1, 2, 3, 4],
[5, 6, 7, 8, 9]])
arange 和自带的range形式一样,只不过返回的是一个数组对象
方法有:
dtype, 描述数组元素类型的对象, 方法有name
itemssize, 数组中每个元素的字节大小。float64的itemsize为64/8=8
ndim查看数组的秩,也称为轴, 维度。
size, 查看数组一共多少个元素。等于shap元组中的元素成绩。
shape, 数组的维度,是一个指示数组在每个维度上大小的整数元组。一个n排m列矩阵, shape为(2,3),这个元组的长度就是秩,即维度或者ndim属性。
reshape, 重新定义数组形态。
>>> type(a)
<type 'numpy.ndarray'>
>>> a.shape
(2, 5)
>>> a.ndim
2
>>> a.dtype
dtype('int64')
>>> a.dtype.name
'int64'
>>> a.itemsize
8
>>> a.size
10
二, 从列表创建数组
>>> import numpy as np
>>> a = np.array([2,3,4])
>>> a
array([2, 3, 4])
>>> a.dtype
dtype('int64')
数组的类型由原数据的类型推倒出来。
>>> a = np.array([1.2, 3, 4, 9])
>>> a
array([ 1.2, 3. , 4. , 9. ])
>>> a.dtype
dtype('float64')
注意: np.array()接受的是一个列表,即np.array([1,2,3,4]), 而不是np.array(1,2,3,4)
序列包含序列将转化为2维数组,序列包含序列包含序列将转化为三维数组
>>> a = array([[1,2,3], [4,5,6]]) #列表中有两个元组,转化时自动转为2维数组。也可以是a = array([[1,2,3], [4,5,6]])
>>> a
array([[1, 2, 3],
[4, 5, 6]])
>>> a.dtype
dtype('int64')
>>> a.size
6
>>> a.shape
(2, 3)
>>> a.ndim
2
在创建的时候数组类型可以指定如 a = array([[1,2,3], [4,5,6]], dtype=int32)
三, 用numpy自带方法创建全是零的数组或全是一的数组。
为什么这样做? 因为数组的元素刚开始是未知的,但是数组的大小往往是已知的,提前建好框架,节省了运算。
zeros()创建元素全是零的数组
>>> np.zeros((3,4)) #创建一个全是零的2维数组, 注意不能zeros(3,4). 类型默认均为float64. 也可以在创建的时候指定
array([[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.]])
>>> a = np.zeros((1,10))
>>> a
array([[ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])
>>> a.dtype
dtype('float64')
>>> a.size
10
>>> a.shape
(1, 10)
>>> a.ndim
2
>>> b = np.zeros((10))
>>>b
array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
>>> b.dtype
dtype('float64')
>>> b.size
10
>>> b.shape
(10,)
>>> b.ndim
1
创建全是1的数组
>>> a = np.ones((2,3,4), dtype=np.int64) #三维数组, 两个三行四列。
>>> a
array([[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]],
[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]]])
>>> a.shape
(2, 3, 4)
>>> a.ndim
3
四, 创建序列
>>> a = np.arange(1,10,5) # 和range的方法差不多。起始,终止, 步进。
>>> a
array([1, 6])
>>> a.shape
(2,)
>>> a.size
2
>>> a.ndim
1
>>> a = np.arange(0, 10, 2.5) #步进是小数的话,返回类型为float64
>>> a
array([ 0. , 2.5, 5. , 7.5])
>>> a.dtype
dtype('float64')
>>> a
array([ 0. , 2.5, 5. , 7.5])
>>> a.reshape(1,4)
array([[ 0. , 2.5, 5. , 7.5]]) #转化为2维
>>> a.shape
(4,)
>>> a.reshape(1,4).shape
(1, 4)
五, 用linspace(起始, 终止, 数列个数,是否包括终止值)创建一个等差数列数组
默认是包括终止值的。
>>> from numpy import *
>>> linspace(1, 10, 10)
array([ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.])
>>> linspace(1, 10, 10, endpoint=False) #默认endpoint=True
array([ 1. , 1.9, 2.8, 3.7, 4.6, 5.5, 6.4, 7.3, 8.2, 9.1])
可以看到返回的数组dtype是浮点型:
>>> linspace(1,2,10).dtype
dtype('float64')
这个函数对用matplotlib作图的时候比较好用, 比如确定横纵坐标之类的。
六, 数组打印
一维数组打印成行, 二维数组打印成矩阵。 三维数组打印成矩阵列表。
自己尝试:
from numpy import *
>>> a = arange(24)
>>>print a
>>> print a.reshape(2,12)
>>> print a.reshape(2,3,4)
如果数组太大的话,numpy会自动省略中间部分
by freemao
FAFU