python numpy 模块简单介绍

用python自带的list去处理数组效率很低, numpy就诞生了, 它提供了ndarry对象,N-dimensional object, 是存储单一数据类型的多维数组,即所有的元素都是同一种类型。索引是一个正整数元组。

秩,rank==轴, axes ==维度, dimensions ==ndim==len(shap)

一, 简单介绍:

>>> from numpy import *
>>> a = arange(10).reshape(2,5)
>>> a
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

arange 和自带的range形式一样,只不过返回的是一个数组对象

方法有:

dtype, 描述数组元素类型的对象, 方法有name

itemssize, 数组中每个元素的字节大小。float64的itemsize为64/8=8

ndim查看数组的秩,也称为轴, 维度。

size, 查看数组一共多少个元素。等于shap元组中的元素成绩。

shape, 数组的维度,是一个指示数组在每个维度上大小的整数元组。一个n排m列矩阵, shape为(2,3),这个元组的长度就是秩,即维度或者ndim属性。

reshape, 重新定义数组形态。

>>> type(a)
<type 'numpy.ndarray'>
>>> a.shape
(2, 5)
>>> a.ndim
2
>>> a.dtype
dtype('int64')
>>> a.dtype.name
'int64'
>>> a.itemsize
8
>>> a.size
10

二, 从列表创建数组

>>> import numpy as np
>>> a = np.array([2,3,4])   
>>> a
array([2, 3, 4])

>>> a.dtype
dtype('int64')

数组的类型由原数据的类型推倒出来。

>>> a = np.array([1.2, 3, 4, 9]) 
>>> a
array([ 1.2,  3. ,  4. ,  9. ])

>>> a.dtype
dtype('float64')

注意: np.array()接受的是一个列表,即np.array([1,2,3,4]), 而不是np.array(1,2,3,4)

序列包含序列将转化为2维数组,序列包含序列包含序列将转化为三维数组

>>> a = array([[1,2,3], [4,5,6]])   #列表中有两个元组,转化时自动转为2维数组。也可以是a = array([[1,2,3], [4,5,6]])
>>> a
array([[1, 2, 3],
       [4, 5, 6]])
>>> a.dtype
dtype('int64')
>>> a.size
6
>>> a.shape
(2, 3)

>>> a.ndim
2

在创建的时候数组类型可以指定如 a = array([[1,2,3], [4,5,6]], dtype=int32)

三, 用numpy自带方法创建全是零的数组或全是一的数组。

为什么这样做? 因为数组的元素刚开始是未知的,但是数组的大小往往是已知的,提前建好框架,节省了运算。

zeros()创建元素全是零的数组

>>> np.zeros((3,4))    #创建一个全是零的2维数组, 注意不能zeros(3,4).  类型默认均为float64. 也可以在创建的时候指定
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

>>> a = np.zeros((1,10))  
>>> a
array([[ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.]]) 
>>> a.dtype
dtype('float64')
>>> a.size
10
>>> a.shape   
(1, 10)
>>> a.ndim   
2

>>> b = np.zeros((10))

>>>b
array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

>>> b.dtype
dtype('float64')
>>> b.size
10
>>> b.shape
(10,)
>>> b.ndim
1

创建全是1的数组

>>> a = np.ones((2,3,4), dtype=np.int64)   #三维数组, 两个三行四列。

>>> a

array([[[1, 1, 1, 1],         [1, 1, 1, 1],         [1, 1, 1, 1]],

[[1, 1, 1, 1],         [1, 1, 1, 1],         [1, 1, 1, 1]]])

>>> a.shape
(2, 3, 4)

>>> a.ndim
3

四, 创建序列

>>> a = np.arange(1,10,5)   # 和range的方法差不多。起始,终止, 步进。

>>> a
array([1, 6])

>>> a.shape   
(2,)
>>> a.size
2
>>> a.ndim
1

>>> a = np.arange(0, 10, 2.5)   #步进是小数的话,返回类型为float64
>>> a
array([ 0. ,  2.5,  5. ,  7.5])
>>> a.dtype
dtype('float64')

>>> a
array([ 0. ,  2.5,  5. ,  7.5])

>>> a.reshape(1,4)
array([[ 0. ,  2.5,  5. ,  7.5]])  #转化为2维

>>> a.shape       
(4,)

>>> a.reshape(1,4).shape
(1, 4)

五, 用linspace(起始, 终止, 数列个数,是否包括终止值)创建一个等差数列数组

默认是包括终止值的。

>>> from numpy import *

>>> linspace(1, 10, 10)
array([  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.])

>>> linspace(1, 10, 10, endpoint=False)                 #默认endpoint=True
array([ 1. ,  1.9,  2.8,  3.7,  4.6,  5.5,  6.4,  7.3,  8.2,  9.1])

可以看到返回的数组dtype是浮点型:

>>> linspace(1,2,10).dtype
dtype('float64')

这个函数对用matplotlib作图的时候比较好用, 比如确定横纵坐标之类的。

六, 数组打印

一维数组打印成行, 二维数组打印成矩阵。 三维数组打印成矩阵列表。

自己尝试:

from numpy import *

>>> a = arange(24)

>>>print a

>>> print a.reshape(2,12)

>>> print a.reshape(2,3,4)

如果数组太大的话,numpy会自动省略中间部分

by freemao

FAFU

free_mao@qq.com

上一篇:第三百零一天 how can i 坚持


下一篇:SpringBoot整合Quartz定时任务(持久化到数据库)