numpy 的通用函数

1 CSV文件

CSV,Comma Separate Values,是逗号分隔文件的缩写,是一种存储数据的纯文本格式,通常用于存储电子表格或数据库软件

特点

每条记录占一行

以逗号为分隔符

逗号前后的空格会被忽略

参考:CSV是什么文件格式

2 读取CSV文件

loadtxt函数解析CSV文件

loadtxt(文件名,分隔符,usecols=(列索引表),unpack=True,dtype=元素类型,converters={列索引号:转换函数})

 numpy.loadtxt(fname, dtype=<type 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)[source]

    Load data from a text file.

fname - 可以是文件、字符串、文件路径,或是生成器;若文件为.gz 或 .bz2时,文件首先会被解压,若文件为生成器,则返回字节串(for Python 3K)

dtype - 数据类型,optional,默认时浮点型float

comments - 注释;字符串或列表类型,optional,默认#

delimiter - 分隔符;字符串类型,optional,默认空格

converters - 转换器,列(编号)映射(转换)函数调用,字典类型{列索引号:转换函数},optional,例如 converters = {0: datestr2num} 、 converters = {3: lambda s: float(s.strip() or 0)}

skiprows - 跳过前几行,整型int,optional,默认0

usecols - 要读取的列,第一列为0,整型int 或 列表sequence,optional,默认值为空,意味读取所有列;例如,usecols = 2 意味读取第3列,usecols = (1,4,5)意味读取第2、5、6列

unpack - 若为True,将分列读取;如果False,行列式,把行当作基本单元读取,布尔类型bool,optional,默认为False

admin - 返回的数组将至少具有“ndmin”维度,合法值0(默认值)、1、2

返回值:ndarray,从text file 中读取的数据。

上一篇:SQL Server 容易忽略的错误


下一篇:Linux 积累