1 CSV文件
CSV,Comma Separate Values,是逗号分隔文件的缩写,是一种存储数据的纯文本格式,通常用于存储电子表格或数据库软件
特点
每条记录占一行
以逗号为分隔符
逗号前后的空格会被忽略
参考:CSV是什么文件格式
2 读取CSV文件
loadtxt函数解析CSV文件
loadtxt(文件名,分隔符,usecols=(列索引表),unpack=True,dtype=元素类型,converters={列索引号:转换函数})
numpy.loadtxt(fname, dtype=<type 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)[source] Load data from a text file.
fname - 可以是文件、字符串、文件路径,或是生成器;若文件为.gz 或 .bz2时,文件首先会被解压,若文件为生成器,则返回字节串(for Python 3K)
dtype - 数据类型,optional,默认时浮点型float
comments - 注释;字符串或列表类型,optional,默认#
delimiter - 分隔符;字符串类型,optional,默认空格
converters - 转换器,列(编号)映射(转换)函数调用,字典类型{列索引号:转换函数},optional,例如 converters = {0: datestr2num} 、 converters = {3: lambda s: float(s.strip() or 0)}
skiprows - 跳过前几行,整型int,optional,默认0
usecols - 要读取的列,第一列为0,整型int 或 列表sequence,optional,默认值为空,意味读取所有列;例如,usecols = 2 意味读取第3列,usecols = (1,4,5)意味读取第2、5、6列
unpack - 若为True,将分列读取;如果False,行列式,把行当作基本单元读取,布尔类型bool,optional,默认为False
admin - 返回的数组将至少具有“ndmin”维度,合法值0(默认值)、1、2
返回值:ndarray,从text file 中读取的数据。