1 CSV
1.1 read_csv
- pandas.read_csv(文件路径, sep =',', 指定读取的列名)
sep表示分隔符,默认用","隔开
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
open close
2018-02-27 23.53 24.16
2018-02-26 22.80 23.53
2018-02-23 22.88 22.82
2018-02-22 22.25 22.28
2018-02-14 21.49 21.92
1.2 to_csv
- DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
path_or_buf :文件路径
sep :分隔符,默认用","隔开
columns :选择需要的列索引
header :boolean or list of string, default True,是否写进列索引值
index:是否写进行索引
mode:'w':重写, 'a' 追加
# 举例:保存读取出来的股票数据
# 保存'open'列的数据,然后读取查看结果
# 选取10行数据保存,便于观察数据
data[:10].to_csv("./data/test.csv", columns=['open'])
#会发现将索引存入到文件当中,变成单独的一列数据。如果需要删除,可以指定index参数,删除原来的文件,重新保存一次。
# index:存储不会讲索引值变成一列数据
data[:10].to_csv("./data/test.csv", columns=['open'], index=False)
2 HDFS
- pandas.read_hdf(path_or_buf,key =None,** kwargs)
path_or_buffer:文件路径
key:读取的键
return:选择的对象 - DataFrame.to_hdf(path_or_buf, key, \kwargs)
#读取文件
day_close = pd.read_hdf("./data/day_close.h5")
#存储文件
day_close.to_hdf("./data/test.h5", key="day_close")
3 总结
pandas的CSV、HDF5、JSON文件的读取
- 对象.read_**()
- 对象.to_**()