文件读取与存储

1 CSV

1.1 read_csv

  • pandas.read_csv(文件路径, sep =',', 指定读取的列名)
    sep表示分隔符,默认用","隔开
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])

            open    close
2018-02-27    23.53    24.16
2018-02-26    22.80    23.53
2018-02-23    22.88    22.82
2018-02-22    22.25    22.28
2018-02-14    21.49    21.92

1.2 to_csv

  • DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
    path_or_buf :文件路径
    sep :分隔符,默认用","隔开
    columns :选择需要的列索引
    header :boolean or list of string, default True,是否写进列索引值
    index:是否写进行索引
    mode:'w':重写, 'a' 追加
# 举例:保存读取出来的股票数据
# 保存'open'列的数据,然后读取查看结果
# 选取10行数据保存,便于观察数据
data[:10].to_csv("./data/test.csv", columns=['open'])
#会发现将索引存入到文件当中,变成单独的一列数据。如果需要删除,可以指定index参数,删除原来的文件,重新保存一次。
# index:存储不会讲索引值变成一列数据
data[:10].to_csv("./data/test.csv", columns=['open'], index=False)

2 HDFS

  • pandas.read_hdf(path_or_buf,key =None,** kwargs)
    path_or_buffer:文件路径
    key:读取的键
    return:选择的对象
  • DataFrame.to_hdf(path_or_buf, key, \kwargs)
#读取文件
day_close = pd.read_hdf("./data/day_close.h5")
#存储文件
day_close.to_hdf("./data/test.h5", key="day_close")

3 总结

pandas的CSV、HDF5、JSON文件的读取

  • 对象.read_**()
  • 对象.to_**()
上一篇:div中移除和添加元素


下一篇:easyfmt--2021极客大挑战