pandas的文件读取

读取csv方法

     可以通过read_csv()方法读取csv文件。

第一个参数为文件名,后续参数为可选参数。

encoding指解析文件所用编码方式,带中文的建议使用gbk。

index_col指定作为索引的列,可以指定列下标,也可以指定列名。

parse_dates指定是否把日期类的给解析成日期对象,可以设置为True进行全部解析,也可以指定解析的列。

header可以设置表格没有列名,通过names设置列名,或者不设置使用1234序列作为默认列名。

na_values用来设置非浮点情况下的默认设置浮点为NaN的值。

import pandas as pd

csv1 = pd.read_csv("d:/000063.csv", encoding="gbk")
print(csv1)
csv2 = pd.read_csv("d:/000063.csv", encoding="gbk", index_col=0)
print(csv2)
csv3 = pd.read_csv("d:/000063.csv", encoding="gbk", index_col="date")
print(csv3)
csv4 = pd.read_csv("d:/000063.csv", encoding="gbk", index_col="date", parse_dates=True)
print(csv4)
csv5 = pd.read_csv("d:/000063.csv", encoding="gbk", index_col="date", parse_dates=["date"])
print(csv5)
print(csv5.index)
csv6 = pd.read_csv("d:/000063.csv", encoding="gbk", header=None)
print(csv6)
csv7 = pd.read_csv("d:/000063.csv", encoding="gbk", header=None, names=list("abcdefg"))
csv7 = pd.read_csv("d:/000063.csv", encoding="gbk", na_values=["None"])

写入csv方法

    我们使用to_csv方法将内容写入csv文件中,可以使用header参数指定是否写入表头,使用index参数指定是否写入索引,使用na_rep参数指定空的时候写入单元格的内容。

    我们可以使用to_html方法将数据保存到html文件中,使用to_json方法将数据保存到json文件中。

    可以使用pd.read_*?查看可以读取的文件类型。

    可以使用pd.to_*?查看可以保存的文件类型。

import pandas as pd

csv1 = pd.read_csv("d:/000063.csv", encoding="gbk")
print(csv1)
csv1.to_csv("d:/my063.csv", header=False, index=False)
csv1.to_csv("d:/my063.csv", header=False, index=False, na_rep='null')
csv1.to_html("d:/my063.html")
csv1.to_json("d:/my063.json")
pd.read_*?

 

 

如果您喜欢这篇文章,别忘了点赞和评论哦!

上一篇:Kafka Kerberos多端口访问


下一篇:java – 如何通过OSGI包中的kerberos与hdfs连接