第六章:加载和存储数据(pandas)
常见的读取方法:
- read_csv()
- read_table()
读取的时候会自动为行进行编号。并且会以第一行当作对列的编号,因此如果第一行如果是数据的话,我们应该指定不要自动为列进行编号。
read_csv('xxxx',header=None)
那么问题又来了:
- 如果我们需要指定列的编号怎么办?
- 如果原始数据中包含了对行的编号怎么办?
解决方法:
-
我们可以通过
name
属性指定列的编号. -
在上面对列进行编号的基础上,我们可以通过
index_col
属性指定行的编号,可以通过数字下标(按顺序)也可以通过name
中指定的名称。names = ['a','b','c','d','message'] pd.read_csv('examples/ex2.csv',names=names,index_col='message')
上述做法先对
ex2
的每个列进行编号,然后把message拿出来作为行的编号