第六章:加载和存储数据

第六章:加载和存储数据(pandas)

常见的读取方法:

  1. read_csv()
  2. read_table()

读取的时候会自动为行进行编号。并且会以第一行当作对列的编号,因此如果第一行如果是数据的话,我们应该指定不要自动为列进行编号。
第六章:加载和存储数据

read_csv('xxxx',header=None)

第六章:加载和存储数据

那么问题又来了:

  1. 如果我们需要指定列的编号怎么办?
  2. 如果原始数据中包含了对行的编号怎么办?

解决方法:

  1. 我们可以通过name属性指定列的编号.

  2. 在上面对列进行编号的基础上,我们可以通过index_col 属性指定行的编号,可以通过数字下标(按顺序)也可以通过name中指定的名称。

    names = ['a','b','c','d','message']
    pd.read_csv('examples/ex2.csv',names=names,index_col='message')
    

    第六章:加载和存储数据

    上述做法先对ex2的每个列进行编号,然后把message拿出来作为行的编号

上一篇:sklearn绘制回归树图形


下一篇:1.循环嵌套和对列表的认识