pandas库pd.read_excel常用参数设置

pd.read_excel(path, skiprows, nrows, header)

参数解析:

  • path:表示路径
  • header:指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header=None;
  • skiprows:省略指定行数的数据。如:pd.read_excel(path, skiprows = 2)表示省略前两行的数据(无论是带表头还是不带表头),都从第三行开始读数。
  • nrows:用在数据量非常大的时候,直接用这个属性来取一个大文件中的某几行数据。
    pd.read_excel(path, skiprows = 0, nrows=80)表示不跳过任何行,取前80行的数据;
    pd.read_excel(path, skiprows = 80, nrows=20)表示跳过前80行,取剩下20行的数据。
    pd.read_excel(path, skiprows = 0, nrows=100)表示不跳过,读取全部数据。

注意:

  1. nrows和skiprows结合使用时,先执行skiprows ,再用nrows取数,而且在代码pd.read_excel()中nrows和skiprows的书写顺序不影响执行顺序。
  2. 就是 header和name属性,都是在其他的属性执行完后
    比如skiprows跳完之后,在跳完行之后的数据上,决定表头。
上一篇:Linux开机流程


下一篇:利用Python实现自动化办公之Excel简单操作