xlsx文件的多表读取与写入

xlsx文件的多表读取与写入 目录


前言

在本篇中,你将掌握

  • 含有多表数据的xlsx文件的读取
  • 对多表xlsx文件的单表进行修改并写入多表xlsx文件

1 xlsx文件的多表读取与操作

1.1 安装、导入所需库

!pip install openpyxl

import pandas as pd
import numpy as np

1.2 读取xlsx文件

xls = pd.ExcelFile ('城市分等级标签.xlsx')

1.3 多表读取

df1 = xls.parse( '一线城市(4个)' )
df2 = xls.parse( '新一线城市(15个)' )
df3 = xls.parse( '二线城市(30个)' )
df4 = xls.parse( '三线城市(60个)' )
df5 = xls.parse( '四线城市(76个)' )

xlsx文件的多表读取与写入

2 xlsx文件的单表修改与多表写入

2.1 单表修改

df1['wind'] = df1['风力风向'].apply(label)
df2['wind'] = df2['风力风向'].apply(label)
df3['wind'] = df3['风力风向'].apply(label)
df4['wind'] = df4['风力风向'].apply(label)
df5['wind'] = df5['风力风向'].apply(label)

xlsx文件的多表读取与写入

2.2 多表写入

writer=pd.ExcelWriter('label_5files.xlsx')
df1.to_excel(writer,sheet_name='一线城市(4个)',index=False)
df2.to_excel(writer,sheet_name='新一线城市(15个)',index=False)
df3.to_excel(writer,sheet_name='二线城市(30个)',index=False)
df4.to_excel(writer,sheet_name='三线城市(60个)',index=False)
df5.to_excel(writer,sheet_name='四线城市(76个)',index=False)
writer.save()
小结

对于含有多个表格的xlsx文件表格数据,只需pandas读取即可

xls = pd.ExcelFile ('城市分等级标签.xlsx')

从多表xlsx文件解析出单个表格,只需xls.parse(‘对应的表格标签’),之后的单表修改和一般的DataFrame无区别

df1 = xls.parse( '一线城市(4个)' )
df2 = xls.parse( '新一线城市(15个)' )
df3 = xls.parse( '二线城市(30个)' )
df4 = xls.parse( '三线城市(60个)' )
df5 = xls.parse( '四线城市(76个)' )

多表写入,首先指定写入文件地址,之后将多个单表依次加至文件,并通过sheet_name参数指定表格标签

writer=pd.ExcelWriter('label_5files.xlsx')
df1.to_excel(writer,sheet_name='一线城市(4个)',index=False)
df2.to_excel(writer,sheet_name='新一线城市(15个)',index=False)
df3.to_excel(writer,sheet_name='二线城市(30个)',index=False)
df4.to_excel(writer,sheet_name='三线城市(60个)',index=False)
df5.to_excel(writer,sheet_name='四线城市(76个)',index=False)
writer.save()
上一篇:爬虫---post---ajax--- 复杂get


下一篇:python爬虫系列(1.1-urllib模块常用方法的介绍)