xlsx文件的多表读取与写入 目录
前言
在本篇中,你将掌握
- 含有多表数据的xlsx文件的读取
- 对多表xlsx文件的单表进行修改并写入多表xlsx文件
1 xlsx文件的多表读取与操作
1.1 安装、导入所需库
!pip install openpyxl
import pandas as pd
import numpy as np
1.2 读取xlsx文件
xls = pd.ExcelFile ('城市分等级标签.xlsx')
1.3 多表读取
df1 = xls.parse( '一线城市(4个)' )
df2 = xls.parse( '新一线城市(15个)' )
df3 = xls.parse( '二线城市(30个)' )
df4 = xls.parse( '三线城市(60个)' )
df5 = xls.parse( '四线城市(76个)' )
2 xlsx文件的单表修改与多表写入
2.1 单表修改
df1['wind'] = df1['风力风向'].apply(label)
df2['wind'] = df2['风力风向'].apply(label)
df3['wind'] = df3['风力风向'].apply(label)
df4['wind'] = df4['风力风向'].apply(label)
df5['wind'] = df5['风力风向'].apply(label)
2.2 多表写入
writer=pd.ExcelWriter('label_5files.xlsx')
df1.to_excel(writer,sheet_name='一线城市(4个)',index=False)
df2.to_excel(writer,sheet_name='新一线城市(15个)',index=False)
df3.to_excel(writer,sheet_name='二线城市(30个)',index=False)
df4.to_excel(writer,sheet_name='三线城市(60个)',index=False)
df5.to_excel(writer,sheet_name='四线城市(76个)',index=False)
writer.save()
小结
对于含有多个表格的xlsx文件表格数据,只需pandas读取即可
xls = pd.ExcelFile ('城市分等级标签.xlsx')
从多表xlsx文件解析出单个表格,只需xls.parse(‘对应的表格标签’),之后的单表修改和一般的DataFrame无区别
df1 = xls.parse( '一线城市(4个)' )
df2 = xls.parse( '新一线城市(15个)' )
df3 = xls.parse( '二线城市(30个)' )
df4 = xls.parse( '三线城市(60个)' )
df5 = xls.parse( '四线城市(76个)' )
多表写入,首先指定写入文件地址,之后将多个单表依次加至文件,并通过sheet_name参数指定表格标签
writer=pd.ExcelWriter('label_5files.xlsx')
df1.to_excel(writer,sheet_name='一线城市(4个)',index=False)
df2.to_excel(writer,sheet_name='新一线城市(15个)',index=False)
df3.to_excel(writer,sheet_name='二线城市(30个)',index=False)
df4.to_excel(writer,sheet_name='三线城市(60个)',index=False)
df5.to_excel(writer,sheet_name='四线城市(76个)',index=False)
writer.save()