Pyhon处理两个Excel表格索引关系

大家有没有遇到一种情况:咱们有两个表,一个表里面是索引,另一个表里是数据?

其实遇到这种情况咱们第一时间想到的肯定是直接使用Excel里面替换功能不就行了吗?

但是,假如多个索引对应一个值呢?就比如1和2或者更多都对应黑龙江?

假如数据非常的庞大,需要对应的数据非常多呢?

Pyhon处理两个Excel表格索引关系

其中区站号就是我们需要对应的,橙子是在写论文的时候遇到这个问题,真的很苦恼,总共有296个需要修改的表格,每个表格里面都有上万条数据。一个一个搞真的很头疼。

但是我们举例的话还是用比较简单的例子吧,更好懂一点

现在我们有两个表格,一个是对应模板,一个是需要修改。

Pyhon处理两个Excel表格索引关系

 

现在,我们的任务就是将编号那一列替换为姓名那一列。

首先是思路:

第一步:取出表格内所有的数据

Pyhon处理两个Excel表格索引关系

第二步:取出需要修改.xlsx中的编号一列

Pyhon处理两个Excel表格索引关系

第三步:将对应模板.xlsx中的数据用dict形式取出来

Pyhon处理两个Excel表格索引关系

第四步:将上两步中的数据对应形成一个list

Pyhon处理两个Excel表格索引关系

Pyhon处理两个Excel表格索引关系

最后一步:写入Excel

Pyhon处理两个Excel表格索引关系

所有代码如下:

import xlrd
import openpyxl
def getAll(inpath):
data = xlrd.open_workbook(inpath, encoding_override='utf-8')
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
listall = []
for i in range(1, nrows): # 第0行为表头
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
listall.append(alldata)
return listall
def extract(inpath):
list0=[]
data = xlrd.open_workbook(inpath, encoding_override='utf-8')
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号
for i in range(1, nrows): # 第0行为表头
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata[0]
list0.append(result)
print(list0)
return list0
def extract2(inpath2):
list0=[]
list1=[]
data = xlrd.open_workbook(inpath2, encoding_override='utf-8')
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号

for i in range(1, nrows): # 第0行为表头
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata[0] # 取出表中第一列数据
list0.append(result)
result2 = alldata[1]
list1.append(result2)
dict1=dict(zip(list0,list1))
print(dict1)
return dict1
def data_write(listh, dataz,path2):
file1 = openpyxl.Workbook()
outws = file1.create_sheet(index=0) # 创建sheet
outws.append(listh)
for i in dataz:
outws.append(i)
file1.save(path2)
if __name__ == '__main__':
inpath = 'E:/Desktop/实验/需要修改.xlsx' # excel文件所在路径
inpath1='E:/Desktop/实验/对应模板.xlsx'
listall=getAll(inpath)
list1=extract(inpath)
dict1=extract2(inpath1)
list2=[]
for i in list1:
if i in dict1:
list2.append(dict1[i])
else:
list2.append(i)
print(list2)

for i in range(len(list2)):
listall[i][0]=list2[i]
print(listall)
listh0=["姓名","年龄","语文","数学","英语"]
path2="E:/Desktop/实验/"+"1"+".xlsx"
data_write(listh0,listall,path2)

 

最后:

欢迎关注公众号寻船人,后台回复“索引关系”获取代码及小例子。更多简便小工具小方法橙子都会在公众号分享。一起来寻找更简便的方法吧。

Pyhon处理两个Excel表格索引关系

上一篇:pyhon非线性规划最优资产组合


下一篇:记录jpype在接口自动化中的妙用