项目四:数据获取:合并excel

合并excel

点击跳转到总目录
本篇只记录程序点击跳转项目

直接上代码

  • 可以自动合并一个文件夹下所有xlsx,亲测可用
# 下面这些变量需要您根据自己的具体情况选择
# ['岗位名称','公司全名','备注','薪资','年薪','工作地点','学历要求','工作年限']
import os
import pandas as pd
import xlrd
#  注意这里的 xlsx 文件内容不同(如果相同的话合并干嘛) 但格式是一样的
#  每个文件一个只有 sheet1 有内容 其他地方空白
#  在 path 下 找出所有符合要求的文件
def file(path):
    name = []  # 存放符合要求的 xlsx 文件
    a = os.listdir(path)  #  找出所有的文件
    for b in  a:
        if os.path.splitext(b)[1] == ".xlsx" :  # 利用分割判断 结尾
            name.append(b) # 将符合要求的文件 放入定义的列表 并返回
    return name

lj = r'E:\百度网盘下载\0备份'  #  存放文件夹的 路径
c = file(lj)
data = []
for i in c:
    # 循环符合要求的文件
    text = xlrd.open_workbook(lj + "\\" + i)  # 将循环 读出  放入变量
    sheet1 = text.sheets()[0]  # xlsx文件中 内容都在 sheet1  中
    hang =  sheet1.nrows # 行数
    # title = sheet1.row_values(0) #  两个文件的 表头一样
    title = ['岗位名称','公司全名','备注','薪资','年薪','工作地点','学历要求','工作年限']
    for g in range(0,hang):
        data.append(sheet1.row_values(g))

content = pd.DataFrame(data) # 转换格式
content.columns = title
content.to_excel(lj + "\\" + "new.xlsx",index=None,encoding='utf-8')   #  给合并后的文件重新命名
print("文件合并完成")

上一篇:R使用经验


下一篇:xlwings读取一整个excel文件xlsx的第一sheet到pandas.DataFrame的方法