一、需要用到的库:
1.操作xls格式的表格文件:
读取:xlrd
写入:xlwt
修改(追加写入):xlutils
2.操作xlsx格式的表格文件:
读取/写入:openpyxl
二、实现代码
1.操作xls格式的表格文件:
# coding=UTF-8 import xlrd import xlwt from xlutils.copy import copy def write_excel_xls(path, sheet_name, value): index = len(value) # 获取需要写入数据的行数 workbook = xlwt.Workbook() # 新建一个工作簿 sheet = workbook.add_sheet(sheet_name) # 在工作簿中新建一个表格 for i in range(0, index): for j in range(0, len(value[i])): sheet.write(i, j, value[i][j]) # 像表格中写入数据(对应的行和列) workbook.save(path) # 保存工作簿 print("xls格式表格写入数据成功!") def write_excel_xls_append(path, value): index = len(value) # 获取需要写入数据的行数 workbook = xlrd.open_workbook(path) # 打开工作簿 sheets = workbook.sheet_names() # 获取工作簿中的所有表格 worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格 rows_old = worksheet.nrows # 获取表格中已存在的数据的行数 new_workbook = copy(workbook) # 将xlrd对象拷贝转化为xlwt对象 new_worksheet = new_workbook.get_sheet(0) # 获取转化后工作簿中的第一个表格 for i in range(0, index): for j in range(0, len(value[i])): new_worksheet.write(i+rows_old, j, value[i][j]) # 追加写入数据,注意是从i+rows_old行开始写入 new_workbook.save(path) # 保存工作簿 print("xls格式表格【追加】写入数据成功!") def read_excel_xls(path): workbook = xlrd.open_workbook(path) # 打开工作簿 sheets = workbook.sheet_names() # 获取工作簿中的所有表格 worksheet = workbook.sheet_by_name(sheets[0]) # 获取工作簿中所有表格中的的第一个表格 for i in range(0, worksheet.nrows): for j in range(0, worksheet.ncols): print(worksheet.cell_value(i, j), "\t", end="") # 逐行逐列读取数据 print() book_name_xls = 'xls格式测试工作簿.xls' sheet_name_xls = 'xls格式测试表' value_title = [["姓名", "性别", "年龄", "城市", "职业"],] value1 = [["张三", "男", "19", "杭州", "研发工程师"], ["李四", "男", "22", "北京", "医生"], ["王五", "女", "33", "珠海", "出租车司机"],] value2 = [["Tom", "男", "21", "西安", "测试工程师"], ["Jones", "女", "34", "上海", "产品经理"], ["Cat", "女", "56", "上海", "教师"],] write_excel_xls(book_name_xls, sheet_name_xls, value_title) write_excel_xls_append(book_name_xls, value1) write_excel_xls_append(book_name_xls, value2) read_excel_xls(book_name_xls)
2.操作xlsx格式的表格文件:
# coding=UTF-8 import openpyxl def write_excel_xlsx(path, sheet_name, value): index = len(value) workbook = openpyxl.Workbook() sheet = workbook.active sheet.title = sheet_name for i in range(0, index): for j in range(0, len(value[i])): sheet.cell(row=i+1, column=j+1, value=str(value[i][j])) workbook.save(path) print("xlsx格式表格写入数据成功!") def read_excel_xlsx(path, sheet_name): workbook = openpyxl.load_workbook(path) # sheet = wb.get_sheet_by_name(sheet_name)这种方式已经弃用,不建议使用 sheet = workbook[sheet_name] for row in sheet.rows: for cell in row: print(cell.value, "\t", end="") print() book_name_xlsx = 'xlsx格式测试工作簿.xlsx' sheet_name_xlsx = 'xlsx格式测试表' value3 = [["姓名", "性别", "年龄", "城市", "职业"], ["111", "女", "66", "石家庄", "运维工程师"], ["222", "男", "55", "南京", "饭店老板"], ["333", "女", "27", "苏州", "保安"],] write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value3) read_excel_xlsx(book_name_xlsx, sheet_name_xlsx)
三、运行结果
image.png image.png image.png但是我们会发现在读取xlsx格式的Excel时,传入formatting_info会直接抛出异常,而读取xls类型的文件时不存在此问题。
raise NotImplementedError("formatting_info=True not yet implemented")
不难推断,抛异常的原因是formatting_info还没有对新版本的xlsx的格式完成兼容。
那么如果我们要操作的文件刚好是xlsx格式,又想保存其原有的格式该怎么办呢?
解决方法
1、修改为xlsx为xls(推荐)
将xlsx另存为xls,然后再进行后续操作,亲测有效,能正常保存Excel原有格式, 不用修改代码。
2、改用 openpyxl
coding尝试读取文件,处理速度真的很慢...而且规则和宏全部丢失。
3、使用pywin32
这是用于Win32 (pywin32)扩展的Python扩展库,它提供了对许多来自Python的Windows api的访问。
4、使用老旧的版本 xlrd-0.6.1
使用xlrd-0.6.1可以读取,没有异常抛出。直到我传入其他几个xls文件,出现Expected BOF record; found 0x4b50 错误,原因是xlrd-0.6.1不支持office2007
参考资料:
http://blog.sina.com.cn/s/blog_5e574c030101an5s.html
https://blog.csdn.net/erlang_hell/article/details/51992928
https://github.com/mhammond/pywin32