python处理word和excel表格数据
学习过程中遇到批量将excel表格数据填入到word的问题,对于excel的函数使用不是很熟悉,python中有处理word和excel的库,所以学习使用python实现对数据的批量处理。首先是需要了解处理word和excel的具体操作。
python对编辑word表格
需要安装第三方库python-docx
python-docx API网址:https://python-docx.readthedocs.io/en/latest/#api-documentation
对表格的基本操作
# -*- coding: utf-8 -*-
from docx import Document
from docx.enum.text import WD_ALIGN_PARAGRAPH
from docx.oxml.ns import qn
from docx.shared import Pt
path=r'C:\Users\hxy\Desktop\test.docx'#文件路径
doc=Document(path)#读入文件
#设置表格字体
doc.styles['Normal'].font.name = u'仿宋'
doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋')
#获取所有的表格,返回列表
tables=doc.tables
print(tables)
#读取第一个表格的内容,获取全部的表格内容加个循环即可
table_1=tables[0]#第一个表
tb_rows=table_1.rows#获取表格的行
#读取每一行内容s
for i in range(len(tb_rows)):
row_data=[]
row_cells=tb_rows[i].cells
#读取每一行单元格内容
for cell in row_cells:
#单元格内容
row_data.append(cell.text)
print(row_data)
#数据填入表格,两种方式
table_1.cell(0,1).text="测试使用"#单元格直接赋值
table_1.cell(0,3).paragraphs[0].add_run(u'whoami')#追加写入数据
#单元格的属性修改
run=table_1.cell(0,5).paragraphs[0].add_run("计算机")
run.bold=True#字体加粗
run.font.size = Pt(9) # 字体大小:小五-9
table_1.cell(0,5).paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER # 居中
doc.save(path)#文件保存
python对excel表格的读写操作
python实现对excel表格的操作有xlrd(只能读入,不能写)、xlwd,openpyxl模块能够实现对excel的读写操作。
xlrd和xlwt都是针对Excel97-2003操作的,也就是以xls结尾的文件。很显然现在基本上都是Excel2007以上的版本,以xlsx为后缀。要对这种类型的Excel文件进行操作要使用openpyxl,该模块既可以进行“读”操作,也可以进行“写”操作,还可以对已经存在的文件做修改。
xlrd网址:https://pypi.org/project/xlrd/
xlrd模块读取excel表格
# -*- coding: utf-8 -*-
import xlrd
excelDir=r'C:\Users\hxy\Desktop\test.xlsx'
# 打开表格
workbook=xlrd.open_workbook(excelDir)
# 获取表名
worksheet_name=workbook.sheet_names()
print(worksheet_name)
# 根据序号打开表
worksheet=workbook.sheet_by_index(0)
# 获取表的名称,行,列
print(worksheet.name,worksheet.nrows,worksheet.ncols)
# 获取第一行
rows=worksheet.row_values(0)
print(rows)
# 获取单元格的值
data_1=worksheet.cell_value(1,7)
data_2=worksheet.cell(1,0).value
data_3=worksheet.row(1)[2].value
print(data_1,data_2,data_3)
# print(worksheet.cell(1,2))
#读取指定工作表的表格内容
for i in range(worksheet.nrows):
row=worksheet.row_values(i)
print(row)
openpyxl网址:https://bitbucket.org/openpyxl/openpyxl/src/default/
使用openpyxl读取和写入excel
import openpyxl
excelDir=r'C:\Users\hxy\Desktop\test.xlsx'
#打开工作簿对象
workbook=openpyxl.load_workbook(excelDir)
#获取工作簿中的所有表
sheetnames=workbook.sheetnames
print(sheetnames)
#获取工作表对象
# sheetname=workbook[sheetnames[0]]
sheetname=workbook.worksheets[0]
print(sheetname)
#获取表的属性
name=sheetname.title
print(name)
rows,cols=sheetname.max_row,sheetname.max_column
print(rows,cols)
#按行或列方式获取表中的数据
for row in sheetname.rows:
for cell in row:
print(cell.value,end=" ")
print()
print("=="*30)
for col in sheetname.columns:
for cell in col:
print(cell.value,end=" ")
print()
#获取指定单元个的数据
data1=sheetname.cell_value(0,0)
data2=sheetname.cell(0,1).value
print(data1,data2)
# 插入一列
sheetname.insert_cols(1)
for index,row in enumerate(sheetname.rows):
if index==0:
row[0].value="编号"
else:
row[0].value=index
#可以插入列表数据
data=[10,"llc",'whoami','hellowordl']
sheetname.append(data)
#保存
workbook.save(filename=excelDir)
print('finish')
批量操作数据
因为数据格式是相同的,只是填入的数据不同,所以可以通过docx和xlrd对表格的基本操作,可以实现对数据的批量处理。首先使用xlrd将数据读取到列表中,然后将列表的数据填入指定的表格中。
这里只是对word和excel的基本操作,能够完成目前所需。另外设置单元格格式,设置数据格式等更多的操作还有待学习。