Python使用Openpyxl库处理Excel数据
前言
excel表中的数据如果是少量的,对其进行简单的修改处理是比较简单的,而涉及多个excel文件的大量的数据比对,并根据数据比对结果进行不同的处理,如此大规模的,处理模式单一的通过人为来处理是相当枯燥且耗费精神的。借助openpyxl库使用python语言可以实现这样的工作。
环境准备
- 配置python环境
- 安装pycharm
- 安装openpyxl库
前两步可参照网上教程。以下主要介绍在pycharm中安装openpyxl
- 点击File-settings
- 选择Python Interpreter
- 搜索openpyxl——Install Package
注:为了使下载更快,可以改为国内的镜像源。如上图所示,点击Manage Repositories
点击”+“添加国内镜像,这里我添加了三个
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学:https://pypi.mirrors.ustc.edu.cn/simple/
openpyxl的使用
打开Excel文档
import openpyxl
wb = openpyxl.load_workbook('test.xlsx')
从Excel中获取Sheet
wb.sheetnames##获取所有的sheet表
sheet = wb['Sheet1']##将表'Sheet1'的内容赋值给变量sheet
sheet.title##获取表名
从Sheet中获取单元格
##方法一
sheet['A1']##通过单元格名字'A1'访问其内容
##方法二
sheet.cell(row=1,column=2).value##通过行列数指定单元格
sheet.max_row##表的行数
sheet.max_column##表的列数
简单应用实例
获取Sheet表的第一列的数据
list1=[]
for i in range(1,sheet.max_row,1):
list1.append(sheet.cell(row=i,column=1).value)
newlist1 = list(set(list1))##去重操作
注:应用方面主要是利用for循环,合理使用python的数据结构进行数据的存储,筛选,更改。更进一步的,通过openpyxl可以实现多个Excel表的之间Sheet的对比和筛查。