Python 处理Excel 文件, openpyxl 库的使用:

下载:

pip install openpyxl

 基本使用:

新建一个Excel 工作簿:

使用openpyxl 需要先导入一个Workbook 类, 使用它可以创建一个Workbook<工作簿>对象, 也就是创建一个Excel表文件, web.active 可用来激活一个工作表. 我们可以使用它创建的 Websheet<工作表> 对象来调用一些属性或者方法, 例如:wb.title 获取或者设置此表格的标题;

from openxl import Workbook

wb = Workbook()


ws = wb.active

ws.title = "Spider"
print(ws.title)

wb.save("test.xlsx")

保存则直接调用创建的 工作簿对象中的 save() 方法即可,需要传递一个路径。

 打开一个Excel 工作簿:

打工作簿使用到openpyxl 提供的 load_workbook 方法即可打开一个工作簿

from openpyxl import Workbook, load_workbook

# 新建一个工作簿
# wb = Workbook()
wb = load_workbook("spider.xlsx")
# 激活此工作簿
ws = wb.active
ws.title = "Spider_Demo"
print(ws.title)

wb.save("spider.xlsx")

操作工作表:

 当我们创建出一个工作簿的时候,默认情况下它会自带一个 websheet<工作表>, 我们使用 wb.active 来激活这个默认的工作表就可以获取到 一个 Worksheet 的对象, 如果我们想再增加一个工作表, 则可以调用 Workbook<工作簿> 对象中的create_sheet 方法, 第一个参数传递的是工作表的Title, 第二个参数则是 索引, 这里的索引位置也是从 0 开始的, 对照Excel 表是这样的:

from openpyxl import Workbook


wb = Workbook()
print(type(wb))

# 激活默认的工作表
ws1 = wb.active
print(type(ws1))

ws2 = wb.create_sheet("Sheet2", 1)
ws3 = wb.create_sheet("Sheet3", 2)
#  查看所有工作表
print(wb.sheetnames)

同样的, 如果我们打开了一个 excel 文件,而这个文件中已经存在了 Sheet1   Sheet2  Sheet3 等工作表了, 那么我们可以使用 Workbook 对象,然后使用类似与字典取值的方式来获取一个工作表对象,  例如: ws3 = wb["Sheet3"]    这样会返回一个Websheet 对象。

如果我们想要移动一个工作表到其它的位置,例如:将Sheet3 移动到 Sheet2 的位置。

那么我们可以调用 Workbook 对象提供的 move_sheet() 方法, wb.move_sheet()

此方法第一个参数传递的是一个 Websheet 对象, 第二个参数传递的则是一个数字, 如果传递-1 负数, 则为向前移动一个位置, 如果传递的是正数  1  则为向后移动一个位置, 此形参默认值为 0

from openpyxl import Workbook, load_workbook


# wb = Workbook()
wb = load_workbook("spider.xlsx")

wb.move_sheet("Sheet4", -2)

print(wb.sheetnames)  # ['Sheet1', 'Sheet4', 'Sheet2', 'Sheet3']

单元格:

一个工作簿中至少有一个工作表, 而一个工作表中,则有很多个单元格:

 

 使用 Worksheet 对象则可以对单元格进行一系列的操作, 例如 设置值,或者获取值等等。

打开excel观察一下,可以发现:目前选择的单元格为 第五行 第C 列, C5 单元格。

在程序中,可以使用Worksheet 对象, 来直接指定 c5 来设置值或者获取值, 例如:

ws["c5"] = "xxx",

但是官方不建议这么做, 官方提供了一个 cell() 方法, 用来专门处理单元格操作:

from openpyxl import Workbook

wb = Workbook()

ws = wb.active


cell = ws.cell(6 , 1, "999")

print(cell.value)

wb.save("testtest.xlsx")

而使用 Worksheet 对象调用cell() 方法, 第一个参数传递的是 行, 而第二个参数传递的则是 列, 第三个参数 则是要添加的值, 然后它会返回一个  Cell 对象, 然后就可以调用此对象的属性和方法来进行业务处理了,

例如获取 单元格的值: cell.value     获取坐标: cell.coordinate   获取当前单元个的行: cell.row

获取单元格的列: cell.column  等等

使用for 循环添加行和列:

使用for 循环来创建一个 15 行 10 列的单元格。

from openpyxl import Workbook

wb = Workbook()

ws = wb.active

x = 1

for row in range(1, 15+1):
    for col in range(1, 10+1):

        ws.cell(row, col, x)
        x += 1

wb.save("number.xlsx")

 

 遍历获取单元格内容:

from openpyxl import Workbook

wb = Workbook()

ws = wb.active

x = 1

for row in range(1, 6):
    for col in range(1, 5):

        ws.cell(row, col, x)
        x += 1


print(ws["a:c"]) # 获取 a ~ c 列的单元格内容
 
print(ws[1:3]) # 获取 1 ~ 3 行的单元格内容

print(ws["a1:d4"]) # 获取 a1 ~ d4 的内容

# 遍历 a1 ~ d4 的单元格
for cells in ws["a1:d4"]:
    for cell in cells:
        print(cell.value)


print(ws.iter_rows()) # 获取行
print(ws.iter_cols())  # 获取列

# 按行遍历
for rows in ws.iter_rows():
    for row in rows:
        print(row.value)


# 按列遍历
for cols in ws.iter_cols():
    for col in cols:
        print(col.value)


wb.save("number.xlsx")

查看iter_rows() 和iter_cols() 方法的源码可以看到:

它是可以传递一个最小行,最小列,最大行,最大列的参数的, 如果不传入,则默认获取全部!

操作单元格:

合并单元格:

 调用 Workseet 对象提供的 merge_cells() 和 unmerge_cells() 方法可以完成 合并单元格和取消合并单元格的功能, 但是需要注意的是, 合并后的单元格会将单元格中原有的数据丢失, 只保留最左上角的单元格数据。

# 合并 b2 - d4 的单元格
ws.merge_cells("b2:d4")
# 取消合并
ws.unmerge_cells("b2:d4")

wb.save("test.xlsx")

源码中可以发现, 它同样特工了 start_row 等形参, 分别是开始行, 结束行,开始列,结束列,如果有需要也可以通过这几个形参来控制要合并的 单元格。

 

 插入单元格:

 Workseet 对象提供了insert_cols   insert_rows 两个方法可以完成单元格的插入操作:

ws.insert_cols(2, 3) # 从第二列开始插入3 列单元格


ws.insert_rows(1, 4) # 从第一行开始, 插入4 行单元格

删除单元格:

ws.delete_cols(2, 2) # 从第二列开始,删除2 列单元格


ws.delete_rows(3, 4) # 从第三行开始, 删除 4 行单元格 

 移动单元格:

ws.move_range("c4:d5", 2, -2)  # 选择c4:d5 范围的单元格 向下移动两行 后再向左移动两列

 

上一篇:【续集】Java之父的退休之旅:从软件殿堂到多彩人生的探索


下一篇:linux c 应用编程定时器函数