python使用openpyxl获取合并单元格的值

问题

假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:

python使用openpyxl获取合并单元格的值

要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值

 

如果直接根据行列获取对应单元格的值,则合并单元格非左上角的其他单元格都会获取到None值,如下:

if __name__ == "__main__":
    wb = xl.load_workbook("test.xlsx")
    sheet_ = wb["Sheet1"]
    print(sheet_["A1"].value)  # 1
    print(sheet_["A2"].value)  # None
    print(sheet_["D1"].value)  # 8
    print(sheet_["D2"].value)  # None
    print(sheet_["D3"].value)  # None

 

解决思路

获取到对应单元格后,判断该单元格是否为合并单元格,如果是,则找到该合并区域并获取左上角的值返回。

 

通过 sheet.merged_cell_ranges属性,可以获取当前工作表所有的合并区域列表:

测试代码:

if __name__ == "__main__":
    wb = xl.load_workbook("test.xlsx")
    sheet_ = wb["Sheet1"]
    merged_ranges = sheet_.merged_cell_ranges  # 获取当前工作表的所有合并区域列表
    for merged_range in merged_ranges:
        print(type(merged_range))  # 打印区域对象类型
        print(merged_range)  # 打印区域

结果如下:

python使用openpyxl获取合并单元格的值

 

 我们巡着openpyxl.worksheet.merge.MergedCellRange查找其源码,发现定义了in操作,可以直接通过in确认某个坐标是否位于区域内

python使用openpyxl获取合并单元格的值

 

这时候我们已经基本具备获取合并单元格的条件了。

完整代码如下:

import openpyxl as xl
from openpyxl.worksheet.worksheet import Worksheet
from openpyxl.cell import MergedCell


def parser_merged_cell(sheet: Worksheet, row, col):
    """
    检查是否为合并单元格并获取对应行列单元格的值。
    如果是合并单元格,则取合并区域左上角单元格的值作为当前单元格的值,否则直接返回该单元格的值
    :param sheet: 当前工作表对象
    :param row: 需要获取的单元格所在行
    :param col: 需要获取的单元格所在列
    :return: 
    """
    cell = sheet.cell(row=row, column=col)
    if isinstance(cell, MergedCell):  # 判断该单元格是否为合并单元格
        for merged_range in sheet.merged_cell_ranges:  # 循环查找该单元格所属的合并区域
            if cell.coordinate in merged_range:
                # 获取合并区域左上角的单元格作为该单元格的值返回
                cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col)
                break
    return cell


if __name__ == "__main__":
    wb = xl.load_workbook("test.xlsx")
    sheet_ = wb["Sheet1"]

    for row_index in range(1, 4):
        for col_index in range(1, 5):
            cell_ = parser_merged_cell(sheet_, row_index, col_index)
            print("第%s行第%s列:%s" % (row_index, col_index, cell_.value))

结果如下:

第1行第1列:1
第1行第2列:2
第1行第3列:3
第1行第4列:8
第2行第1列:1
第2行第2列:4
第2行第3列:5
第2行第4列:8
第3行第1列:6
第3行第2列:7
第3行第3列:7
第3行第4列:8

 

上一篇:Python操作Excel之Openpyxl模块


下一篇:Python自动化测试系列[v1.0.0][数据驱动DDTEXCEL]