常用模块 - openpyxl模块

一、简介

  xlrd/xlwt

  主要是针对Office 2003或更早版本的XLS文件格式

  缺点:不支持XLSX文件格式

  OpenPyXL

  能读能写能修改

  缺点:不支持XLS

  Microsoft Excel API

  强大无极限

  缺点:速度慢

二、基本用法

  首先介绍下Excel的一些基本概念,Workbook相当于是一个文件,WorkSheet就是文件里面的每个具体的表,比如新建Excel文件里面的“Sheet1”,一个Workbook里面有一个或多个WorkSheet。

  2.1操作Workbook对象

  获取Workbook对象的方法有两种,一种是创建一个新的,一种是导入一个已经存在的。

  2.1.1获取Workbook对象

  方法1:创建Workbook

# 导入模块
from openpyxl import Workbook
# 创建一个Workbook
wb = Workbook() // 默认生成一个名为'Sheet'的WorkSheet

  方法2:导入Workbook

# 导入模块
from openpyxl import load_workbook
# 导入一个Workbook
wb = load_workbook(filename='test.xlsx')

  2.1.2Workbook属性

sheetnames: 返回所有WorkSheet的名字列表,类型为list
worksheets: 返回所有WorkSheet的列表,类型为list
active: 返回当前默认选中的WorkSheet

  2.1.3Workbook方法

get_sheet_names(): 同sheetnames
get_active_sheet(): 同active属性
get_sheet_by_name(name): 根据名称获取WorkSheet
remove(worksheet): 删除一个WorkSheet,注意是WorkSheet对象,不是名字
save(filename): 保存到文件,记住有写入操作记得保存。

  2.2操作WorkSheet

  2.2.1获取WorkSheet对象

# 获取默认打开的(active)的WorkSheet
ws1 = wb.active
# 创建一个WorkSheet
ws2 = wb.create_sheet() # 可传title和index两个参数,不传生成的WorkSheet名在'Sheet'后面递增加数字
# 通过名称获取WorkSheet
ws3=wb['Sheet1']

  2.2.2WorkSheet属性

rows: 返回所有有效数据行,有数据时类型为generator,无数据时为tuple
columns: 返回所有有效数据列,类型同rows
max_column: 有效数据最大列
max_row: 有效数据最大行
min_column: 有效数据最小列,起始为1
min_row: 有效数据最大行,起始为1
values: 返回所有单元格的值的列表,类型为tuple
title: WorkSheet的名称

  2.2.3WorkSheet方法

cell(coordinate=None, row=None, column=None, value=None): 获取指定单元格或设置单元格的值,具体使用在cell下面介绍

  2.3操作Cell

  2.3.1获取Cell对象

# 使用WorkSheet的Cell方法
c1 = ws.cell('A1')
c2 = ws.cell(row=1, column=1)  # 获取A1单元格
# 通过坐标获取Cell
c3 = ws['A1']
# 获取多个
c3 = ws['A1:E5']  # 返回多行数据,类型为tuple

  2.3.2设置Cell的值

# 直接使用WorkSheet的cell方法设置
ws.cell(row=1, column=1, value=10)
# 设置Cell对象value属性
c1 = ws.cell('A1')
c1.value = 100

  2.3.3Cell属性

column: 所在列,起始为1
row: 所在行,起始为1
coordinate:  所在坐标,如'A1'
parent: 所属的WorkSheet
value: 单元格的值

  2.3.4Cell方法

offset(row=0, column=0): 偏移

三、使用实例

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : mayi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2019/04/25
# Name     : my_excel_model
# Software : PyCharm
# Note     : 功能:使用openpyxl模块处理Excel文件

import os
from openpyxl import load_workbook
from openpyxl import Workbook

def getExcelConOpenpyxl(file_name, book_name=None, data_type="list", index=1):
    """
    利用openpyxl模块获取Excel表中的内容
    :param file_name: Excel表文件名
    :param book_name: Sheet表名
    :param data_type: 列表中存储每行内容的方式(list或dict),默认为列表
    :param index: sheet的序号或者名字,默认处理第一个sheet
    :return: Excel表中的内容
    """
    # 打开一个xlsx文件
    wb = load_workbook(file_name)
    # 打开指定的sheet
    # sheet = wb.get_sheet_by_name("名单")
    # sheet = wb["名单"]
    if not book_name:
        sheet = wb.active
    else:
        sheet = wb.get_sheet_by_name(book_name)
    # 用于存储Excel表内容的列表
    excel_con_list = []
    # 获取所有内容
    line_list = sheet.rows
    # 第一行为表头
    field_list = next(line_list)
    for line in line_list:
        if data_type == "dict":
            # 字典
            temp_line_dict = {}
            for i, cell in enumerate(line):
                cell_key = field_list[i].value
                cell_value = cell.value
                temp_line_dict[cell_key] = cell_value
            excel_con_list.append(temp_line_dict)
        else:
            # 列表
            temp_line_list = []
            for i, cell in enumerate(line):
                cell_key = field_list[i].value
                cell_value = cell.value
                temp_line_list.append([cell_key, cell_value])
            excel_con_list.append(temp_line_list)

    # 关闭文档
    wb.close()

    return excel_con_list

def setExcelConOpenpyxl(file_name, con_list, field_list=None, book_name=None, model=None):
    """
    利用openpyxl模块将列表中的内容存储至Excel表中
    :param file_name: Excel表文件名
    :param con_list: 需要保存的列表信息
    :param field_list: 表头内容
    :param book_name: Sheet表名称
    :param model: 模板文件名(默认没有模板)
    :return: None
    """
    if model:
        # 如果有模板文件,则打开模板工作簿
        wb = load_workbook(model)
    else:
        # 否则,新建一个Excel工作簿
        wb = Workbook()
    # 激活工作表
    sheet = wb.active
    if not book_name:
        sheet.title = book_name
    if field_list:
        # 如果有设置表头的话
        # 列数
        n_col = len(field_list)
        for i_col in range(n_col):
            sheet.cell(row=1, column=i_col + 1, value=field_list[i_col])
    # 行数
    n_row = len(con_list)
    for i in range(n_row):
        # 列数
        n_col = len(con_list[i])
        for j in range(n_col):
            sheet.cell(row=2 + i, column=j + 1, value=con_list[i][j])

    if not os.path.exists(os.path.dirname(file_name)):
        # 如果文件所在目录不存在,则创建
        os.makedirs(os.path.dirname(file_name))

    # 文档另存为
    wb.save(file_name)
    # 关闭文档
    wb.close()

# 入口函数
if __name__ == '__main__':
    filename = "test.xlsx"
    con_list = getExcelConOpenpyxl(filename)
    print(con_list)
    filename = os.path.abspath("test_w.xlsx")
    field_list = ["序号", "姓名", "性别", "年龄"]
    con_list = [
        [1, "张三", "男", "20"],
        [2, "李四", "女", "21"],
        [3, "王五", "男", "19"],
        [4, "麻六", "女", "24"],
        [5, "田七", "男", "23"],
    ]
    setExcelConOpenpyxl(filename, con_list, field_list, book_name="名单")

注意:

  ·Cell的row和column都是从1开始的

  ·文件操作完记得调用Workbook的save()方法

  ·最好记得调用Workbook的close()方法

上一篇:如何使用Pandas在现有的Excel文件中保存新工作表?


下一篇:python – 如何在保留图表的同时使用XLRD或openpyxl编辑Excel工作簿?