Python 3 Office文档格式转换

上次讲到,要快速提取word与excel文件中的图片,有一个前提条件,那就是操作的目标文件扩展名必须是要为.docx\.xlsx才可以。这次我们用Python 3来实现.doc\.xls文件自动转换为.docx\.xlsx。



Python 3实现代码






import win32com.client as win32  # 引入win32com库(win32com功能强大,可以操作word、调用宏等等等)import os                        # 引入os库(文件及目录操作)
#自定义xls转xlsx功能函数def xls_xlsx(fname):    excel = win32.gencache.EnsureDispatch('Excel.Application')    xls = excel.Workbooks.Open(fname)       # 目标路径下的文件    xls.SaveAs(fname+'x', FileFormat = 51)    #51为xlsx 56为xls    xls.Close()                             #关闭资源    excel.Application.Quit()                #退出Excel    os.remove(fname)                        #删除原Excel文件 #自定义doc转docx功能函数def doc_docx(fname):    word = win32.Dispatch('Word.Application')    doc = word.Documents.Open(fname)  # 目标路径下的文件    doc.SaveAs(fname+'x', 16)  # 16为xlsx文件格式    doc.Close()                 #关闭资源    word.Quit()                 #退出word    os.remove(fname)           #删除原Word文件
if __name__=="__main__":        #主程序入口    xls_xlsx('xx\xx\xx.xls')    #调用xlsx转换函数    doc_docx('xx\xx\xx.doc')    #调用docx转换函

以上是功能实现的Pyhton 3源代码,感兴趣的小伙伴可以自己动手尝试一下。


上一篇:如何将 md 文件转为 docx 格式 (Typora)


下一篇:语法:赖氏经典英语语法.docx