python实现把doc文件批量转化为docx
import os
from win32com import client as wc
def doSaveAas(doc_path,docx_path):
#该函数参考https://blog.****.net/m0_38074612/article/details/128985384
word = wc.Dispatch('Word.Application')
doc = word.Documents.Open(doc_path) # 目标路径下的文件
doc.SaveAs(docx_path, 12, False, "", True, "", False,
False, False, False) # 转化后路径下的文件
doc.Close()
word.Quit()
def all_doc_files_recursive(folder_path):
# 检查文件夹路径是否存在
if not os.path.exists(folder_path):
print(f"错误:文件夹 '{folder_path}' 不存在。")
return
# 遍历文件夹及其所有子文件夹中的文件
for root, dirs, files in os.walk(folder_path):
for filename in files:
# 检查文件是否为doc文件
if filename.endswith('.doc'):
doc_file_path = os.path.join(root, filename)#原doc文件名
docx_path=os.path.join(root, filename[:-4])+'.docx'#新docx文件名
try:
if not os.path.exists(docx_path):
doSaveAas(doc_file_path,docx_path)
print(f"将 '{filename}' 转化为了docx格式'")
# os.remove(doc_file_path)
except:
print(f"文件 '{filename}' 转化失败'")
folder_path=r'D:\path'
all_doc_files_recursive(folder_path)