Python:使用python-docx / lxml创建“目录”

我试图在python-docx(https://github.com/mikemaccana/python-docx)的帮助下自动创建.docx文件(WordML).我当前的脚本使用以下循环手动创建ToC:

for chapter in myChapters:
    body.append(paragraph(chapter.text, style='ListNumber'))

有没有人知道使用“内置单词”ToC功能的方法,它会自动添加索引并创建各个章节的段落链接?

非常感谢!

解决方法:

关键的挑战是渲染的ToC依赖于分页来知道每个标题要放置的页码.分页是布局引擎提供的功能,布局引擎是Word客户端内置的一个非常复杂的软件.用Python编写页面布局引擎可能不是一个好主意,绝对不是我计划在短期内进行的项目:)

ToC由两部分组成:

>指定ToC放置的元素以及要包含的标题级别.
>实际可见的ToC内容,标题和页码用虚线连接它们.

创建元素非常简单,而且工作量相对较低.创建实际的可见内容(至少如果您想要包含页码)需要Word布局引擎.

这些是选项:

>只需添加标签和其他一些位来发信号通知ToC需要更新.首次打开文档时,会出现一个对话框,说明需要刷新链接.用户单击是,Bob是您的叔叔.如果用户单击否,则会显示ToC标题,其下方没有内容,并且可以手动更新ToC.
>添加标记,然后通过C#或Visual Basic对Word自动化库使用Word客户端打开并保存文件;所有字段(包括ToC字段)都会更新.
>如果您有SharePoint实例或使用Word Automation Services可以执行此操作的任何内容,请执行相同的服务器端操作.
>在文档中创建一个AutoOpen宏,在打开文档时自动运行字段更新.可能不会通过大量的病毒检查程序,也无法在公司环境中常见的锁定Windows版本上运行.

这是a very nice set of screencasts by Eric White that explain all the hairy details

上一篇:Python docx库文本对齐


下一篇:使用纯python将docx转换为pdf(在linux上,没有libreoffice)