在 OpenXML 格式里面,其实不存在文本这个元素,所有都是形状。但是在 PPT 界面看到的文本框是什么呢?其实他是特别的形状。而几乎所有的形状都可以输入文本,因此区分形状和文本的意义不会特别大,只是在做解析的时候才会碰到
在 OpenXML 的 PML 也就是 PPT 使用的格式里面,在 dotnet OpenXML 解析 PPT 页面元素文档格式 告诉大家都是形状
那么文本框是什么形状?其实文本框是特别的形状
在 PPT 里面拖入文本框,然后使用 OpenXML 解压缩文档为文件夹工具 解压缩,此时可以看到在页面里的元素大概内容如下
<p:sp>
<p:nvSpPr>
<p:cNvSpPr txBox="1"/>
</p:nvSpPr>
<!-- 忽略 -->
</p:sp>
也就是说文本框也是 p:sp 也就是 Shape 元素,但是在 p:nvSpPr->p:cNvSpPr->txBox 有属性表示是文本框
在 dotnet 里面通过 OpenXML SDK 可以这样获取
// nvSpPr
NonVisualShapeProperties nonVisualShapeProperties = shape.NonVisualShapeProperties;
// cNvSpPr
var nonVisualShapeDrawingProperties = nonVisualShapeProperties?.NonVisualShapeDrawingProperties;
var isTextBox = nonVisualShapeDrawingProperties?.TextBox?.Value is true;
在 OpenXML SDK 的帮助下,可以解析很多 PPT 文档的缩写,可以提升可读性。如 nvSpPr 其实就是 Non(n) Visual(v) Shape(Sp) Properties(pr) 的意思
更多请看 Office 使用 OpenXML SDK 解析文档博客目录
我搭建了自己的博客 https://blog.lindexi.com/ 欢迎大家访问,里面有很多新的博客。
如果在博客看到有任何不懂的,欢迎交流