本文对常见的处理参考和工具提供一个简要的参考。
对于实际的解决方案参考如下地址(有很多的分类知识)
http://blogs.msdn.com/b/ericwhite/archive/2008/10/20/eric-white-s-blog-s-table-of-contents.aspx
本文对我们常见的处理涉及的几个方面进行一个汇总和参考
另两个参考文章:
Web系统下Office文档的处理 http://www.cnblogs.com/2018/archive/2011/03/21/1989088.html
Web系统下Office文档的处理 之OpenXML基础 http://www.cnblogs.com/2018/archive/2011/03/22/1991870.html
Word Content toolkit
Content Control可以用于对文档进行结构化的组织,对于需要根据要求填写的文档组织很有用,和xml数据绑定结合功能更强,
以下是使用Content Control组织的文档,可以限定只在某些区域操作
具体的一个常见应用如:
1、 在文档中包含初始的xml数据和绑定
2、 用户收到这个文档时,只能在WORD中选择或填写必须填写的区域
3、 填写完成提交后,软件可以抽取绑定的XML数据这些结构化的信息,用于其他的场景和方案
工具下载:http://www.codeplex.com/Wiki/View.aspx?ProjectName=dbe
如上可见,可以进行数据的绑定
custom XML tags
Office2010版本对于存储的XML,再次打开后只显示文本(笔者以前的一个解决方案就是基于这个处理,升级到2010就不行了,换成了ContentControl, MS的内容兼容性有时也不行,选择方案时注意),参考WORD 2010 strip out the xml tags
http://social.msdn.microsoft.com/Forums/en-US/worddev/thread/10fe3eaa-d6c2-4763-aa84-e57164cec96d/
Open_XML_PowerTools
Open_XML_PowerTools.zip codeplex.com上有
非常有用的工具,主要包括
Cmdlets: 基于powershell,脚本形式操作openxml文档
辅助类:进行文档操作的各种辅助C#类
Openxml转为html的简单实现
读取
文本的获取(Mastering Text in Open XML WordprocessingML Documents)
http://msdn.microsoft.com/en-us/library/ff686712.aspx
Using Open XML to Improve Automation Performance in Word 2010 for Large Amounts of Data
http://msdn.microsoft.com/en-us/library/ff191178.aspx
解析大的Excel文件
生成
生成Openxml文档(Creating Documents by Using the Open XML Format SDK 2.0)
http://msdn.microsoft.com/en-us/library/dd440953(v=office.12).aspx
生成大的Excel文件
转换器
OpenXML/ODF Translator:实现Openxml和ODF之间的转换
http://blogs.msdn.com/b/ericwhite/archive/2008/10/20/eric-white-s-blog-s-table-of-contents.aspx也列出了很多其他的转换
Open XML and Office Services
Brian Jones &ZeyadRajabi Office Solutions - Site Home - MSDN Blogs
http://blogs.msdn.com/b/brian_jones/archive/2009/11/03/open-xml-and-office-services.aspx
当然,涉及Openxml的应用还有很多,有些最新的信息可以参考blogs.msdn.com的官方博客,有很多最新的信息和实用的技术。