C#中处理Word文档,是大部分程序猿绕不过的一道门。小公司或一般人员会选择使用开源组件。目前网络上出现的帖子,大部分是NPOI与DocX,其它的也有。不啰嗦了,将要使用DocX的基本方法贴出来,供参考。
经过亲测,DocX版本1.3.0.0比较稳定,基本功能使用正常(包括图片,表格,正文及页眉页脚等),建议大家选择该版本。目前为止(2020-01-23)官方最新版本为1.5.0.0,但其图片功能有问题(最先测试,其它就没深入了解了)。所以,若没有特别说明,代码中涉及的DocX版本为1.3.0.0。
DocX下载安装,有两种方式。一是开源官网下载,网址是:http://docx.codeplex.com/ ;二是在VS中使用NuGet,打开NuGet管理,查找DocX,即可看到可安装版本。当然,为了使用DocX组件,你的系统需要安装.NET框架4.0和Visual Studio 2010或更高版本。
DocX按版本不同,命名空间不一样。在1.1.0.0之前,使用 using Novacode 方式;从1.1.0.0到1.3.0.0,使用 using Xceed.Words.NET 方式;从1.4.1.0起,有两个:using Xceed.Words.NET 和 using Xceed.Document.NET。
文档组成基本类似,也按段落、表格(行、列(段落))等方式,差别在使用时基本不考虑Run,要么是Append增加,要么是Insert插入,插入有文本插入与段落(表格)的之前、之后插入,如:InsertParagraphBeforeSelf 和 InsertTableAfterSelf 等方式。实际使用请自己理解体会,这不是太难的东西。
若DocX选择版本1.3.0.0后,基本上按网上的代码与使用贴,能够处理大部分常用的Word文档了。
再次强调,若无特别说明,DocX版本为:1.3.0.0,命名空间引用:using Xceed.Words.NET,DocX组件的文件名为:Xceed.Words.NET.Dll。
代码示例如下:
private void DocX_DocMainBody()
{
string currPath = System.AppDomain.CurrentDomain.BaseDirectory;
string docPath = Path.Combine(currPath, "DocxWord");
if (!Directory.Exists(docPath))
Directory.CreateDirectory(docPath);
string outFile = Path.Combine(docPath, string.Format("{0}.Docx", DateTime.Now.ToString("yyyyMMddHHmmssfff")));
string picFile = Path.Combine(currPath, "_Word.jpg"); using (var document = File.Exists(outFile) ? DocX.Load(outFile) : DocX.Create(outFile))
{
Paragraph p1 = document.InsertParagraph();
p1.InsertText("[1这是首页 - 原始段落.]"); //当前插写(或在指定位置写入)
p1.Append("[2增加表格]");
Table tblAdd = p1.InsertTableAfterSelf(, ); //插入段落后
tblAdd.Design = TableDesign.TableGrid;
tblAdd.Rows[].Cells[].Paragraphs.First().Append("3增加的表格").Alignment = Alignment.center;
tblAdd.InsertParagraphAfterSelf("[4表格后增加段落]"); p1.InsertParagraphBeforeSelf("[5原始段落前插入新段落]").Append("[6增加的新文本]").Bold().InsertText(,"[7插入的新文本]"); Table tbl = p1.InsertTableBeforeSelf(, ); //插入段落前部
tbl.Design = TableDesign.LightShading;
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[8增加表格]");
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[9共6行3列]");
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[10第3列]");
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[11Cell10]");
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[12Cell11]");
tbl.Rows[].Cells[].Paragraphs.First().InsertText("[13Cell12]"); Paragraph p1_1 = p1.InsertParagraphBeforeSelf("[14原始段落前插入的段落. 本段落后插入表格]");
Table t_1 = p1_1.InsertTableAfterSelf(tblAdd); //先插入段落再在插入的段落之前插入表格
t_1.Rows[].Cells[].Paragraphs.First().InsertText("[15步骤14插入的表格]");
t_1.InsertRow().Cells[].Paragraphs.First().InsertText("[16增加一行]");
t_1.InsertRow().Cells[].Paragraphs.First().Append("[17在首行插入一行]"); Paragraph p1_2 = p1.InsertParagraphAfterSelf("[18原始段落后插入的段落。本段落后插入3段空段落]");
Paragraph p1_3 = p1_2.InsertParagraphAfterSelf("").InsertParagraphAfterSelf("").InsertParagraphAfterSelf(""); p1_3.InsertPageBreakAfterSelf(); //该段落之后插入换页符, 优先于同段落的表格插入 Paragraph p2 = document.InsertParagraph(); //插入新段落
p2 = p2.InsertParagraphAfterSelf("");
p2 = p2.Append("[19这是第二页.]"); //AppendLine: 会增加换行(先换行再写入文本), Append: 不会换行
p2 = p2.InsertParagraphAfterSelf("");
Table t_2 = p2.InsertParagraphBeforeSelf("[20测试InsertParagraphAfterSelf(\"\")即增加空段落行,本段落是InsertParagraphBeforeSelf在InsertParagraphAfterSelf(\"\")的段落行之前插入,接着在本段落前插入2行3列的表格]").InsertTableBeforeSelf(, );
t_2.Design = TableDesign.TableGrid; //TableDesign.None; Paragraph pPic = document.InsertParagraph("[21以下插入图片]", false);
var image = document.AddImage(picFile);
var picture = image.CreatePicture();
//picture.Rotation = 10; //旋转
picture.SetPictureShape(BasicShapes.cube);
picture.Height = ;
picture.Width = ;
document.InsertParagraph().AppendPicture(picture); document.Save(); //document.SaveAs(outFile);
MessageBox.Show(Path.GetFileName(outFile) + " 完成!"); } }
代码说明:以上代码中字串的[##打头的数字,是我测试处理时分析代码作用效果用。在最后生成的Word文档中,你从这些数字打头的段落或位置上,可以直接看到代码的作用,方便你初学时理解。
生成文档效果:
基本的使用就是这些,希望能帮到你。