参考:http://blog.csdn.net/xiexl/article/details/6652230
最近在项目中需要将通过富文本编辑器处理过的文字转换为Word,查了很久,大家通常的解决办法是使用Jacob或POI等组件直接生成Word,但是都无法将富文本编辑器处理过的文字保留样式并保存为Word,最终以失败而告终,无奈只有自己研究Word的格式转换;
分析了转换过程,总体分两个步骤:
1、实现富文本中样式代码的分离;
2、保留CSS样式;
其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:
1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;
2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns:m="http://schemas.microsoft.com/office/2004/12/omml"
xmlns="http://www.w3.org/TR/REC-html40">
以上HTML头是office的命名空间定义。
3、将使用富文本代码粘贴到红色标识的中,并以doc或docx格式保存文件;
4、大功告成,打开文件时,Word将会以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;
目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再研究一下带图片的富文本代码的转换;
[@more@]
根据上面的,现在我们只需要在服务器建一个.doc的文件,然后再把我们的带html样式的文本写到这个文件中,再下载到客户端就可以了
下面实现的代码,首先写一个工具类用来生成word文件
package net.uni.util;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStreamWriter;
/**
* 处理内容:生成带html样式的word文档
* @version: 1.0
* @see:net.uni.util.JavaWordUtil.java
* @date:2012-7-5
* @author:孙伟
*/
public class JavaWordUtil {
private JavaWordUtil(){}
private static String CHARSET = "gbk";//编码格式
private static String PATH = "E:uploadword";//本地测试路径
//private static String PATH = "/home/upload/base/word/";//服务器文件存放路径
/**
* @param fileName
* @param content
* @return
* @方法说明 生成word文档,如果返回null,则表示生成失败
* @date 2012-7-5
* @author 孙伟
*/
public static String createWordFile(String fileName,String content){
OutputStreamWriter os = null;
FileOutputStream fos = null;
try{
if(fileName.indexOf(".doc")>-1){
fileName = fileName.substring(0, fileName.length()-4);
}
File file = new File(PATH);
//如果目录不存在就创建
if (!(file.exists() && file.isDirectory())) {
file.mkdirs();
}
fileName = PATH + "" + fileName + "-" +System.currentTimeMillis() + ".doc";
//创建文件
File targetFile = new File(fileName);
if(!targetFile.exists()){
targetFile.createNewFile();
}
fos = new FileOutputStream(fileName);
os = new OutputStreamWriter(fos,CHARSET);
os.append(content.toString());
os.flush();
return fileName;
}catch(Exception e){
return null;
}finally{
try{
os.close();
fos.close();
}catch(Exception e){
return null;
}
}
}
}
然后就是struts2配置下载文件的步骤:
action里定义两个属性
private String conFileName;//生成的合同模板的word文件名称
private InputStream inputStream;//下载商务合同模板流
注意这两个属性的文件名称的get方法有些不同,为了处理文件名中文乱码的问题
public String getConFileName() {
String downFileName = conFileName;
try {
downFileName = new String(downFileName.getBytes(), "ISO8859-1");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return downFileName;
}
然后是action的主方法
/**
* @return
* @throws ActionException
* @方法说明 下载商务合同模板
* @date 2012-7-5
* @author 孙伟
*/
public String downLoadCustCon() throws ActionException{
try{
StringBuffer content = new StringBuffer();
Long conId = this.cscustcon.getId();
this.cscustcon = this.csCustConService.findCsCustConbyID(conId);
List conHead = csCustConService.findCustConHeadInfo(conId);
//合同头信息
for(String s : conHead){
content.append(s);
}
//合同条款已经条款的内容
List<list> conItem = csCustConService.findCustConContent(conId);
for(List ls : conItem){
for(String sl : ls){
content.append(sl);
}
}
String filePath = JavaWordUtil.createWordFile(cscustcon.getContName(), content.toString());
if(filePath==null||filePath.trim().equals("")) throw new ActionException("合同模板下载失败");
File file = new File(filePath);
if(!file.exists()){
throw new ActionException("文件不存在!");
}
conFileName = cscustcon.getContName()+".doc";
inputStream = new FileInputStream(file);
}catch(Exception e){
throw new ActionException("下载商务合同模板失败",e);
}
return SUCCESS;
}
struts.xml文件的配置:
inputStream
application/octet-stream;charset=ISO8859-1
attachment;filename=${conFileName}
2048
页面的写法:
window.location.href=getBasePath()+"/cs/downLoadCustCon.action?cscustcon.id="+conId+"&itemContent="+$("#itemContentId").val();
到此下面带html样式的word文件就完成了
转自:http://blog.itpub.net/25261409/viewspace-1058739/