最近打算实现一个功能:在Android中加载显示Word文档,当然这里不是使用外部程序打开。查看一些资料后,打算采用poi实现,确定了以下实现思路:
- 将ftp中的word文档下载到本地。
- 调用poi将word文档转成html格式并保存到本地
- 使用WebViewer加载显示本地html
这里略去下载word文档到本地不谈,仅仅后面两步,看起来还是比较简单的,网上也有相关代码。不过在使用过程中遇到了两个大的问题,着实让笔者费了一番脑筋。这里给大家列出来,希望能帮助大家节省些时间。
首先,说一下POI使用方法
- 下载poi-bin-3.9-20121203.tar.gz并解压,提取查看Office文档所依赖的包。
- word相关操作依赖于poi-3.9-20121203.jar和poi-scratchpad-3.9-20121203.jar两个包,将其加入到Android程序的libs文件夹中。
- 将word转html并保存到本地,然后使用WebViewer加载显示本地html。整个代码如下
package com.example.office; import java.io.BufferedWriter;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.util.List; import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult; import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.PicturesManager;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.PictureType;
import org.w3c.dom.Document; import android.os.Bundle;
import android.app.Activity;
import android.webkit.WebSettings;
import android.webkit.WebView; public class MainActivity extends Activity { private String docPath = "/mnt/sdcard/documents/";
private String docName = "test.doc";
private String savePath = "/mnt/sdcard/documents/"; @Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
String name = docName.substring(0, docName.indexOf("."));
try {
if(!(new File(savePath+name).exists()))
new File(savePath+name).mkdirs();
convert2Html(docPath+docName,savePath+name+".html");
} catch (Exception e){
e.printStackTrace();
}
//WebView加载显示本地html文件
WebView webView = (WebView)this.findViewById(R.id.office);
WebSettings webSettings = webView.getSettings();
webSettings.setLoadWithOverviewMode(true);
webSettings.setSupportZoom(true);
webSettings.setBuiltInZoomControls(true);
webView.loadUrl("file:/"+savePath+name+".html");
} /**
* word文档转成html格式
* */
public void convert2Html(String fileName, String outPutFile)
throws TransformerException, IOException,
ParserConfigurationException {
HWPFDocument wordDocument = new HWPFDocument(new FileInputStream(fileName));
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument()); //设置图片路径
wordToHtmlConverter.setPicturesManager(new PicturesManager()
{
public String savePicture( byte[] content,
PictureType pictureType, String suggestedName,
float widthInches, float heightInches )
{
String name = docName.substring(0,docName.indexOf("."));
return name+"/"+suggestedName;
}
} ); //保存图片
List<Picture> pics=wordDocument.getPicturesTable().getAllPictures();
if(pics!=null){
for(int i=0;i<pics.size();i++){
Picture pic = (Picture)pics.get(i);
System.out.println( pic.suggestFullFileName());
try {
String name = docName.substring(0,docName.indexOf("."));
pic.writeImageContent(new FileOutputStream(savePath+ name + "/"
+ pic.suggestFullFileName()));
} catch (FileNotFoundException e) {
e.printStackTrace();
}
}
}
wordToHtmlConverter.processDocument(wordDocument);
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out); TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
//保存html文件
writeFile(new String(out.toByteArray()), outPutFile);
} /**
* 将html文件保存到sd卡
* */
public void writeFile(String content, String path) {
FileOutputStream fos = null;
BufferedWriter bw = null;
try {
File file = new File(path);
if(!file.exists()){
file.createNewFile();
}
fos = new FileOutputStream(file);
bw = new BufferedWriter(new OutputStreamWriter(fos,"utf-8"));
bw.write(content);
} catch (FileNotFoundException fnfe) {
fnfe.printStackTrace();
} catch (IOException ioe) {
ioe.printStackTrace();
} finally {
try {
if (bw != null)
bw.close();
if (fos != null)
fos.close();
} catch (IOException ie) {
}
}
}
}
activity_main.xml如下
<RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:layout_width="match_parent"
android:layout_height="match_parent" > <WebView
android:id = "@+id/office"
android:layout_width="wrap_content"
android:layout_height="wrap_content"
android:layout_centerHorizontal="true"
android:layout_centerVertical="true"
android:text="@string/hello_world"
tools:context=".MainActivity"/>
</RelativeLayout>
上面代码中convert2Html用于将word文档转换html。下面的代码则是使用WebViewer加载显示本地html文件。
WebView webView = (WebView)this.findViewById(R.id.office);
WebSettings webSettings = webView.getSettings();
webSettings.setLoadWithOverviewMode(true);
webSettings.setSupportZoom(true);
webSettings.setBuiltInZoomControls(true);
webView.loadUrl("file:/"+savePath+name+".html");
下面来详细说说存在的两个问题
问题一:使用时有如下报错:
09-23 17:40:12.350: W/System.err(29954): java.lang.NullPointerException
09-23 17:40:12.350: W/System.err(29954): at org.apache.poi.hwpf.converter.AbstractWordUtils.compactChildNodesR(AbstractWordUtils.java:146)
这个是POI自身的bug,具体原因在于AbstractWordUtils.java中没有对child2.getParent是否为空进行判断。将如下代码
child2.getParentNode().removeChild( child2 );
i--;
更改为
if(child2.getParentNode()!=null){
child2.getParentNode().removeChild( child2 );
i--;
}
然而这里需要重新编译AbstractWordUtils.java类,将源工程下载后,找到AbstractWordUtils.java后,试验了以下方法。
- 直接使用javac编译,会提示很多类库找不到
- 使用反编译工具,反编译后更改个文字还可以,更改代码就有点勉强了。
- 将整个poi导入eclipse后重新编译,工作量太大,没有进行尝试。
最后绞尽脑汁还是想到了一个相当简单的方法(高手请飘过~),为此还得瑟了几分钟。具体如下:
- 将AbstractWordUtils.java,poi-3.9-20121203.jar,poi-scratchpad-3.9-20121203.jar放到同一目录下,非必需。
- 通过引用已有的两个包进行编译,编译命令如下:javac -cp d:\poi-3.9-20121203.jar;d:\poi-scratchpad-3.9-20121203.jar; d:\AbstractWordUtils.java ;编译后生成AbstractWordUtils.class文件。
- 将poi-3.9-20121203.jar的后缀改成zip,将AbstractWordUtils.class拖到zip中覆盖掉原有文件,然后将后缀zip改成jar即可。点击此处下载更改好的poi-3.9-20121203.jar。
问题二:找不到HWPFDocument错误:java.lang.NoClassDefFoundError: org.apache.poi.hwpf.HWPFDocument或者内存不足问题:Unable to execute dex: Java heap space
上述问题取决于使用poi-3.9-20121203.jar,poi-scratchpad-3.9-20121203.jar包的不同方式。
如果将两个jar包放在libs目录下,就不会出现类找不到的错误;但很可能会出现内存不足的问题。笔者开始通过更改eclipse安装文件夹下的eclipse.ini文件增大内存到512M,解决了内存不足的问题;后来加入到另外一个更大的程序后,又出现内存不足的问题,调整到800M解决。值得注意的是,如果把最大值调整到1024M,eclipse就无法启动了(和你的机器相关),这实在不能算是个好的解决方案。以下为笔者机器上修改后eclipse.ini文件,注意标红的部分。
-startup
plugins/org.eclipse.equinox.launcher_1.2.0.v20110502.jar
--launcher.library
plugins/org.eclipse.equinox.launcher.win32.win32.x86_1.1.100.v20110502
-showsplash
org.eclipse.platform
--launcher.XXMaxPermSize
256m
--launcher.defaultAction
openFile
-vmargs
-Xms256m
-Xmx800m
如果通过使用Add Library的方法加载jar包,就不会出现内存的问题,但是会出现类找不到的的问题:java.lang.NoClassDefFoundError: org.apache.poi.hwpf.HWPFDocument。虽然csdn上有人通过将新增的user lib放置到最上面的方法解决了,但我试了下没有生效,不得已还是采用了第一种方法。这里也希望解决了该问题的人能够留下评论或联系方式,方便请教。
最后,补充几点
- 目前poi只针对2003的doc格式,不支持2007及其以上的docx格式。
- 经测试发现,偶尔会出现的问题,不知如何解决。这里建议内部程序简单预览,外部程序打开word文档详细浏览的方式。
- poi和android API的版本或ADT版本有关;有的在java环境下良好,在android环境下就有问题,还请多多注意。
- 整个工程实例代码请点击此处。