wkhtmltox实现网页转换成图片或pdf

1.先下载http://download.gna.org/wkhtmltopdf/obsolete/windows/wkhtmltox-0.11.0_rc1-installer.exe,安装

2.在命令行下输入:wkhtmltopdf www.Google.com.hk myhomepage.pdf
就可以把谷歌的首页导出为pdf文件,

同理,wkhtmltoimage www.google.com.hk myhomepage.jpg
可以把谷歌的首页导出为图片。

注意:wkhtmltopdf和wkhtmltoimage对中文编码支持不友好,如果网页是GBK编码,生成的图片或者pdf是乱码,所以最好先把网页下载到本地,改成UTF-8编码,再调用这两个工具生成图片或者pdf。

以上只是简单应用wkhtmltopdf的命令,事实上这两个命令可以带参数的,详细的参数说明可以看官方文档。

3.在Java程序中调用wkhtmltoimage。因为wkhtmltoimage并没有提供java
api,所以只能通过java程序启动命令行,通过命令行调用wkhtmltoimage来完成任务。

public class HtmlToImage{
public static void main(String[] args){
ProcessBuilder pb = new ProcessBuilder("D:\\Program Files\\wkhtmltopdf\\wkhtmltoimage", "www.baidu.com", "D:\\test.jpg");
Process process;
try {
process = pb.start();
//注意,调用process.getErrorStream()而不是process.getInputStream()
BufferedReader errStreamReader = new BufferedReader(new InputStreamReader(process.getErrorStream()));
System.out.println("read errstreamreader");
String line = null;
line = errStreamReader.readLine();
while(line != null) {
System.out.println(line);
line = errStreamReader.readLine();
}
process.destroy();
System.out.println("destroyed process");
} catch (IOException e) {
e.printStackTrace();
}
}
}

总结:wkhtmltopdf和wkhtmltoimage是一个功能强大的开源工具,可以实现很多类似的功能。例如,用谷歌搜索时,把鼠标移动到链接上面,会显示该网页的缩略图,这个功能可以用wkhtmltoimage来实现。如果想把博客导出为pdf,可以用wkhtmltopdf来实现。

上一篇:[django]Django站点admin支持中文显示和输入设置


下一篇:神奇的BFC以及被忽略的东西