简单易用的headless浏览器

源码没有看,应该是用python封装了pyqtwebkit。

需要安装pyqt4(sudo apt-get install python-qt4)


简单示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from ghost import Ghost
import time
def main():
    ghost = Ghost()
    start = time.time()
    page, resources = ghost.open("http://www.baidu.com/")
    end = time.time()
    #保存了所有的资源,包括js
    for res in resources:
        print res.url, res.http_status
    print ghost.content #输出内容
    ghost.capture_to('/home/chenjianshu/tmp/header.png'#截图
    print end-start
                                                  
                                                  
main()

其它功能官网上都有写,功能不多,但简单够用。性能一般,毕竟是完整浏览器,不能要求太多。page返回是None比较奇怪,得有空看下源码。





本文转自 dogegg250 51CTO博客,原文链接:http://blog.51cto.com/jianshusoft/1315870,如需转载请自行联系原作者


上一篇:《Android程序设计》一2.2 Java类型系统


下一篇:Java Calendar获取年、月、日、时间