我正在尝试编写一个基于Python的Web Bot,它可以读取和解释HTML页面,然后执行onClick函数并接收生成的新HTML页面.我已经可以阅读HTML页面,并且可以确定onClick命令要调用的功能,但是我不知道如何执行这些功能或如何接收生成的HTML代码.
有任何想法吗?
解决方法:
我知道Python中唯一的Javascript工具是python-spidermonkey.不过我从未使用过.
使用Jython,您可以(ab-)使用HttpUnit.
编辑:忘记了可以使用Scrapy.它通过Spidermonkey支持Javascript,甚至可以使用Firefox爬网.
编辑2:最近,由于一些出色的库,我发现自己越来越多地将浏览器自动化用于此类任务. QtWebKit提供了对WebKit浏览器的完全访问权限,这得益于语言绑定(PySide或PyQt),该浏览器可以在Python中使用. Gtk似乎有相似的库和绑定,但我没有尝试过. Selenium WebDriver API也很不错,并且拥有活跃的社区.