如何将数据输入网页以使用Python刮取结果输出？

2023-11-22 10:15:58

我熟悉BeautifulSoup和urllib2来从网页上抓取数据.但是,如果在我想要刮取的结果返回之前需要在页面中输入参数怎么办？

我正在尝试使用此网站获取两个地址之间的地理距离：http://www.freemaptools.com/how-far-is-it-between.htm

我希望能够转到页面,输入两个地址,单击“显示”,然后提取“距离作为乌鸦飞行”和“按陆地运输距离”值并将其保存到字典中.

有没有办法使用Python将数据输入网页？

解决方法:

看看机械化或刮擦等工具：

> http://pypi.python.org/pypi/mechanize
> http://stockrt.github.com/p/emulating-a-browser-in-python-with-mechanize/
> http://www.ibm.com/developerworks/linux/library/l-python-mechanize-beautiful-soup/
> http://zesty.ca/scrape/

Packt Publishing也有一篇关于此事的文章：

> http://www.packtpub.com/article/web-scraping-with-python