Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?

浏览器:Chrome

工具:右键 检查(N)


步骤:

1.打开淘宝/天猫

2.右键 检查

3.随便点击一个商品进入购买界面

4.点击监控工具 Network -- Json

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


5.点击 商品评论

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


6.下拉到评论翻页处

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?

7.点击 监控工具Clear功能,清空列表

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


8.点击任意页翻页,监控工具中就出现了该页的评论Json脚本

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


9.点击该Json脚本

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


10.点击 Headers - General ,复制评论链接Request URL

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


11.查看评论Json内容,可看Preview,逐个点开下三角查看

Python爬虫 如何利用浏览器如何JSON数据,如获取淘宝天猫的评论链接?


12.重复以上步骤,可获取其他页评论


解答:

a.为什么先到了翻页处再Clear,而不是先Clear再翻页?

任何经验都是实践得来的,可自己试试。

之所以先下拉到翻页处,是因为,如果下拉出现其他除评论外的框架,监控工具中会加载其他东西,就会监控列表内容又会变多了。因此这样等其他项加载完后再Clear,可减少视觉干扰。



上一篇:16.职位管理后端接口设计


下一篇:java equals 和 == 的区别