- 反扒机制:
-
- robots
-
2.UA监测:网站后台会监测请求对应的User-Agent,以判定当前请求是为异常请求
- 反反扒策略:UA伪装
- 伪装流程:从抓包工具中捕获一个基于浏览器请求的User-Agent的值,将其伪装作用到一个字典中,将该字典作用到请求方法get,post等请求中
-
3.动态加载数据的捕获
-
4.图片懒加载 广泛应用在一些图片网站中
- 只有当图片被显示在浏览器可视范围之内才会将img的伪属性编程真正的属性。
如果是requests发起的请求,它没有可视化范围,因此一定要解析的img的伪属性值
- 只有当图片被显示在浏览器可视范围之内才会将img的伪属性编程真正的属性。
-
相关文章
- 03-02爬虫---0.3反爬机制
- 03-02referer的反爬和爬虫下载视频
- 03-02如何突破网站反爬机制
- 03-02爬虫反爬之User-Agent池
- 03-02爬虫笔记39之反爬系列二:图形验证码、
- 03-02【原创】爬虫反爬基础常见类型总结
- 03-02day28-常见反爬机制及应对方法
- 03-02反爬虫机制
- 03-0224、Python快速开发分布式搜索引擎Scrapy精讲—爬虫和反爬的对抗过程以及策略—scrapy架构源码分析图
- 03-02Python爬虫——反爬