爬虫笔记39之反爬系列二:图形验证码、

在爬虫中图形验证码的解决方式有哪些?
1、 可以通过算法 以及深度学习
2 、selenium来解决
3 、打码平台(付费)
4 、tesseract(即: 光学文字识别库,免费的、开源的)

一、tesseract
1、 安装
1.1 需要把安装的路径(D:\Program Files\Tesseract-OCR)添加到path环境变量里
1.2 需要把训练数据添加到用户变量中:
变量:TESSDATA_PREFIX
值:D:\Program Files\Tesseract-OCR\tessdata
如下图:
爬虫笔记39之反爬系列二:图形验证码、
爬虫笔记39之反爬系列二:图形验证码、
2、 python安装模块
pip install pytesseract

3 、使用

超级鹰的打码平台 https://www.chaojiying.com/

1 注册账号(用户)
2 充值(1块钱或者扫码关注微信公众号 1000题分)
3 创建软件id(点击创建软件id 输入名字 提交)
4 下载实例代码(python 点击下载 压缩文件)
5 使用实例代码


12306登录的问题

下载最新的夜深模拟器

上一篇:os专业词


下一篇:关于VS2019 框架中代码提示由英文装换中文的相关操作。