在爬虫中图形验证码的解决方式有哪些?
1、 可以通过算法 以及深度学习
2 、selenium来解决
3 、打码平台(付费)
4 、tesseract(即: 光学文字识别库,免费的、开源的)
一、tesseract
1、 安装
1.1 需要把安装的路径(D:\Program Files\Tesseract-OCR)添加到path环境变量里
1.2 需要把训练数据添加到用户变量中:
变量:TESSDATA_PREFIX
值:D:\Program Files\Tesseract-OCR\tessdata
如下图:
2、 python安装模块
pip install pytesseract
3 、使用
超级鹰的打码平台 https://www.chaojiying.com/
1 注册账号(用户)
2 充值(1块钱或者扫码关注微信公众号 1000题分)
3 创建软件id(点击创建软件id 输入名字 提交)
4 下载实例代码(python 点击下载 压缩文件)
5 使用实例代码
12306登录的问题
下载最新的夜深模拟器