selenium简单识别验证码,识别验证码图片,不太精准,原理上是这样:
import subprocess #验证png图片不报错,可以识别图片为文字,但是不精准,jpg也可以识别,但是会报错,也会生出txt文档 #第一个是安装的Tesseract-OCR的路径,第二个是验证码的图片的路径 p=subprocess.Popen([r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe",r"D:\python爬虫视频\爬虫代码\seleniumText\1.png","last"],stdout=subprocess.PIPE,stderr=subprocess.PIPE) p.wait() file=open("last.txt","r") print(file.read())