pytesser的使用

pytesser以及其依赖插件下载地址:链接: http://pan.baidu.com/s/1i3zgpjJ 密码: ueyy

在学习Webdriver的过程中遇到验证码的识别问题,问了度娘知道了pytesser能用于验证码的识别,而且代码用起来比较简单,就查了好多资料整了一天终于配置好了,记录一下。

首先安装vc 2008外部运行库(全名不记得了)vcsetup_V9.0.30729.1.239631479.exe,不然安装PIL会提示找不到xxx.bat文件,文件名也忘记了。

接着就安装PIL了,本机环境 win7 64位系统,Python2.7,安装PIL时发现没有对应的版本,查到PIL的替代:Pillow,找到对应版本安装

pytesser同时依赖tesseract-ocr,自然是继续安装tesseract-ocr了

这些都安装完了之后就是pytesser的问题了,只需要把pytesser解压到Python安装目录(自己新建工程的话就解压到工程目录就ok)就行,另外注意一下pytesser.py中第六行的import Image,改成from PIL import Image(因为我们安装的不是原版的PIL而是pillow所以要把这个也改一下)

做完这些就能使用啦!

from pytesser import *

image=Image.open("D:\\ProgramFiles\\Python27\\workspace\\fnord.tif")

print image_to_string(image)

aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnYAAAA4CAIAAAD/+yKbAAADMUlEQVR4nO3d0XHjIBQFUOqiIFpIG3SxHfCZRlRBqmA/HFtIxna0O8/JOOdMPpInCTyZYa5BskkdAAiQvvsFAMBrErEAEELEAkAIEQsAIUQsAIQQsfCtWkmjXE/lpea0cz7Ue18PllJynZ+fcl22HQwtHOj3sx3gsDFi25+U6mQwHa0DByw1X0KslTXQxvrpj+n56Ryxl0Qtrffex6tPh1vZhOW03wftAEfsZ7HvOb2l/H41oo7Wr83eHadcF3X131C/PzQ2UXpKtrXeyjj73J1/5RKNu0tKO7W0jMVpv3famb74H/V/Vld/Zv3hAJktFC+1pvS2HdX/Uge+YIy6mtdgW0f11eBax/vVoWk0nvNzk9a3+r3TDnDIzXuxHzW/zdaBj9Yvftq7D3X1Z9bvDMLxktkscz+L3V+7PTqJxqE0Hr3V7812Hr34n/B/Vld/Zv3hAJlH7EfN01np0Trw0DqbbCUNuXZ/QfhsH4XX0bh7sCntF6L3/d5qBzjqKmKtEsNzjVG6DCu2u4hdF3vHd8+P76HuJ8GXC271e6Md4LD9E8WzZ5eO1oEvu8wxz0FYc0q5zhamLhE7X6zaXlJa397OXbad1Xm/83aAf+JzsQAQQsQCQAgRCwAhRCwAhBCxABBCxAJACBELACFELACEELEAEMJ+sQAQ4nn7xQLAr2K/WAAI8bz9YgHgV7FfLACEsF8sAISwXywAhPC5WAAIIWIBIISIBYAQIhYAQohYAAghYgEghIgFgBAiFgBCTCK2lZ7S509pUR2X1FOOahwAvt31Fyj2/KzkKyIWgNe1idhx/prOs8yl9pR6GQ6NM9uaJ/VTMdfPa9dDS8/D/FjEAvDCvjSLPSVlO/9++c7/mtffe9su/LY1pHv7XHAuqV82u7NQDMBr+2rErjdl2zlWl57L5rRW1gRdT+s3Kk9ckQaA5xOxABDiPyK295qHTN09vnQdsb2X4X5tKxaKAXhlm4gdn11KqafSe18fWSrtfIc1DRPZNPmET0mbdsZ4Hht3OxaAF+arJwAghIgFgBAiFgBCiFgACCFiASCEiAWAECIWAEKIWAAIIWIBIISIBYAQfwGo93kdAMkVLAAAAABJRU5ErkJggg==" alt="" />

上一篇:设计模式 - 适配器模式(adapter pattern) 具体解释


下一篇:设计模式 - 适配器模式(adapter pattern) 枚举器和迭代器 具体解释