安装Tesseract-OCR和功能测试
下载安装成功后,设备环境变量。将C:\Program Files\Tesseract-OCR加入到环境变量中。
Tesseract的github地址:https://github.com/tesseract-ocr/tesseract
确认安装是否OK, cmd 输入:tesseract -v
成功则显示
安装Python 库:
pip install pytesseract
pip install pillow
安装好支持库和环境后,即可做图片文字识别了,下面就简单的验证数字做测试。
import pytesseract
from PILimport Image
import cv2as cv
img_path =r"3.png"
img = cv.imread(img_path)
text = pytesseract.image_to_string(Image.fromarray(img))
print(text)
3.png 图片内容如下:
正常识别:
8403
也存在误判的情况,如下:
7被误识别为1了。