文字识别 Tesseract 使用

1.pip install pillow

2.pip install pytesseract

3.安装tesseract-ocr-setup-4.00.00dev.exe或者 tesseract-ocr-setup-3.05.01.exe(语言包安装时间很长,特别长,可以后续安装)   放在tessdata中,如下图

4.配置环境变量

文字识别  Tesseract 使用

 

文字识别  Tesseract 使用

 

 5.运行出错(找不到语言包)操作如下

文字识别  Tesseract 使用

 

注意不要加      ;


如果你的环境变量是用作 路径相接,就不能有   ;
如果你的是和path类似的功能

这个看这个环境变量的用途
一般应该是路径相接
用环境变量部分代替每个机器上差异,用相对路径+环境变量来实现全路径

6.运行代码即可

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open(r'C:\Users\lenovo\Desktop\1.png'),lang='chi_sim')
print(text)

 

上一篇:oracle常用命令【转载】


下一篇:OCR文字识别实战