Tesseract
-
windows下安装地址,尽量下载最新版安装。
-
选择中文语言包(如果要对中文进行识别)chi_sim ,可在线直接安装,速度可能有些慢,但这样下载的语言包不存在版本问题。
-
在环境变量path中加入上面的安装路径
//查看安装是否成功,检查版本号
tesseract -v
//检查安装的语言包
tesseract --list-langs
- 测试识别效果
//filename.jpg 待识别图片名
//out_1 识别后输出文件
//-l chi_sim 应用中文语言包,默认为英文
tesseract filename.jpg out_1 -l chi_sim
-
对中文语言包进行训练,提高识别率
-
golang下的OCR库
gosseract