OCR开发

Tesseract

  • windows下安装地址,尽量下载最新版安装。

  • 选择中文语言包(如果要对中文进行识别)chi_sim ,可在线直接安装,速度可能有些慢,但这样下载的语言包不存在版本问题。

  • 在环境变量path中加入上面的安装路径

//查看安装是否成功,检查版本号
tesseract -v 

//检查安装的语言包
tesseract --list-langs
  • 测试识别效果
//filename.jpg 待识别图片名
//out_1   识别后输出文件
//-l chi_sim  应用中文语言包,默认为英文
tesseract filename.jpg  out_1  -l chi_sim
  • 对中文语言包进行训练,提高识别率

  • golang下的OCR库
    gosseract

EasyOCR

Github EasyOCR
使用教程简介
与go一起使用

上一篇:机器学习:使用matlab实现SVM解决分类问题


下一篇:有道词典 Kubuntu20.04