使用TESSERACT来识别字符

 

01介绍


使用TESSERTACT来完成OCR。这是一篇来自于网络上通俗讲解博文。 [Tutorial] OCR in Python with Tesseract, OpenCV and Pytesseract

OCR(Optical Charactor Recognition::光学字符识别)是将文字的二维图像转换成字符的过程。可以是打印的文本,也可以是手写的文本,它基本上包括有:

  • 图像的预处理
  • 文字定位;
  • 字符分割;
  • 字符识别;
  • 后处理。

使用TESSERACT来识别字符

▲ Optical Character Recognition process (Courtesy)

近期基于深度学习的OCR技术解决了传统OCR识别技术中对于字符字体所带来的限制。下面介绍的Tesseract OCR的方法就是其中有代表性的一个。

 

02开源OCR工具软件


  • Tesseract:这是一款在OCR开发者中比较流行的开源OCR识别引擎。某些时候对它的应用和修改显得比较棘手,但在开源环境中长期没有合适可被选用的OCR软件,也只能凑合使用它。本来这款开关项目最初来自于HP公式实验室,是作为博士生课题开展的。在1984到1994年之间的十年期间它逐步流行起来。在2006后Google公司接管了对它的维护。
  • OCRopus:OCRopus是一款在研究者或者公司应用中比较简便易行。它汇集了文本分析程序,并不是专用的OCR软件。你在使用前有可能需要对图片进行一些预处理,甚至需要重新训练心得模型。
  • Ocular:适合于对于印刷文档识别,用于多种文字识别。使用命令行进行操作。在传统的OCR系统中,它的性能最好。
  • SwiftOCR:这是应用Swift编写的ORC识别引擎。据称它的性能超过Tessaract。

 

03 Tesseract OCR


使用TESSERACT来识别字符

▲ Tesseract 处理流程

上一篇:图文需要扫描很麻烦,Python也能识别看到的好文章了!快用它一键扫描吧


下一篇:安卓系统车牌离线识别,优秀的车牌识别算法