使用TESSERACT来识别字符

2024-04-08 21:22:40

➤ 01介绍

使用TESSERTACT来完成OCR。这是一篇来自于网络上通俗讲解博文。 [Tutorial] OCR in Python with Tesseract, OpenCV and Pytesseract

OCR(Optical Charactor Recognition::光学字符识别)是将文字的二维图像转换成字符的过程。可以是打印的文本，也可以是手写的文本，它基本上包括有：

图像的预处理
文字定位；
字符分割；
字符识别；
后处理。

^{▲ Optical Character Recognition process (Courtesy)}

近期基于深度学习的OCR技术解决了传统OCR识别技术中对于字符字体所带来的限制。下面介绍的Tesseract OCR的方法就是其中有代表性的一个。

➤ 02开源OCR工具软件

Tesseract:这是一款在OCR开发者中比较流行的开源OCR识别引擎。某些时候对它的应用和修改显得比较棘手，但在开源环境中长期没有合适可被选用的OCR软件，也只能凑合使用它。本来这款开关项目最初来自于HP公式实验室，是作为博士生课题开展的。在1984到1994年之间的十年期间它逐步流行起来。在2006后Google公司接管了对它的维护。
OCRopus：OCRopus是一款在研究者或者公司应用中比较简便易行。它汇集了文本分析程序，并不是专用的OCR软件。你在使用前有可能需要对图片进行一些预处理，甚至需要重新训练心得模型。
Ocular：适合于对于印刷文档识别，用于多种文字识别。使用命令行进行操作。在传统的OCR系统中，它的性能最好。
SwiftOCR:这是应用Swift编写的ORC识别引擎。据称它的性能超过Tessaract。

➤ 03 Tesseract OCR

^{▲ Tesseract 处理流程}