python图片提取文字
easyocr库
使用EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。
OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。
OCR的全称叫作“Optical Character Recognition”,即光学字符识别。
常用场景:文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。
OCR本质是图像识别,其包含两大关键技术:文本检测和文字识别。
先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。
EasyOCR支持超过80种语言的识别,包括英语、中文(简繁)等。
导入库
pip install easyocr -i https://pypi.tuna.tsinghua.edu.cn/simple
简单使用
EasyOCR的用法非常简单,分为三步:
1、创建识别对象;
2、读取并识别图像;
3、导出文本。
比如要识别图片: