注意:我的系统是Ubuntu18.4
1 安装Paddle
github打不开,可以使用这个网站加速:https://hub.fastgit.org/
PaddlerOCR官网开发文档
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/README_ch.md
# 安装paddlepaddle(我用的是cpu版本) python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple # 安装gpu版本paddlepaddle python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
2 安装PaddleOCR
# 安装paddleocr pip install paddleocr
安装时出现的问题
主要是安装python-Levenshtein引起的问题,直接安装XX.tar.gz文件是不行的,可以安装XX.linux.whl文件应该可以(但是我没找到linux版本)。
fatal error: Python.h: No such file or directory #include <Python.h> error: command 'x86_64-linux-gnu-gcc' failed with exit status 1
解决办法
# 一般情况下,直接安装下面的即可,建议用指定python版本的方法 sudo apt-get install python-dev # 如果还不行,安装时指定python版本,不指定python版本可能还出现问题 sudo apt-get install python3.8-dev
3 PaddleOCR使用
from paddleocr import PaddleOCR, draw_ocr # 'use_gpu=False'不用gpu,默认使用GPU # 'use_angle_cls=True'自动下载相关的包 # 'lang="ch"'设置语言,支持中英文、英文、法语、德语、韩语、日语,参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。 ocr = PaddleOCR(use_gpu=False, use_angle_cls=True, lang="ch") img_path = './picture/my_001.png' result = ocr.ocr(img_path, cls=True) # line是一个列表' [[文本框的位置],(文字,置信度)] ' for line in result: print(line)