1.首先
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytesseract
2. 但是安装后并不能直接使用,还需要下载Tesseract-OCR。
win-64位的
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.0.0-alpha.20200223.exe
下载完双击打开,连续next,直到出现安装路径的时候,可以自定义安装路径也可以使用默认的安装路径,但是无论是哪一种一定要记住路径。
我的是自定义的安装路径
F:\Tesseract-OCR\tesseract.exe
根据路径找到pip装的pytesseract.py
点开编辑,找到tesseract_cmd将它改为你刚刚安装的tesseract的路径。
保存后去运行程序会发现没办法使用pytesseract库,它还是会报错,这是由于环境变量也要进行设置。
点开我的电脑—》属性—》高级系统设置—》环境变量,新建一个变量:路径还是你刚刚安装的Tesseract-OCR路径,但是要将它定位到其中的tessdata,变量名也一定不能改。
然后在下面的path中加入的变量:
保存后,请一定要重启,然后在去运行程序就可以使用pytesseract库了。