Tesserocr简单介绍

Tesserocr是Python的OCR识别库之一。可以通过扫描字符,然后将其翻译成电子文本。
通常用于自动识别验证码等操作

安装过程

1、Linux 系统下的安装比较简单。直接使用命令先安装tesseract:
CentOS系统:  yum install -y tesseract
Ubuntu系统:  sudo apt-get install -y tesseract -ocr libtesseract-dev libleptionica-dev
然后直接使用pip命令安装tesserocr即可:
pip3 install tesserocr pillow
2、Windows系统下的安装步骤也一样,只不过安装过程中可能会遇到一些问题。这里以Windows10为例
首先,同样需要先安装tesseract包。[点击下载](https://digi.bib.uni-mannheim.de/tesseract/)
其中,带有dev标识的为开发版本,我们选择不带dev标识的稳定版
        tesseract-ocr-setup-3.05.02-20180621.exe
下载完成后,一路点击Next即可安装。
在此安装过程中,也可以勾选addition language data选项来安装多国语言包,以便于识别多国语言。
tesseract安装完成后,在命令行中直接使用pip命令即可安装tesserocr:
pip3 install tesserocr pillow

windows10安装问题

因遇到问题的时候就去尝试解决了,没有想太多,所以没有截到错误截图,只在自己笔记中有一点错误信息关键字的记录,望理解
1、ERROR:Microsoft Visual C++ 14.0 is required
该报错是因为Windows10系统中默认缺少Visual C++ 14.0 的组件。
本人曾尝试着去手动安装过该组件,但发现后续还会报很多文件找不到的错误,需要配置环境变量、迁移文件路径等一系列复杂的操作。所以不建议去手动安装该组件。可以尝试另一种解决办法。

我们可以使用whl安装的方法:[whl文件下载](https://github.com/simonflueckiger/tesserocr-windows_build/releases)

下载之后,在命令行中运行pip命令即可:
pip3 install tesserocr-2.2.2-cp36-cp36m-win32.whl
其中tesserocr-2.2.2-cp36-cp36m-win_amd64.whl为刚才下载的whl文件名

2、ERROR: unknown command “tesserocr-2.2.2-cp36-cp36m-win32.whl”
如果遇到该错误,尝试检查两点:
        1.  文件名是否正确,是否为刚才下载的whl文件的完整文件名;
        2.  文件路径是否正确,该命令需要切换到所下载的whl文件所在目录下执行。(此处需要使用到 cmd 的 cd 命令)

3、tesserocr-2.2.2-cp36-cp36m-win32.whl is not a supported wheel on this platform
该报错是因为tesserocr的版本选择与Python版本或者Windows版本不兼容。
解决办法:重新下载兼容版本。

版本解释:如上面我所使用 tesserocr-2.2.2-cp36-cp36m-win32.whl
其中:
cp36 代表Python3.6版本;
win32 代表 window 32位操作系统(需要注意的是,这里的位数和Python的位数是相关的,而不是单单指操作系统的位数)

版本选择:
Python 3.7 因GitHub还没有更新对应的Windows Tesserocr包,所以暂时没有3.7对应的版本
Python 3.6 32bit 的环境选择下载 tesserocr-2.2.2-cp36-cp36m-win32.whl
Python 3.6 64bit 的环境选择下载 tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
Python 3.5 32bit 的环境选择下载 tesserocr-2.2.2-cp35-cp35m-win32.whl
Python 3.5 64bit 的环境选择下载 tesserocr-2.2.2-cp35-cp35m-win_amd64.whl



版本选择正确,whl文件安装成功后,cmd执行命令:
pip3 install tesserocr pillow
效果如下:
C:\Users\TR>pip3 install tesserocr pillow
Collecting pillow
Downloading https://files.pythonhosted.org/packages/6c/60/4c0e6702a39eab8d5d4d210f283907cbe387fcffeb873d8eb8c3757a21a9/Pillow-5.3.0-cp36-cp36m-win32.whl (1.4MB)
100% |████████████████████████████████| 1.4MB 3.4MB/s
Installing collected packages: pillow
Successfully installed pillow-5.3.0

安装成功
10-06 13:44