tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/

 

https://blog.csdn.net/u010454030/article/details/80515501

 

http://www.freeocr.net/

 

OpenCV OCR and text recognition with Tesseract

 

 方案2:EasyOCR

安装了最新的驱动

tesseract  cuda pytorch安装    		提升Tesseract-OCR输出的质量

 

当前显卡驱动 

 tesseract  cuda pytorch安装    		提升Tesseract-OCR输出的质量

 

 



https://github.com/JaidedAI/EasyOCR

1. https://pytorch.org/ 安装,可能需要FQ

 老版本需要在这里安装
https://pytorch.org/get-started/previous-versions/

  我装了几个都报错。我先装个 不用gpu的,我装了1.5版本,装1.6版本会报错,网上说降级装低版本。

下面这个成功的

pip install torch==1.5.0+cpu torchvision==0.6.0+cpu -f https://download.pytorch.org/whl/torch_stable.html

 用cuda 10.0,安装这个也成功.

pip install torch==1.2.0 torchvision==0.4.0 -f https://download.pytorch.org/whl/cu100/torch_stable.html
https://download.pytorch.org/whl/cu100/torch-1.2.0-cp36-cp36m-win_amd64.whl

试下安装这个可行否

pip install torch==1.6.0+cu101 torchvision==0.7.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html
 

 

页面细分模式:

0仅方向和脚本检测(OSD)。

1使用OSD自动进行页面分割。

2自动页面分割,但没有OSD或OCR。

3全自动页面分割,但没有OSD。 (默认)

4假设一列可变大小的文本。

5假定单个统一的垂直对齐文本块。

6假设一个统一的文本块。

7将图像视为单个文本行。

8将图像视为一个单词。

9将图像视为一个圆圈中的单个单词。

10将图像视为一个字符。

11稀疏文本。 以特定顺序查找尽可能多的文本。

12带有OSD的稀疏文本。

13原始行。 将图像视为单个文本行,

绕开特定于Tesseract的骇客。

这是带有多个参数的image_to_string的示例用法。

提升Tesseract-OCR输出的质量