Python3安装OCR识别库tesserocr过程图解
本篇教程将会详细介绍Python3安装OCR识别库tesserocr的过程,并提供两个示例说明供您参考。
- 安装依赖库
在Linux系统中,运行以下命令来安装tesserocr的依赖库:
sudo apt-get install libtesseract-dev libjpeg-dev zlib1g-dev libpng-dev libtiff-dev libicu-dev libleptonica-dev
在Windows系统中,下载对应版本的tesseract-ocr程序,并添加至系统环境变量中。
- 安装tesserocr
在Linux系统中安装tesserocr可以通过以下命令来完成:
pip3 install tesserocr
在Windows系统中,运行以下命令来安装tesserocr:
pip install --global-option="build_ext" --global-option="--include-dir=/path/to/tesseract-ocr/include" --global-option="--library-dir=/path/to/tesseract-ocr/lib" tesserocr
需根据实际路径修改相关路径。
- 测试tesserocr
运行以下代码进行测试:
import tesserocr
from PIL import Image
image = Image.open('test.png')
result = tesserocr.image_to_text(image)
print(result)
示例说明1:读取本地图片!
将示例中的test.png替换成本地的图片路径,即可对该图片进行OCR识别。
示例说明2:读取在线图片!
from urllib.request import urlopen
from PIL import Image
import io
import tesserocr
url = 'https://example.com/image.png'
image_content = urlopen(url).read()
img = Image.open(io.BytesIO(image_content))
result = tesserocr.image_to_text(img)
print(result)
将url替换为您需要识别的图片url即可进行相应的OCR识别。
- 结束
至此,Python3安装OCR识别库tesserocr的攻略已经介绍完毕。希望这篇教程可以对您有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python3安装OCR识别库tesserocr过程图解 - Python技术站