以下是Python调用百度OCR实现图片文字识别的详细攻略:
一、准备工作
1.1 注册百度云账户并创建应用
在百度云官网(https://cloud.baidu.com/)上注册一个账户,然后创建一个OCR应用。
1.2 安装Python SDK
百度云提供了Python SDK,我们可以通过pip下载并安装。
pip install baidu-aip
1.3 获取API Key和Secret Key
进入自己的百度云控制台,找到刚刚创建的OCR应用,获取API Key和Secret Key。
二、开发实现
2.1 引入百度OCR API
from aip import AipOcr
2.2 设置APPID/AK/SK并调用API
# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 定义参数变量
options = {
'language_type': 'CHN_ENG',
}
# 调用通用文字识别接口
result = client.basicGeneral(get_file_content(filePath), options)
# 打印识别结果
print(result)
2.3 参数说明
APP_ID
、API_KEY
、SECRET_KEY
:百度云控制台中获取到的应用信息。get_file_content(filePath)
:读取待识别的图片。options
:参数配置,此处配置为通用文字识别中文和英文混合。client.basicGeneral
:调用通用文字识别API,返回识别结果。
三、示例说明
3.1 单张图片文字识别
# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
FILE_PATH = '你的图片路径'
# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 定义参数变量
options = {
'language_type': 'CHN_ENG',
}
# 调用通用文字识别接口
result = client.basicGeneral(get_file_content(FILE_PATH), options)
# 打印识别结果
print(result)
3.2 多张图片文字识别
# 定义常量
APP_ID = '你的APPI_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
FILE_DIR = '你的图片目录'
# 初始化AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 定义参数变量
options = {
'language_type': 'CHN_ENG',
}
# 遍历目录中的图片,并识别文字
for file in os.listdir(FILE_DIR):
if file.endswith('.jpg') or file.endswith('.png'):
result = client.basicGeneral(get_file_content(os.path.join(FILE_DIR, file)), options)
print(result)
以上就是Python调用百度OCR实现图片文字识别的示例代码和攻略,希望能对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python调用百度OCR实现图片文字识别的示例代码 - Python技术站