美丽心灵公益论坛

查看: 1655|回复: 3

PyTesseract详解

[复制链接]
累计签到:57 天
连续签到:1 天

981

主题

461

回帖

8037

积分

版主

Rank: 7Rank: 7Rank: 7

积分
8037
发表于 2022-4-7 20:52:48| 字数 300 来自手机 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
设置Tesseract的绝对路径
print(pytesseract.get_languages(config=''))
获取Tesseract已安装的语言包
print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))
获取法语识别结果,lang可以是任意支持语言
get_tesseract_version()获取Tesseract版本
累计签到:57 天
连续签到:1 天

981

主题

461

回帖

8037

积分

版主

Rank: 7Rank: 7Rank: 7

积分
8037
 楼主| 发表于 2022-4-7 20:54:06| 字数 29 来自手机 | 显示全部楼层
以上lang如果是多语言也可以lang='eng+fra'
累计签到:57 天
连续签到:1 天

981

主题

461

回帖

8037

积分

版主

Rank: 7Rank: 7Rank: 7

积分
8037
 楼主| 发表于 2022-4-7 20:55:35| 字数 47 来自手机 | 显示全部楼层
image_to_alto_xml()返回值记录在Tesseract的Alto XML格式文件中
累计签到:57 天
连续签到:1 天

981

主题

461

回帖

8037

积分

版主

Rank: 7Rank: 7Rank: 7

积分
8037
 楼主| 发表于 2022-4-7 20:57:18| 字数 278 来自手机 | 显示全部楼层
支持OpenCV格式
import cv2

img_cv = cv2.imread(r'/<path_to_image>/digits.png')

# By default OpenCV stores images in BGR format and since pytesseract assumes RGB format,
# we need to convert from BGR to RGB format/mode:
img_rgb = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB)
print(pytesseract.image_to_string(img_rgb))
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|免责及版权声明|关于|美丽心灵公益论坛

GMT+8, 2025-9-19 12:03 , Processed in 0.041228 second(s), 30 queries .

Powered by Discuz! X3.4

!copyright!

快速回复 返回顶部 返回列表