tesseract的psm模式有哪些?
软件: tessera
Tesseract OCR的PSM(页面分割模式)共有14种,适用于不同场景的文本识别。以下是主要模式分类及适用场景:
一、基础方向检测组模式
OSD_ONLY :仅检测文字方向(不识别内容),适用于判断图像正反。
AUTO_OSD :自动检测方向并识别中英文,适合混合语言场景。
SPARSE_TEXT_OSD :检测稀疏文字方向,适用于多语言混合或旋转文档。
二、常规文档组模式

AUTO :默认模式,自动处理多列/段落,适合标准排版文档。
SINGLE_COLUMN :强制单列识别,避免跨列误连,适合杂志文章。
SINGLE_BLOCK :将区域视为整块文本,适合简历、表格等整齐布局。
三、精准定位组模式
SINGLE_LINE :识别单行文本,如车牌、标语。
SINGLE_WORD :识别单个单词,避免字符拆分,适合验证码。
SINGLE_CHAR :逐字识别,适合字符分类任务。
四、特殊排版组模式
SINGLE_BLOCK_VERT_TEXT :识别竖排文本(需安装垂直语言包),如古籍、日文。
CIRCLE_WORD :识别环形排列文字(如徽标),需特殊处理。
五、高级处理组模式
SPARSE_TEXT :逐字识别分散文本,适合街景广告牌。
RAW_LINE :绕过预处理直接识别紧密排列的计算机生成字体。
使用建议 :根据文本特征选择模式,例如识别身份证号码可用PSM 6将整张图片视为文本块,并通过--c tessedit_char_whitelist限制字符集提高准确率。
一、基础方向检测组模式
OSD_ONLY :仅检测文字方向(不识别内容),适用于判断图像正反。
AUTO_OSD :自动检测方向并识别中英文,适合混合语言场景。
SPARSE_TEXT_OSD :检测稀疏文字方向,适用于多语言混合或旋转文档。
二、常规文档组模式

AUTO :默认模式,自动处理多列/段落,适合标准排版文档。
SINGLE_COLUMN :强制单列识别,避免跨列误连,适合杂志文章。
SINGLE_BLOCK :将区域视为整块文本,适合简历、表格等整齐布局。
三、精准定位组模式
SINGLE_LINE :识别单行文本,如车牌、标语。
SINGLE_WORD :识别单个单词,避免字符拆分,适合验证码。
SINGLE_CHAR :逐字识别,适合字符分类任务。
四、特殊排版组模式
SINGLE_BLOCK_VERT_TEXT :识别竖排文本(需安装垂直语言包),如古籍、日文。
CIRCLE_WORD :识别环形排列文字(如徽标),需特殊处理。
五、高级处理组模式
SPARSE_TEXT :逐字识别分散文本,适合街景广告牌。
RAW_LINE :绕过预处理直接识别紧密排列的计算机生成字体。
使用建议 :根据文本特征选择模式,例如识别身份证号码可用PSM 6将整张图片视为文本块,并通过--c tessedit_char_whitelist限制字符集提高准确率。