[wifi PSM]WMM-PS

https://www.cnblogs.com/sudochen/p/16292447.html

Beacon-> Tagged Parameter-> WMM/WME -> WME Qos Info -> U-APSD等于1才支持
在这里插入图片描述

<think>我们被询问关于Tesseract OCR配置参数`--psm 6 -l eng`的含义。下面将详细解释这两个参数。 </think>### Tesseract OCR 配置参数详解 `--psm 6 -l eng` 是传递给 Tesseract OCR 引擎的配置参数,用于控制 OCR 处理方式和语言设置。以下是详细解释和代码示例: #### 配置参数含义 ```python config = '--psm 6 -l eng' ``` 1. **`--psm 6`**: - PSM(Page Segmentation Mode)表示页面分割模式 - 数值 `6` 表示 **假设图像是一个统一的文本块** - 适合处理单列文本、表格单元格或图像中的单个文本区域 - 其他常见PSM模式: - `--psm 3`:完全自动分割(默认) - `--psm 4`:按列分割文本 - `--psm 7`:将图像视为单行文本 - `--psm 11`:稀疏文本(仅识别字母和数字) 2. **`-l eng`**: - `-l` 参数指定使用的语言 - `eng` 表示使用英语语言模型 - 支持的语言代码: - `chi_sim`:简体中文 - `chi_tra`:繁体中文 - `jpn`:日语 - `kor`:韩语 - `fra`:法语 - 可同时指定多种语言:`-l eng+chi_sim` #### 完整示例代码 ```python import pytesseract from PIL import Image # 加载图像 image = Image.open('sample_text.png') # 配置参数详解 config = '--psm 6 -l eng' # 假设统一文本块,使用英语 # 可选:添加更多参数 enhanced_config = ( '--psm 6 ' # 页面分割模式 '--oem 1 ' # OCR引擎模式:LSTM与传统结合 '-l eng ' # 语言:英语 '--dpi 300 ' # 假设图像DPI为300 '-c preserve_interword_spaces=1' # 保留单词间空格 ) # 执行OCR text = pytesseract.image_to_string(image, config=enhanced_config) print("识别结果:\n", text) ``` #### 优化配置的最佳实践 1. **根据图像内容选择PSM模式**: ```python def get_psm_mode(image_width, text_density): """ 根据图像特性动态选择PSM """ if text_density > 0.8: # 密集文本 return 4 # 按列分割 elif image_width < 300: # 窄图像(如表格单元格) return 6 # 统一文本块 else: # 默认自动 return 3 # 使用示例 psm = get_psm_mode(image.width, estimated_text_density) config = f'--psm {psm} -l eng' ``` 2. **多语言混合识别**: ```python # 同时识别中英文 config = '--psm 6 -l eng+chi_sim' # 添加多个语言包 # 需要额外下载语言数据:https://github.com/tesseract-ocr/tessdata ``` 3. **优化识别准确率的附加参数**: ```python optimized_config = ( '--psm 6 ' '-l eng ' '--oem 1 ' # 使用LSTM和传统OCR混合引擎 '-c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789 ' # 白名单字符 '-c load_system_dawg=0 ' # 禁用系统字典(用于特殊格式) '-c load_freq_dawg=0 ' # 禁用常用词字典 ) ``` #### PSM模式对照表 | PSM值 | 名称 | 适用场景 | |-------|------|----------| | 0 | 方向与脚本检测 | 自动检测文本方向 | | 1 | 自动分割 | 通用场景(默认) | | 3 | 完全自动分割 | 复杂布局 | | 4 | 单列文本 | 报纸、杂志 | | **6** | **统一文本块** | **图像中单一文本区域** | | 7 | 单行文本 | 表格标题、标签 | | 8 | 单个单词 | 图标标签 | | 11 | 稀疏文本 | 仅识别字母数字 | #### 语言模型使用建议 1. 下载所需语言包:`chi_sim.traineddata`(简体中文) 2. 放置到Tesseract的`tessdata`目录 3. 使用多语言组合:`-l eng+chi_sim` 优先英文,补充中文
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值