字符编码、语言区域与表格数据处理全解析
1. 字符集与编码方案
1.1 字符集分类
字符集的分类是处理文本数据的基础,它为不同类型的字符提供了统一的标识和组织方式。以下是详细的字符集分类信息:
| 主要类别 | 简称 | 全称 | 子类 | 简称 | 全称 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| L | Letter | 字母 | Lu | Uppercase_Letter | 大写字母 |
| | | | Ll | Lowercase_Letter | 小写字母 |
| | | | Lt | Titlecase_Letter | 首字母大写字母 |
| | | | Lm | Modifier_Letter | 修饰字母 |
| | | | Lo | Other_Letter | 其他字母 |
| M | Mark | 标记 | Mn | Nonspacing_Mark | 非间距标记 |
| | | | Mc | Spacing_Mark | 间距标记 |
| | | | Me | Enclosing_Mark | 封闭标记 |
| N | Number | 数字 | Nd | Decimal_Number | 十进制数字 |
| | | | Nl | Letter_Number | 字母数字 |
| | | | No | Other_Number | 其他数字 |
| P | Punctuation | 标点符号 | Pc | Connector_Punctuation | 连接标点 |
超级会员免费看
订阅专栏 解锁全文
6623

被折叠的 条评论
为什么被折叠?



