编程基础:Unicode、二进制与HTML知识详解
1. Unicode字符子集
Unicode是一种为全球各种文字和符号分配唯一编码的标准。这里主要介绍处理西欧语言常用的基本拉丁和拉丁 - 1子集。
- 常用控制字符
| 字符 | 代码 | 十进制 | 转义序列 |
| ---- | ---- | ---- | ---- |
| Tab | “\u0009” | 9 | “\t” |
| 换行符 | “\u000A” | 10 | “\n” |
| 回车符 | “\u000D” | 13 | “\r” |
| 空格 | “\u0020” | 32 | |
-
基本拉丁(ASCII)子集
基本拉丁子集包含了常见的英文字母、数字和标点符号等。例如,大写字母A的代码是”\u0041”,十进制值为65;小写字母a的代码是”\u0061”,十进制值为97。
| 字符 | 代码 | 十进制 | 字符 | 代码 | 十进制 | 字符 | 代码 | 十进制 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| @ | “\u0040” | 64 | ` | “\u0060” | 96 |! | “\u0021” | 33 |
| A | “\u0041” | 65 | a | “\u0061” | 97 | ” | “\u0022” | 34 |
| B | “\u0042” | 66 | b | “\u006
超级会员免费看
订阅专栏 解锁全文
308

被折叠的 条评论
为什么被折叠?



