编程中的字符编码、命名规范与数据查询技术
1. 字符编码:从 ASCII 到 Unicode
在编程领域,字符编码是一个基础且关键的概念。早期的 ASCII 和 EBCDIC 编码,能够表示 256 个字符和符号,这对于英语和西欧语言来说是足够的。然而,对于使用不同字母表的亚洲和其他语言,这些编码所能提供的字符数量就显得捉襟见肘了。许多这类语言还使用表意符号(ideograms)来表示多个单词和概念,这进一步加剧了编码的复杂性。
为了解决这个问题,Unicode 应运而生。Unicode 是一种 16 位的编码方案,它可以用超过 65,000 个字符和符号来表示世界上所有现行、经典和历史的语言。其中,有 30,000 个代码被预留作未来使用,比如用于表示古代语言;还有 6,000 个代码用于私有用途。值得一提的是,现有的 ASCII 编码数据与 Unicode 是完全兼容的,因为 Unicode 的前 256 个代码与 ASCII 相同。目前,Unicode 已经在多个操作系统中得到了实现,包括 Windows 7、Windows Vista、Windows XP、Mac OS X 和 Linux。如果想查看完整的 Unicode 字符表,可以访问 www.unicode.org 。
以下是部分 Unicode 键盘字符的编码表:
| Decimal | Hexadecimal | Octal | Binary | Character |
| ---- | ---- | ---- | ---- | ---- |
| 32 | 20 | 040 | 00100
字符编码、命名规范与LINQ查询
超级会员免费看
订阅专栏 解锁全文
3665

被折叠的 条评论
为什么被折叠?



