关于可见字符

ASCII码(ASCII码:请参考百度百科的解释)0~31及127(共33个)是控制字符或通信专用字符,是不可见字符,
如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;
通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
ASCII码值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
其余(32~126)为可见字符,其中ASCII码值为32的字符为空格。
可以调用C++的cctype库中的isprint函数来验证,是可打印的则返回true.
posted on 2011-12-18 09:19  Jackiesteed 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/jackiesteed/articles/2291597.html

### 可见字符的定义与分类 可见字符是指在计算机系统中能够被人类直观识别并显示出来的字符。这些字符通常对应于特定的标准编码集,例如ASCII、Unicode或其他多字节编码体系中的可打印字符集合。 #### ASCII 编码中的可见字符 在标准ASCII表中,可见字符主要包括以下几类[^5]: - **字母**: A-Z 和 a-z (大写和小写字母)。 - **数字**: 0-9。 - **标点符号和其他特殊符号**: 如 `!`, `"`, `#`, `$`, `%`, `&`, `'`, `(`, `)` 等。 - **空白符**: 虽然空格 (` `) 是一种特殊的不可见字符,但它属于可打印字符的一部分,在某些上下文中也被视为“可见”。 #### Unicode 中的可见字符 Unicode 提供了一个更广泛的字符集支持多种语言文字以及各种符号。除了上述提到的内容外,还包括但不限于[^1]: - 各种国际化的字母(如拉丁以外的语言字符)。 - 数学运算符和技术符号。 - 特殊用途的图形字符(如表情符号 🌟)。 以下是部分常见的可见字符示例: | 类型 | 字符举例 | |--------------|------------------------------| | 英文字母 | ABCdefg | | 阿拉伯数字 | 1234 | | 常见标点符号 | . , ! ? : ; | | 数学符号 | + - * / = ≠ ≤ ≥ | 需要注意的是,并非所有的可视图像都严格意义上算作传统意义上的‘字符’;例如图片或者复杂矢量图形并不在此讨论范围内。 对于程序设计而言,处理不同编码环境下的数据时需特别注意区分哪些是真正的可见字符而哪些可能是由于编码转换错误产生的伪字符或者是控制指令性质的数据片段。 ```python import unicodedata def is_visible_char(char): category = unicodedata.category(char) return not char.isspace() and category != 'Cc' and category != 'Cs' test_string = "Hello World!\n\t\u0007" visible_chars = ''.join([c for c in test_string if is_visible_char(c)]) print(visible_chars) ``` 此段代码展示了如何利用 Python 的内置库来检测给定字符串中的每一个单独字符是否为可见状态之一。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值