正则匹配双字节文字

最新推荐文章于 2021-04-19 15:00:06 发布

原创最新推荐文章于 2021-04-19 15:00:06 发布 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#prototype

js 专栏收录该内容

31 篇文章

订阅专栏


String.prototype.lenB=function()
          {
              return this.replace(/[^\x00-\xff]/g,"##");
          }

在正则中\x指的是十六进制！

但如果写成 \x0-\xf

js会自动纠错的

因为一个字节是八个二进制位！所以他会默认为两位\x00-\xf0（大体上具体补成什么样，无法考证！因为 f0在window系统下不识别！）
ascii发展的现在已有128扩展到现在256
详见维基百科
[url]http://zh.wikipedia.org/zh/ASCII[/url]

另外还有延伸的美国标准信息交换码
EASCII（Extended ASCII，延伸美国标准信息交换码）是将ASCII码由7位扩充为8位而成。EASCII的内码是由0到255共有256个字符组成。EASCII码比ASCII码扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号。

ISO/IEC 8859是最常见的8位字符编码。除此之外，不同的操作系统都会有它的8位字符编码。

下列符号是ISO/IEC 8859-1所包含的符号，是在万维网和中使用的扩展ASCII字符集中最常见的的符号。