javascript 判断中文字符长度

本文介绍了一种JavaScript中扩展字符串对象的方法,通过增加gblen和gbtrim两个实用函数,实现对字符串长度的特殊计算及根据指定长度进行智能截取的功能。此方法特别适用于处理包含中英文混合的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

<script language="javascript">   
String.prototype.gblen = function() {   
    var len = 0;   
    for (var i=0; i<this.length; i++) {   
        if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {   
            len += 2;   
        } else {   
            len ++;   
        }   
    }   
    return len;   
}   
String.prototype.gbtrim = function(len, s) {   
    var str = '';   
    var sp  = s || '';   
    var len2 = 0;   
    for (var i=0; i<this.length; i++) {   
        if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {   
            len2 += 2;   
        } else {   
            len2 ++;   
        }   
    }   
    if (len2 <= len) {   
        return this;   
    }   
    len2 = 0;   
    len  = (len > sp.length) ? len-sp.length: len;   
    for (var i=0; i<this.length; i++) {   
        if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {   
            len2 += 2;   
        } else {   
            len2 ++;   
        }   
        if (len2 > len) {   
            str += sp;   
            break;   
        }   
        str += this.charAt(i);   
    }   
    return str;   
}   
var str1 = '我们都是中国人(Chinese)';   
document.write('str1 = '+ str1 +'');   
document.write('length = '+ str1.gblen() +'');   
document.write('gbtrim(10) = '+ str1.gbtrim(10) +'');   
document.write('gbtrim(10, /'…/') = '+ str1.gbtrim(10, '…') +'');   
document.write('gbtrim(12, /'-/' ) = '+ str1.gbtrim(12, '-') +'');   
   
// gbtrim(len 截取长度,按英文字节长度计算, s截取后的省略字符,如"…" )   
// 备注: 这里中文字符都是当作两个长度来计算的,所以gbtrim中的len为10时,是显示最多5个汉字的。   
// 当汉字数大于5时,由于截取后加上“…”,所以只显示4个汉字。   
</script>

JavaScript中,判断中文字符长度时需要注意,一个中文字符在计算机中通常占用的字节数与英文字符是不同的。大多数的中文字符在UTF-8编码下占用3个字节,而英文字符通常占用1个字节。因此,直接使用字符串的`.length`属性得到的长度并不能真实反映中文字符的数量。为了准确计算中文字符长度,我们需要编写一个函数,该函数能够区分中文字符和英文字符,并正确计算中文字符的数量。 以下是一个简单的函数示例,用于计算中文字符长度: ```javascript function ChineseCharLength(str) { var len = 0; for (var i = 0; i < str.length; i++) { if (str.charCodeAt(i) > 127) { len++; // 对于中文字符,Unicode值大于127 } } return len; } ``` 这个函数通过遍历字符串中的每个字符,并检查其字符编码来判断是否为中文字符。如果字符的Unicode值大于127,则认为它是一个中文字符。这里需要注意的是,这个判断方法是基于Unicode编码的大致范围,并不是非常严格的判断标准,因为在Unicode编码中,有些特殊符号和表情符号等也可能具有较大的编码值。 如果使用的是正则表达式,可以采用以下方法: ```javascript function ChineseCharLength(str) { return (str.match(/[\u4e00-\u9fa5]/g) || []).length; } ``` 这里使用了正则表达式`/[\u4e00-\u9fa5]/g`,它匹配Unicode编码范围在`\u4e00`到`\u9fa5`之间的中文字符,该范围大致涵盖了常用的中文字符
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值