在正常情况下(字符编码为UTF-8),JS计算字符串的长度,不管其是中文汉字还是英文字母,每个汉字或每个字母的长度均为1。.例如:
- var str = "我me";
- alert(str.length);
- //结果为 3
但在某些特殊情况下,需要把汉字当做两个字符来看待(事实上每个汉字在计算机的存储中是占两个字节的),这样就不得不进行特殊处理了。
原理也很简单,就是利用该字符在Unicode字符集中的编码值来进行比较。例如,字符A的编码是65,字符B的编码是66,依此类推。小写字母从97开始编码,即字母a的编码是97,字母b的编码是98,依此类推。数字字符则是从48开始编码,字符0的编码是48,而字符9的编码是57。还有一些特殊符号如+、-等,在此就不举例了。
我们使用charCodeAt(char)来得到变量char所对应的Unicode编码,根据上面所描述的,英文、数字及一些特殊符号的Unicode编码是已知的,而且有一个范围,因此可以认为,不在此范围之内的字符,都可认为它是汉字,按长度为2来计算,因此就有了下面的这个函数:
- function getLength(str) {
- var len = str.length;
- var reLen = 0;
- for (var i = 0; i < len; i++) {
- if (str.charCodeAt(i) < 27 || str.charCodeAt(i) > 126) {
- // 全角
- reLen += 2;
- } else {
- reLen++;
- }
- }
- return reLen;
- }
原网址:http://www.sunchis.com/html/js/jssource/2011/0331/292.html