utf编码的中文字符串截取处理(避免截取半字/乱码的情况)

本文介绍了一种用于截取UTF-8编码中文字符串的方法,并在字符串长度超过指定长度时添加省略号。修正了网络上的代码bug,确保正确处理各种字符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如下代码实现对utf-8编码的中文字符串进行截取,并在字符串长度超过截取长度时补上"..."省略号([color=red]网络上搜到的代码在判断的条件上有点小bug,这里做了修正[/color]).
关于utf-8编码的详细资料,参看[url=http://zh.wikipedia.org/wiki/UTF-8]UTF-8[/url]

<?php
function cutstr($sourcestr, $cutlength){
$returnstr = '';
$i = 0;
$n = 0;
$str_length = strlen($sourcestr); //字符串的字节数
while(($n < $cutlength) && ($i <= $str_length)){
$temp_str = substr($sourcestr, $i, 1);
$ascnum = Ord($temp_str); //得到字符串中第$i位字符的ascii码
if($ascnum >= 224){ //如果ASCII位高与224,
$returnstr = $returnstr.substr($sourcestr, $i, 3); //根据UTF-8编码规范,将3个连续的字符计为单个字符
$i = $i + 3; //实际Byte计为3
$n ++; //字串长度计1
}
else if($ascnum >= 192){ //如果ASCII位高与192,
$returnstr = $returnstr.substr($sourcestr, $i, 2); //根据UTF-8编码规范,将2个连续的字符计为单个字符
$i = $i + 2; //实际Byte计为2
$n ++; //字串长度计1
}
else if($ascnum >= 65 && $ascnum <= 90){ //如果是大写字母,
$returnstr = $returnstr.substr($sourcestr, $i, 1);
$i = $i + 1; //实际的Byte数仍计1个
$n ++; //但考虑整体美观,大写字母计成一个高位字符
}
else{ //其他情况下,包括小写字母和半角标点符号,
$returnstr = $returnstr.substr($sourcestr, $i, 1);
$i = $i + 1; //实际的Byte数计1个
$n = $n + 0.5; //小写字母和半角标点等与半个高位字符宽...
}
}
if($str_length > $i){ //$str_length > $cutlength?
$returnstr = $returnstr."..."; //超过长度时在尾处加上省略号
}
return $returnstr;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值