php字符串截取固定值并且多余部分用省略号代替

本文探讨了在UTF8和GBK编码下,中文和英文字符的字节数差异,并指出在UTF8编码中,如何根据字符的第一个字节判断其占用的字节数。对于需要截取字符串并用省略号替换多余部分的情况,提供了判断和处理的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

utf8编码下:中文占 3个字节,英文和数字占 1个字节(可变编码)(变长编码)

gbk编码下:所有的中文、英文、数字都占2个字节(定长编码)

 

例如,有一个字符串,$str = “地方见21423435过很多苦法dsfsdfsdgsd规和地方给iu

如果是gbk编码:截取5个字符 ,相当于截取10个字节  substr()截取的是字节数

如果是utf8编码的话:截取5个字符:不知道截取多少个字节,因为不确定是中文还是英文

 

那么怎么判断呢?

通常根据一个字符的第一个字节,如果这个字节 的ASCII码 大于224 3个字节,如果第一个字节的ASCII码,大于192 2个字节,如果第一个字节的ASCII码小于192,占1个字节


例子:

function GetPartStr($str,$len)//$str字符串   $len 控制长度
{
  $one=0;
  $partstr='';
  for($i=0;$i<$len;$i++)
{ $sstr=substr($str,$one,1);
 if(ord($sstr)>224){
 $partstr.=substr($str,$one,3);
 $one+=3;
 }elseif(ord($sstr)>192){
 $partstr.=substr($str,$one,2);
 $one+=2;
 }elseif(ord($sstr)<192){
 $partstr.=substr($str,$one,1);
 $one+=1;
 }
}
if(strlen($str)<$one){
   return $partstr;}else{
return $partstr.'....';
}
}
$asd='df袁过堂风然后他让同一日腾';
 echo GetPartStr($asd,10);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值