destoon学习记录(一)--支持中文的字符串切割函数

本文介绍了如何在PHP中创建一个支持中文的字符串切割函数`dsustr()`,它考虑了不同编码下汉字的字节长度,以防止乱码。函数通过分析字符的ASCII值和使用`strlen()`、`ord()`等函数确保正确切割中文字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

function dsubstr($string, $length, $suffix = '', $start = 0) {
 if($start) {
  $tmp = dsubstr($string, $start);
  $string = substr($string, strlen($tmp));
 }
 $strlen = strlen($string);
 if($strlen <= $length) return $string;
 $string = str_replace(array('&quot;', '&lt;', '&gt;'), array('"', '<', '>'), $string);
 $length = $length - strlen($suffix);
 $str = '';
 if(strtolower(DT_CHARSET) == 'utf-8') {
  $n = $tn = $noc = 0;
  while($n < $strlen) {
   $t = ord($string{$n});
   if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {
    $tn = 1; $n++; $noc++;
   } elseif(194 <= $t && $t <= 223) {
    $tn = 2; $n += 2; $noc += 2;
   } elseif(224 <= $t && $t <= 239) {
    $tn = 3; $n += 3; $noc += 2;
   } elseif(240 <= $t && $t <= 247) {
    $tn = 4; $n += 4; $noc += 2;
   } elseif(248 <= $t && $t <= 251) {
    $tn = 5; $n += 5; $noc += 2;
   } elseif($t == 252 || $t == 253) {
    $tn = 6; $n += 6; $noc += 2;
   } else {
    $n++;
   }
   if($noc >= $length) break;
  }
  if($noc > $length) $n -= $tn;
  $str = substr($string, 0, $n);
 } else {
  for($i = 0; $i < $length; $i++) {
   $str .= ord($string{$i}) > 127 ? $string{$i}.$string{++$i} : $string{$i};
  }

 }
 $str = str_replace(array('"', '<', '>'), array('&quot;', '&lt;', '&gt;'), $str);
 return $str == $string ? $str : $str.$suffix;
}

中文的字符串切割跟英文字符不一样。一个“A”是一个字节,一个汉字可能因为编码格式的不同,占2个、3个字节,利用这种编码规则进行字符串切割,避免乱码问题。

利用到了php的几个函数:strlen():以该字符串的字节数来统计当前字符串的长度;ord():返回字符串首字符的ASCII值,若为汉字等其他字符,则返回多个ASCII值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值