php中文字符截取的三种方案(转自橡树眼)

本文介绍了使用PHP处理中文字符串的几种方法,包括按字数截取UTF8字符及支持多种编码(gb2312, gbk, utf-8, big5)的中文截取函数。这些实用函数能帮助开发者有效解决中文字符处理难题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

字符是一个很烦人而难以解决的问题,下面收集几个PHP对中文截取的代码:
1、按字数截取UTF8字符

/**
* @abstract 按字数截取UTF8字符  
*/  
function utf8_substr($str, $start, $length) {
if (function_exists('mb_substr')) {  
  return mb_substr($str, $start, $length, 'UTF-8');
}

  
preg_match_all("/./u", $str, $arr);  
return implode("", array_slice($arr[0], $start, $length));
}

2、支持gb2312,gbk,utf-8,big5 中文截取

/*
* 中文截取,支持gb2312,gbk,utf-8,big5
*
* @param string $str 要截取的字串  
* @param int $start 截取起始位置
* @param int $length 截取长度
* @param string $charset utf-8|gb2312|gbk|big5 编码
* @param $suffix 是否加尾缀
*/
public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){
      if(function_exists("mb_substr")){  
          if(mb_strlen($str, $charset) <= $length) return $str;
          $slice = mb_substr($str, $start, $length, $charset);
      }else {
          $re['utf-8']  = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]|[/xf0-/xff][/x80-/xbf]/";
          $re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";  
          $re['gbk']          = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";
          $re['big5']          = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";
          preg_match_all($re[$charset], $str, $match);
          if(count($match[0]) <= $length) return $str;
          $slice = join("",array_slice($match[0], $start, $length));  
      }
      if($suffix) return $slice."…";
      return $slice;
}  
  
这两个是比较不错的函数,下面这个以类的思想来做,仅供参考,不做多评...代码如下:

3、类实现方法

菊子曰 这就是 菊子曰啦!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值