mrytsr PHP截取中文字符串,无乱码,基于正则

本文详细介绍了如何使用PHP实现支持中文的字符串长度计算和截取功能,通过自动检测编码,确保在UTF-8与GBK环境下都能正确处理包含中文的字符串,避免乱码问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/**
 * @brief strlen_mb 计算字符串长度,支持中文,自动检测编码,UTF-8与GBK测试通过
 *
 * @param $str
 *
 * @return
 */
function strlen_mb($str){
    $mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
    $patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '})/';
    $match = preg_match_all($patt, $str, $groups);
    if($groups){
        return count($groups[0]);
    }else{
        return false;
    }
}
 
/**
 * @brief substr_mb 截取字符串,中文防乱码,自动检测编码,UTF-8与GBK测试通过
 *
 * @param $str
 * @param $start
 * @param $len
 *
 * @return
 */
function substr_mb($str, $start, $len){
    $mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
    $patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '}){' . $len . '}/';
    preg_match($patt, $str, $groups);
    if($groups){
        return $groups[0];
    }else{
        return false;
    }
}
 
echo '<meta charset=utf-8>';
$str = '北京dd欢迎你';
for($i = 0; $i <= strlen_mb($str); $i++){
    var_dump(substr_mb($str, 0, $i));
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值