php函数substr、mb_substr、mb_strcut截取中文比较

最新推荐文章于 2025-09-11 23:21:03 发布

转载最新推荐文章于 2025-09-11 23:21:03 发布 · 83 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://blog.51cto.com/gaoshan2016/1901856

文章标签：

#php

本文对比了PHP中三种常用的字符串截取方法：substr、mb_substr 和 mb_strcut 的使用效果，尤其是在处理中文字符串时的表现，并给出了适用场景及注意事项。

一、函数说明  substr、mb_substr、mb_strcut这三个函数都用来截取字符串，
所不同的是：substr是最简单的截取，无法适应中文；mb_substr是按字来切分字符串，
而mb_strcut是按字节来切分字符串，截取中文都不会产生半个字符的现象。   
这三个函数的前三个参数完全一致，即：第一个参数是操作对象第二个参数是截取的起始位置第三个
参数是截取的数量    mb_substr和mb_strcut还有第四个参数：第四个参数可以根据不同的字符
集进行设置
[php] view plain copy 
<?php  
  
//对待一个UTF8的中文字符是3个长度    
//对待一个gbk的中文字符是2个长度    
header("content-Type:text/html;charset=utf-8");    
    
//设置内部编码    
mb_internal_encoding('UTF-8');    
    
//测试     
$cn_str="钓鱼岛是中国的hehe";    
$en_str="this is just a test";    
    
    
//使用substr    
echo substr($cn_str,0,3).'<br/>'; //钓    
echo substr($en_str,0,3).'<br/><br/>';   //thi    
    
    
//使用mbsubstr()    
echo "mb_substr-3:".mb_substr($cn_str,0,3).'<br/>';   //钓鱼岛    按照字来划分     
echo "substr-3:".substr($cn_str,0,3).'<br/>';//钓   按照字节来划分      
echo "mb_strcut-3:".mb_strcut($cn_str,0,3).'<br/><br/>'; //钓   按照字节来划分    
  
  
echo "mb_substr-4:".mb_substr($cn_str,0,4).'<br/>';   //钓鱼岛    按照字来划分  
echo "substr-4:".substr($cn_str,0,4).'<br/>'; //钓   按照字节来划分(出现乱码)      
echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'<br/><br/>'; //钓 按照字节来划分(不会出现乱码)    
  
  
  
  
echo strlen($cn_str).'<br/>';   //26    
echo mb_strlen($cn_str).'<br/>';  //12    
echo iconv_strlen($cn_str).'<br/>';//26    
  
?>  
三、结论
substr、mb_strcut表现都不够理想，mb_substr可以正常使用，但前提是要安装PHP扩展库，
否则就要自己写一个适应各种情况的截取函数了。

转载于:https://blog.51cto.com/gaoshan2016/1901856