function cn_substr($string, $start = 0,$sublen, $code = 'UTF-8')
{
if($code == 'UTF-8')
{
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa, $string, $t_string);
if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen));
return join('', array_slice($t_string[0], $start, $sublen));
}
else
{
$start = $start*2;
$sublen = $sublen*2;
$strlen = strlen($string);
$tmpstr = '';
for($i=0; $i< $strlen; $i++)
{
if($i>=$start && $i< ($start+$sublen))
{
if(ord(substr($string, $i, 1))>129)
{
$tmpstr.= substr($string, $i, 2);
}
else
{
$tmpstr.= substr($string, $i, 1);
}
}
if(ord(substr($string, $i, 1))>129) $i++;
}
if(strlen($tmpstr)< $strlen ) $tmpstr.= "...";
return $tmpstr;
}
}
$string = "中国北京,welcome!";
echo cn_substr($string,0,10); //输出 中国北京,welco
No related posts.
该博客详细解析了一个名为`cn_substr`的字符串截取函数,该函数主要用于UTF-8编码的字符串处理。它能从指定位置开始,截取指定长度的字符,并确保截取的字符是完整的中文字符。在非UTF-8编码下,函数同样能正确处理。通过示例代码,博主展示了如何使用此函数来截取字符串中国北京,welcome! 输出为中国北京,welco。
2290

被折叠的 条评论
为什么被折叠?



