如何实现按字节截取字符串(中文占2字节,英文占1字节,substring())?

本文介绍了一种处理包含中文和英文字符的字符串的方法,通过按字节进行截取来确保中文字符不会被截断。示例代码展示了如何使用Java实现这一功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

str = "我a智能abc"

substring(str, 5) 会截取成为 “我a智能a”

现在要实现中文占2字节,英文占1字节,按字节截取 ,输出应该为"我a智"



public class SubString{
	
	/**
	*
	*/
	public static int trimGBK(byte[] buf,int n){
		int num = 0;
		boolean bChineseFirstHalf = false;
		for(int i=0; i<n; i++){
			if(buf[i]<0 && !bChineseFirstHalf){ //是中文的情况,num不用++
				bChineseFirstHalf = true;
			}else{
				num++;
				bChineseFirstHalf = false;
			}
			
		}
		return num;
	}
	
	public static void main(String[] args){
		String str = "我a智能abc";
		try{
			//使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组。
			int num = trimGBK(str.getBytes("GBK"),5); 
			System.out.println(str.substring(0,num)); //输出"我a智"
		}catch(Exception e){
			e.printStackTrace();
		}
	
		//System.out.println(str.substring(0,5)); //输出"我a智能a"
	}
}

/*
String str = "我a智能abc";
for(int i=0; i<str.getBytes("GBK").length; i++){
	System.out.println(str.getBytes("GBK")[i]);
}
输出:-50 -46 97 -42 -57 - 60 -36 97 98 99
中文是两个负数,英文是1个正数
*/


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值