截取一个字符串的函数,输入为一个字符串和字节数,输出为为按字节截取的字符串,但是要保证汉字不会被截半个...

本文介绍了一种在Java中安全截取包含汉字的字符串的方法,确保不会截断汉字,使用GBK编码避免UTF-8下汉字被误分为三个字节的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

看面试程序时候看到一个这样的题目,自己用最基础的方式实现了一下。

题目:

截取一个字符串的函数,输入为一个字符串和字节数,输出为为按字节截取的字符串,但是要保证汉字不会被截半个,

如 “我ABC” 4,应该被截为“我AB”:输入“我ABC汉DEF”,应该输出为“我ABC”而不是“我ABC”+汉的半个。

 

题解:

 /**
     * 截取字符串方法
     * @param str
     * @param offset
     * @return
     * @throws UnsupportedEncodingException
     */
    public static String mySubstr(String str, int offset) throws UnsupportedEncodingException {
        byte[] bytes = str.getBytes("GBK");
        byte[] newByte = new byte[bytes.length];
        for (int i =0; i < bytes.length; i++) {
            if (i==offset-1) {
                if (bytes[i] < 0) {   //如果是负数,说明中文字符被截断了
                    break;
                }else {
                    newByte[i] = bytes[i];
                    break;
                }
            }
            newByte[i] = bytes[i];
        }
        return new String(newByte);
    }

说明:由于在编译器中默认是UTF-8格式,所以会出现中文占用为三个字节的问题,所以我在代码中将字符转为byte数组时候转为GBK的,这样的结果就是正确的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值