界面输入任何一个分隔符分割文本中的内容

该博客介绍了工具类的作用,即把界面输入字符转换为Unicode字符并分割。强调需掌握Unicode,可查看码表。还对代码判断部分进行解析,通过‘/’‘\t’等字符示例说明不同字符转换为Unicode后的处理分支,最后提及要分割txt文本内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

工具类

public class UnicodeUtil {

    /**
     * 把字符串转成Unicode形式的字符串
     */
    public static String encode(String src) throws Exception {
        char c;
        StringBuilder str = new StringBuilder();
        int intAsc;
        String strHex;
        for (int i = 0; i < src.length(); i++) {
            c = src.charAt(i);
            intAsc = (int) c;
            strHex = Integer.toHexString(intAsc);
            if (intAsc > 128)
                str.append("\\u" + strHex);
            else if(intAsc<128 && intAsc>=16)
                str.append("\\u00" + strHex);
            else
                str.append("\\u000" + strHex);
        }
        return str.toString();
    }

}

作用,就是界面输入的字符,转换成unicode的字符再进行分割

前提需要掌握unicode
可查看unicode码表
https://www.cnblogs.com/csguo/p/7401874.html

对上面代码判断部分做解析
先看码表
在这里插入图片描述
unicode的表示是"\u0000"
如果界面输入的一个字符是’/’,那么查码表可知为’\u002F’
那么字符(’/’)转换为unicode形式的字符表示就是(’\u002F’)
十六进制002F的十进制是31,是小于128,所以走的是第二分支
else if(intAsc<128 && intAsc>=16)

如果界面输入的是’\t’制表符,对应的unicode是’\u0009’,十进制就是9
所以走分支是
else
str.append("\u000" + strHex);

如下需要分割txt文本的内容
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值