Java将汉字转拼音以及判断字符是否为汉字

首先是将汉字转换为拼音:
导入依赖:

 <dependency>
     <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml</artifactId>
      <version>4.1.2</version>
  </dependency>

创建转拼音的静态方法toPinyin,也可以封装成工具类,使用工具类进行调用:

public static String toPinyin(String chinese){
        String pinyinStr = "";
        char[] newChar = chinese.toCharArray();
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
        for (int i = 0; i < newChar.length; i++) {
            if (newChar[i] > 128) {
                try {
                    pinyinStr += PinyinHelper.toHanyuPinyinStringArray(newChar[i], defaultFormat)[0];
                } catch (BadHanyuPinyinOutputFormatCombination e) {
                    e.printStackTrace();
                }
            }else{
                pinyinStr += newChar[i];
            }
        }
        return pinyinStr;
    }

在这里插入图片描述
在方法中调用成功,这里我需要大写并且每个汉字之间保持空格,操作如下:

  String name="西青果颗粒藏青果颗";
        String[] split = name.split("");
        String finalPy="";
        for (String s : split) {
            String s1 = toPinyin(s).toUpperCase(Locale.ROOT);
            finalPy= finalPy+" "+s1;
        }
        System.out.println(finalPy.trim());

在这里插入图片描述

这里一切都没有问题,但是如果当字符串中包含非英文的特殊符号,会报错如下:
在这里插入图片描述
这里需要进行替换,将中文下的各种符号替换为英文状态下的:
使用String的replaceAll方法进行替换,如图:在这里插入图片描述
后来出现了罗马符号各种,这种方式就太麻烦了,可以判断每个字符是否是汉字,是汉字就调用toPinyin方法进行转换,不是汉字则不转,实现的方法有很多,这里使用一种:通过unicode编码范围进行判断:

Pattern p2 = Pattern.compile("[\u4e00-\u9fa5]");
 Matcher m2 = p2.matcher(s);

在这里插入图片描述
可以看到,不管什么符号,都会原样输出,
这里附上其他编码范围:

类型范围
汉字[0x4e00,0x9fa5]
数字[0x30,0x39]
小写字母[0x61,0x7a]
大写字母[0x41,0x5a]

参考链接:java中判断字符串是否是中文的方法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值