JAVA实现汉字转换为拼音 pinyin4j/JPinyin

本文对比了pinyin4j和jpinyin两个库在将中文转换为拼音方面的功能和优势。pinyin4j适用于基本的汉字转拼音需求,而jpinyin提供了更丰富的特性,包括声调标记、数字声调、多音字识别、简繁体转换等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:

最近项目需要对接外部系统,需要使用到把中文名称转化为拼音。在此先简单记录一下使用到的两个 jar。
pinyin4j 、 jpingyin。

		<!-- 汉字转换为拼音pinyin4j  -->
        <dependency>
            <groupId>com.belerweb</groupId>
            <artifactId>pinyin4j</artifactId>
            <version>2.5.1</version>
        </dependency>
        <!-- 汉字转换为拼音 jpinyin -->
        <dependency>
            <groupId>com.github.stuxuhai</groupId>
            <artifactId>jpinyin</artifactId>
            <version>1.1.3</version>
        </dependency>

pinyin4j 的使用

package com.rh.commonutils.pinyin;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * pinyin4j汉字转拼音工具类
 *
 */
public class ChangeToPinYin {

    //pinyin4j格式类
    private static HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
    //拼音字符串数组
    private static String[] pinyin;

    static {
        // 设置不带声调标识
        format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
        // 设置字符大写
        format.setCaseType(HanyuPinyinCaseType.UPPERCASE);
    }

    /**
     * 对单个字进行转换
     *
     * @param pinYinStr 需转换的汉字字符串
     * @return 拼音字符串数组
     */
    public static String getCharPinYin(char pinYinStr) {
//        format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
        try {
            //执行转换
            pinyin = PinyinHelper.toHanyuPinyinStringArray(pinYinStr, format);
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

        //pinyin4j规则,当转换的符串不是汉字,就返回null
        if (pinyin == null) {
            return null;
        }

        //多音字会返回一个多音字拼音的数组,pinyiin4j并不能有效判断该字的读音
        return pinyin[0];
    }

    /**
     * 对单个字进行转换
     *
     * @param pinYinStr
     * @return
     */
    public static String getStringPinYin(String pinYinStr) {
        StringBuffer sb = new StringBuffer();
        String tempStr = null;
        //循环字符串
        for (int i = 0; i < pinYinStr.length(); i++) {

            tempStr = getCharPinYin(pinYinStr.charAt(i));
            if (tempStr == null) {
                //非汉字直接拼接
                sb.append(pinYinStr.charAt(i));
            } else {
                sb.append(tempStr);
            }
        }
        return sb.toString();
    }

    public static void main(String[] args) {
        // 多音字无法正确处理,会返回词组,只能取其中一个
        String str = "参差";
        System.out.println(getStringPinYin(str));
        char c = '你';
        System.out.println(getCharPinYin(c));
    }

}

jpinyin 的使用

package com.rh.commonutils.pinyin;


import com.github.stuxuhai.jpinyin.ChineseHelper;
import com.github.stuxuhai.jpinyin.PinyinFormat;
import com.github.stuxuhai.jpinyin.PinyinHelper;

public class ChangeToPinYinJP {

    /**
     * 转换为有声调的拼音字符串
     *
     * @param pinYinStr 汉字
     * @return 有声调的拼音字符串
     */
    public static String changeToMarkPinYin(String pinYinStr) {
        String tempStr = null;
        try {
            tempStr = PinyinHelper.convertToPinyinString(pinYinStr, " ", PinyinFormat.WITH_TONE_MARK);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }


    /**
     * 转换为数字声调字符串
     *
     * @param pinYinStr 需转换的汉字
     * @return 转换完成的拼音字符串
     */
    public static String changeToNumberPinYin(String pinYinStr) {
        String tempStr = null;
        try {
            tempStr = PinyinHelper.convertToPinyinString(pinYinStr, " ", PinyinFormat.WITH_TONE_NUMBER);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }

    /**
     * 转换为不带音调的拼音字符串
     *
     * @param pinYinStr 需转换的汉字
     * @return 拼音字符串
     */
    public static String changeToTonePinYin(String pinYinStr) {
        String tempStr = null;
        try {
            tempStr = PinyinHelper.convertToPinyinString(pinYinStr, " ", PinyinFormat.WITHOUT_TONE);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }

    /**
     * 转换为每个汉字对应拼音首字母字符串
     *
     * @param pinYinStr 需转换的汉字
     * @return 拼音字符串
     */
    public static String changeToGetShortPinYin(String pinYinStr) {
        String tempStr = null;
        try {
            tempStr = PinyinHelper.getShortPinyin(pinYinStr);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }

    /**
     * 检查汉字是否为多音字
     *
     * @param pinYinStr 需检查的汉字
     * @return true 多音字,false 不是多音字
     */
    public static boolean checkPinYin(char pinYinStr) {
        boolean check = false;
        try {
            check = PinyinHelper.hasMultiPinyin(pinYinStr);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return check;
    }

    /**
     * 简体转换为繁体
     *
     * @param pinYinStr
     * @return
     */
    public static String changeToTraditional(String pinYinStr) {
        String tempStr = null;
        try {
            tempStr = ChineseHelper.convertToTraditionalChinese(pinYinStr);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }

    /**
     * 繁体转换为简体
     *
     * @param pinYinSt
     * @return
     */
    public static String changeToSimplified(String pinYinSt) {
        String tempStr = null;
        try {
            tempStr = ChineseHelper.convertToSimplifiedChinese(pinYinSt);
        } catch (Exception e) {
            e.printStackTrace();
        }
        return tempStr;
    }

    public static void main(String[] args) {
        String str = "重慶 most input";
        System.out.println(changeToSimplified(str));
        System.out.println(checkPinYin('重'));
        System.out.println(changeToTonePinYin("参差"));
        System.out.println(changeToTonePinYin("解亚伟"));// TODO 需要扩展 jar 包里 db里的数据
    }
}

jpinyin 相对于 pinyin4j 的优势:

  1. pinyin4j 对于多音字无法处理,会返回一个列表
  2. 在pinyin4j的jar上进行了优化,可以实现汉字转换为拼音,并自动识别常用多音字
  3. 识别是否常用多音字是可以扩展的
  4. 支持简体转换为繁体,
  5. 检查是否为简体,
  6. 是否为繁体,
  7. 是否为中文字符等功能

识别多音字、繁体等如何扩展:
这个目前并没有深究,看了一下 jar 文件,大致是需要扩展 data 中的数据的。
在这里插入图片描述

参考文章

https://www.jianshu.com/p/13bbb00e536c

jpinyin - A opensource java library for converting chinese to pinyin JPinyin是一个汉字拼音Java开源类库,在PinYin4j的功能基础上做了一些改进。 【JPinyin主要特性】 1、准确、完善的字库; Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin转换除46个异体字(异体字不存在标准拼音)之外的所有汉字; 2、拼音转换速度快; 经测试,转换Unicode编码从4E00-9FA5范围的20902个汉字JPinyin耗时约100毫秒。 3、多拼音格式输出支持; JPinyin支持多种拼音输出格式:带音标、不带音标、数字表示音标以及拼音首字母输出格式; 4、常见多音字识别; JPinyin支持常见多音字的识别,其中包括词组、成语、地名等; 5、简繁体中文转换; 6、支持添加用户自定义字典; Maven com.github.stuxuhai jpinyin 1.1.8 Gradle Step 1. Add the JitPack repository to your build file Add it in your root build.gradle at the end of repositories: allprojects { repositories { ... maven { url "https://jitpack.io" } } } Step 2. Add the dependency dependencies { compile 'com.github.SilenceDut:jpinyin:v1.0' } Usage String str = "你好世界"; PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_MARK); // nǐ,hǎo,shì,jiè PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITH_TONE_NUMBER); // ni3,hao3,shi4,jie4 PinyinHelper.convertToPinyinString(str, ",", PinyinFormat.WITHOUT_TONE); // ni,hao,shi,jie PinyinHelper.getShortPinyin(str); // nhsj PinyinHelper.addPinyinDict("user.dict"); // 添加用户自定义字典
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值