汉字的首字母问题

目前网上公布的获取汉字首字母方法,一般情况下是没有问题的,但有些特殊的汉字无法获得首字母,比如说“戬”“浜”2字就很难取到首字母,不知道问题出在哪里。

我使用的类如下:

 

import java.io.UnsupportedEncodingException;

/** */

/**
 * 取得给定汉字串的首字母串,即声母串
 * <p>Title: ChineseCharToEn</p>
 * <p>@author javer QQ:84831612</p>
 *
 * @version 1.0
 * @date 2004-02-19
 * 注:只支持GB2312字符集中的汉字
 */
public final class ChineseCharToEn {
    private final static int[] li_SecPosValue =
            {
                    1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472,
                    3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590
            };
    private final static String[] lc_FirstLetter =
            {
                    "a", "b", "c", "d", "e", "f", "g", "h", "j", "k", "l", "m", "n", "o", "p",
                    "q", "r", "s", "t", "w", "x", "y", "z"
            };

/** */
    /**
     * 取得给定汉字串的首字母串,即声母串
     *
     * @param str 给定汉字串
     * @return 声母串
     */
    public String getAllFirstLetter(String str) {
        if (str == null || str.trim().length() == 0) {
            return "";
        }

        String _str = "";
        for (int i = 0; i < str.length(); i++) {
            _str = _str + this.getFirstLetter(str.substring(i, i + 1));
        }

        return _str;
    }

/** */
    /**
     * 取得给定汉字的首字母,即声母
     *
     * @param chinese 给定的汉字
     * @return 给定汉字的声母
     */
    public String getFirstLetter(String chinese) {
        if (chinese == null || chinese.trim().length() == 0) {
            return "";
        }
        chinese = this.conversionStr(chinese, "GBK", "ISO8859-1");

        if (chinese.length() > 1) //判断是不是汉字
        {
            int li_SectorCode = (int) chinese.charAt(0); //汉字区码
            int li_PositionCode = (int) chinese.charAt(1); //汉字位码
            li_SectorCode = li_SectorCode - 160;
            li_PositionCode = li_PositionCode - 160;
            int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; //汉字区位码
            if (li_SecPosCode > 1600 && li_SecPosCode < 5590) {
                for (int i = 0; i < 23; i++) {
                    if (li_SecPosCode >= li_SecPosValue[i] &&
                            li_SecPosCode < li_SecPosValue[i + 1]) {
                        chinese = lc_FirstLetter[i];
                        break;
                    }
                }
            } else //非汉字字符,如图形符号或ASCII码
            {
                chinese = this.conversionStr(chinese, "ISO8859-1", "GBK");
                chinese = chinese.substring(0, 1);
            }
        }

        return chinese;
    }

/** */
    /**
     * 字符串编码转换
     *
     * @param str           要转换编码的字符串
     * @param charsetName   原来的编码
     * @param toCharsetName 转换后的编码
     * @return 经过编码转换后的字符串
     */
    private String conversionStr(String str, String charsetName, String toCharsetName) {
        try {
            str = new String(str.getBytes(charsetName), toCharsetName);
        }
        catch (UnsupportedEncodingException ex) {
            System.out.println("字符串编码转换异常:" + ex.getMessage());
        }

        return str;
    }

    public static void main(String[] args) {
        ChineseCharToEn cte = new ChineseCharToEn();
        System.out.println("'夜未眠'的首个拼音字母是:" + cte.getFirstLetter("夜未眠"));
        System.out.println("'Javer夜未眠'的首个拼音字母是:" + cte.getFirstLetter("Javer夜未眠"));
        System.out.println("'戬浜供销社'的全部字母的拼音字母是:" + cte.getAllFirstLetter("戬浜供销社"));
    }
}
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值