【算法】实现打印汉字拼音首字母

该博客介绍了如何使用Java实现将汉字转换为拼音首字母的功能,主要通过GB2312编码规则来定位拼音首字母。内容包括理解GB2312编码,将UTF-8编码的汉字转化为GBK编码,计算拼音首字母的区间,并给出完整的AC代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【算法】实现打印汉字拼音首字母

AC记录

原题地址:【1125: 拼音字母】
1125
参考文章:
【优快云】宇宙最强皮皮虾《Java中文转GBK码》

原题摘要:

题目描述

在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。

​ GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。

​ GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从0xA1开始。

​ 我们只要找到拼音a,b,c,…x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。

a 啊 B0A1
b 芭 B0C5
c 擦 B2C1
d 搭 B4EE
e 蛾 B6EA
f 发 B7A2
g 噶 B8C1
h 哈 B9FE
j 击 BBF7
k 喀 BFA6
l 垃 C0AC
m 妈 C2E8
n 拿 C4C3
o 哦 C5B6
p 啪 C5BE
q 期 C6DA
r 然 C8BB
s 撒 C8F6
t 塌 CBFA
w 挖 CDDA
x 昔 CEF4
y 压 D1B9
z 匝 D4D1

输入:

用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。

输出:

​ 程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。

​ 字母间不留空格,全部使用大写字母。

样例输入

3
大家爱科学
北京天安门广场
软件大赛

样例输出

DJAKX
BJTAMGC
RJDS

思路

首先,Java中输入的字符默认都是UTF-8编码,我们需要将输入的字符串的每个字符都转为并获得其对应的GBK编码:

// 中文转换成GBK码(16进制字符串),每个汉字2个字节
public static String Chinese2GBK(String chineseStr) throws Exception {
   
   
    StringBuffer GBKStr = new StringBuffer();
    byte[] GBKDecode = chineseStr.getBytes("gbk");
    for (byte b : GBKDecode)
        GBKStr.append(Integer.toHexString(b & 0xFF));
    return GBKStr.toString().toUpperCase();
}

接下来将获得的字符串形式的GBK编码转为16进制,代码如下。

String GBKWord = "B0A1";
int HexWord = Integer.parseInt(GBKWord, 16); // 第一个参数是字符串,第二个参数是要转换的进制

然后,让每个字母首个汉字的16进制 减去 第一个汉字 “啊” 的16进制,可以得到每个拼音首字母的区间

ArrayList<Integer> list = new ArrayList<>();

// 注意 i u v 不是声母,所以总共有23个区间 
String[] gbkHeadChinese = {
   
    "啊", "芭", "擦", "搭", "蛾", "发", "噶", "哈", "击", "喀", "垃", "妈", "拿", "哦", "啪", "期", "然", "撒", "塌", "挖", "昔", "压", "匝" };

// str to hex
for (String str : gbkHeadChinese) {
   
   
    String gbk = Chinese2GBK(str);
    int Hex = Integer.parseInt(gbk, 16)</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值