将文档全角标点转成半角标点方法

本文介绍了一个用于字符串中特殊字符替换的实用工具。该工具通过定义一个静态方法来实现字符替换功能,可以将特定的全角符号及特殊HTML实体转换为对应的半角字符或标准HTML实体。例如将全角逗号“,”替换成半角逗号“,”,或将HTML实体“—”替换成破折号“-”。此工具适用于文本预处理阶段,确保文本数据的一致性和标准化。

 

private static String replace(String line) {

 

HashMap map = new HashMap();

map.put(",", ",");

map.put("。", ".");

map.put("〈", "<");

map.put("〉", ">");

map.put("‖", "|");

map.put("《", "<");

map.put("》", ">");

map.put("〔", "[");

map.put("〕", "]");

map.put("﹖", "?");

map.put("?", "?");

map.put("“", "/"");

map.put("”", "/"");

map.put(":", ":");

map.put("、", ",");

map.put("(", "(");

map.put(")", ")");

map.put("【", "[");

map.put("】", "]");

map.put("—", "-");

map.put("~", "~");

map.put("!", "!");

map.put("‵", "'");

map.put("①", "1");

map.put("②", "2");

map.put("③", "3");

map.put("④", "4");

map.put("⑤", "5");

map.put("⑥", "6");

map.put("⑦", "7");

map.put("⑧", "8");

map.put("⑨", "9");

 

int length = line.length();

for (int i = 0; i < length; i++) {

String charat = line.substring(i, i + 1);

if (map.get(charat) != null) {

line = line.replace(charat, (String) map.get(charat));

}

}

 

return line;

}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值