匹配中文的正则表达式:[\u4e00-\u9fa5]
public class GetChinese {
public static void main(String[] args) throws IOException {
File f = new File("in.txt");
File out = new File("out.txt");
Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]");
BufferedReader br = new BufferedReader(new FileReader(f));
BufferedWriter bw = new BufferedWriter(new FileWriter(out));
String s = null;
while((s = br.readLine())!=null){
Matcher matcher = pattern.matcher(s);
while(matcher.find()){
bw.write(matcher.group());
}
bw.newLine();
bw.flush();
}
}
}

本文介绍了一种用于匹配中文字符的简单正则表达式,并通过一个Java程序示例展示了如何使用该正则表达式从文本文件中提取所有中文字符,并将它们写入另一个文件。
465

被折叠的 条评论
为什么被折叠?



