中文及中文标点符号的正则表达式
String cnSymbolsEx = "[\\u4e00-\\u9fa5" + // 中文
"\\u00d7\\u2013\\u2014" + // ×–—
"\\u2018-\\u2027" + //‘’‚‛“”„‟․‥…‧
"\\u3001\\u3002\\u3003" + // 、。〃
"\\u3008-\\u3011\\u3014\\u3015" + // 〈〉《》「」『』【】〔〕
"\\uff01-\\uff0f\\uff1a-\\uff20" + // !"#$%&'()*+,-./:;<=>?@
"\\uff3b-\\uff40" + // [\]^_`
"\\uff5b-\\uff65" + // {|}~⦅⦆。「」、・
"\\uffe5]"; //¥

本文详细介绍了一种用于匹配中文字符及其常用标点符号的正则表达式,涵盖了从基本汉字到特殊符号的广泛范围,为文本处理和信息提取提供了有力工具。
1万+

被折叠的 条评论
为什么被折叠?



