Set<String> stopWordsSet = SegmentWordsResult.getStopWordsSet();
for(String stop : stopWordsSet){
if(str.contains(stop))
// System.out.println("true: "+stop);
str = str.replaceAll(stop, "");
}问题出现在加号附近,查询相关的资料显示,+、*、|、\等符号在正则表达示中有相应的不同意义。
一般来讲只需要加[]、或是\\即可

本文探讨了如何使用正则表达式在文本处理中去除停用词,涉及了加号、星号、竖线等符号在正则表达式中的作用,以及如何在Java中实现文本过滤。
579

被折叠的 条评论
为什么被折叠?



