es模糊查询

原创已于 2022-04-01 11:59:13 修改 · 4.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch

于 2022-03-18 15:11:35 首次发布

es 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了如何在Elasticsearch中使用正则表达式进行模糊查询时处理特殊符号，如和”，通过Unicode转义并结合正则模式，确保匹配任意字符。提供了一个实例，展示了如何构造查询和转义字符串的方法，适用于学生姓名搜索并按添加时间排序。

特别注意：es的模糊查询，只支持keyword；之前踩过的坑，使用正则的方式模糊查询（QueryBuilders.regexpQuery("name.keyword", ".*" + student.getName() + ".*")),遇到特殊符号比如 \ 斜杠，英文的""引号，则匹配不上。

最终总结如下方法可匹配任意字符的模糊查询，可供参考：

private static final Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
----------------------------------------------------------------

//简单的例子：这里是分页查询，按学生名字模糊查询，然后按添加时间倒序
public NativeSearchQuery getSearchQuery(Student student, Pageable pageRequest){

BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();

queryBuilder.filter(QueryBuilders.wildcarQuery("name.keyword", "*" + this.unicodeToString(student.getName()) + "*")));

NativeSearchQueryBuilder nativeSearchQueryBuilder = new NativeSearchQueryBuilder();
return  nativeSearchQueryBuilder
         .withQuery(queryBuilder)
         .withSort(SortBuilders.fieldSort("addTime").order(SortOrder.DESC))
         .withPageable(pageRequest)
         .build();  
}
----------------------------------------------------------------
private String unicodeToString (String str){
//将字符串转义
str = StringEscapeUtils.escapeJava(str);
//将Unicode编码格式转化为中文
Match match = pattern.matcher(str);
char ch;
while(matcher.find()){
    ch = (char) Integer.parseInt(matcher.group(2), 16);
    str = str.replace(matcher.group(1), ch + "");
  }
return str;

}

}