​SpringBoot 整合 Elasticsearch深度分页查询​

SpringBoot 整合 Elasticsearch深度分页查询

es 查询共有4种查询类型

QUERY_AND_FETCH: 

   主节点将查询请求分发到所有的分片中,各个分片按照自己的查询规则即词频文档频率进行打分排序,然后将结果返回给主节点,主节点对所有数据进行汇总排序然后再返回给客户端,此种方式只需要和es交互一次。

      这种查询方式存在数据量和排序问题,主节点会汇总所有分片返回的数据这样数据量会比较大,二是各个分片上的规则可能不一致。

QUERY_THEN_FETCH: 

主节点将请求分发给所有分片,各个分片打分排序后将数据的id和分值返回给主节点,主节点收到后进行汇总排序再根据排序后的id到对应的节点读取对应的数据再返回给客户端,此种方式需要和es交互两次。

      这种方式解决了数据量问题但是排序问题依然存在而且是es的默认查询方式

DEF_QUERY_AND_FETCH 和 DFS_QUERY_THEN_FETCH: 

  将各个分片的规则统一起来进行打分。解决了排序问题但是DFS_QUERY_AND_FETCH仍然存在数据量问题,DFS_QUERY_THEN_FETCH两种噢乖你问题都解决但是效率是最差的。

Maven依赖:

    <dependency>
      <groupId>org.springframework.boot</groupId>
      <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
    <version>2.0.5.RELEASE</version> 
    </dependency>

yml配置:

spring:
    data:
        elasticsearch:
             cluster-name: elasticsearch
             cluster-nodes: 127.0.0.1:9300

测试代码:

复制代码

  1 /**
  2  * @author 宫新程
  3  * @since 2018/10/24 12:29
  4  */
  5 @RunWith(SpringRunner.class)
  6 @SpringBootTest
  7 @Slf4j
  8 public class GoodsItemLaunchEsTest {
  9 
 10   // 查询条件
 11   private static final String ES_SEARCH_ITEM_NAME = "itemName";
 12   private static final String ES_SEARCH_ITEM_MODEL = "itemModel";
 13   private static final String ES_SEARCH_PRODUCT_CODE = "productCode";
 14   private static final String ES_SEARCH_OPER_FLAG = "oper_flag";
 15 
 16   @Resource private ElasticsearchTemplate elasticsearchTemplate;
 17   @Resource private EsManager esManager;
 18 
 19   /** ES创建基础表 */
 20   @Test
 21   public void createIndex() {
 22     elasticsearchTemplate.createIndex(EsGoodsItemLaunchDto.class);
 23     elasticsearchTemplate.putMapping(EsGoodsItemLaunchDto.class);
 24   }
 25 
 26   /** ES删除表 */
 27   @Test
 28   public void deleteIndex() {
 29     this.elasticsearchTemplate.deleteIndex(EsGoodsItemLaunchDto.class);
 30   }
 31 
 32   /** 插入测试数据 */
 33   @Test
 34   public void insertData() {
 35 
 36     List<IndexQuery> queryList = new ArrayList<>();
 37 
 38     for (int i = 0; i < 10000; i++) {
 39       EsGoodsItemLaunchDto dto = new EsGoodsItemLaunchDto();
 40       dto.setId(i);
 41       dto.setItemId(i);
 42       dto.setItemSkuId(i);
 43       dto.setItemName(i % 2 == 0 ? "洗衣机" + i : "空调" + i);
 44       dto.setCustomerSellerCode("CustomerSellerCode" + i);
 45       dto.setCustomerName("CustomerName" + i);
 46       dto.setMemberSellerCode("MemberSellerCode" + i);
 47       dto.setMemberName("MemberName" + i);
 48       dto.setProductCode("ProductCode" + i);
 49       dto.setItemModel("ItemModel" + i);
 50       dto.setProductGroupName("ProductGroupName" + i);
 51       dto.setProductGroupCode("ProductGroupCode" + i);
 52       dto.setBrandId(i * 2);
 53       dto.setBrandName("BrandName" + i);
 54       dto.setGmCode(((int) Math.random() * 10000) + "");
 55       dto.setUpdateTime(new Date());
 56       dto.setMemberId(i * 5);
 57       dto.setCustomerId(i * 6);
 58 
 59       IndexQuery indexQuery =
 60           new IndexQueryBuilder()
 61               .withId(String.valueOf(dto.getId()))
 62               .withObject(dto)
 63               .withIndexName(esManager.index4r(EsGoodsItemLaunchDto.class))
 64               .build();
 65 
 66       queryList.add(indexQuery);
 67 
 68       if (queryList.size() == 1000) {
 69         this.elasticsearchTemplate.bulkIndex(queryList);
 70         queryList.clear();
 71       }
 72     }
 73 
 74     // 必须加if判断否则报异常:
 75     // org.elasticsearch.action.ActionRequestValidationException:
 76     // Validation Failed: 1:no requests added;
 77     if (queryList.size() > 0) {
 78       // 保存剩余数据 (没被1000整除)
 79       elasticsearchTemplate.bulkIndex(queryList);
 80     }
 81   }
 82 
 83   @Test
 84   public void search() {
 85     int pageNum = 2;
 86     int pageSize = 5;
 87 
 88     BoolQueryBuilder filter = QueryBuilders.boolQuery();
 89     // 注意一定要小写处理 toLowerCase()
 90     String codeOrName = "ProductCode100".toLowerCase();
 91     BoolQueryBuilder boolQueryLike = QueryBuilders.boolQuery();
 92     // 分词查询 商品名称
 93     MultiMatchQueryBuilder queryBuilder =
 94         QueryBuilders.multiMatchQuery(codeOrName, ES_SEARCH_ITEM_NAME);
 95     // 商品型号
 96     QueryBuilder itemModel =
 97         QueryBuilders.wildcardQuery(ES_SEARCH_ITEM_MODEL, "*" + codeOrName + "*");
 98     // 产品编码
 99     QueryBuilder productCode =
100         QueryBuilders.wildcardQuery(ES_SEARCH_PRODUCT_CODE, "*" + codeOrName + "*");
101     boolQueryLike.should(queryBuilder);
102     boolQueryLike.should(itemModel);
103     boolQueryLike.should(productCode);
104     filter.must(boolQueryLike);
105 
106     // 判断ES表的 oper_flag 不等于 D
107     filter.mustNot(QueryBuilders.termQuery(ES_SEARCH_OPER_FLAG, "D"));
108 
109     SearchQuery searchQuery = new NativeSearchQuery(filter);
110     searchQuery.addIndices(esManager.index4r(EsGoodsItemLaunchDto.class));
111     Pageable pageable = PageRequest.of(pageNum - 1, pageSize);
112     searchQuery.setPageable(pageable);
113 
114     // 深度查询分页
115     Page<EsGoodsItemLaunchDto> result =
116         this.elasticsearchTemplate.startScroll(5000, searchQuery, EsGoodsItemLaunchDto.class);
117 
118     for (int i = 0; i < pageNum - 1; i++) {
119       elasticsearchTemplate.continueScroll(
120           ((ScrolledPage) result).getScrollId(), 5000, EsGoodsItemLaunchDto.class);
121     }
122 
123     log.info("=====================================");
124     result
125         .getContent()
126         .forEach(
127             (dto) -> {
128               log.info("ItemName:{}", dto.getItemName());
129             });
130     log.info("总记录数:{}", result.getTotalElements());
131     log.info("当前页码数:{}", pageNum);
132     log.info("每页显示条数:{}", pageSize);
133     log.info("=====================================");
134   }
135 }
136 /* 输出结果:
137 <============================>
138 <ItemName:空调1001>
139 <ItemName:洗衣机1004>
140 <ItemName:洗衣机1006>
141 <ItemName:空调1007>
142 <ItemName:洗衣机1008>
143 <总记录数:11>
144 <当前页码数:2>
145 <每页显示条数:5>
146 <============================>
147 */
<think>嗯,用户问的是Spring Boot的全文检索。首先,我需要确认用户的需求是什么。可能他们想在Spring Boot应用中实现全文搜索功能,比如在文章、产品描述或者其他文本数据中进行关键字搜索。不过,用户可能对全文检索的基本概念不太清楚,所以我应该先简单解释一下什么是全文检索。 接下来,用户可能想知道在Spring Boot中如何实现。常用的技术选型有Elasticsearch、Solr或者Hibernate Search。Elasticsearch比较流行,适合分布式环境,而Solr也是一个不错的选择,但可能稍微复杂一些。Hibernate Search基于Lucene,整合起来可能对熟悉Hibernate的开发者更友好。我需要比较这些技术的优缺点,帮助用户做出选择。 然后,用户可能需要具体的实现步骤。比如,集成Elasticsearch的话,需要添加依赖、配置连接信息、创建实体类、定义Repository接口,然后编写索引和搜索的方法。可能需要分步骤说明,并且给出代码示例。但要注意,用户可能对某些配置不熟悉,比如application.properties中的配置项,需要详细说明每个参数的作用。 另外,用户可能还关心性能优化和高级功能,比如分页、高亮显示搜索结果,或者如何处理中文分词。这时候可能需要提到IK Analyzer这样的中文分词插件,以及如何在Elasticsearch中配置它们。 还要考虑可能的常见问题,比如索引同步的问题,如何确保数据库的数据变化及时反映到搜索引擎中。是否需要使用监听器或者定时任务来同步数据,或者是否有更实时的解决方案。 最后,总结一下全文检索在Spring Boot中的重要性,以及不同场景下的技术选型建议。确保回答结构清晰,步骤明确,用户能够根据指导一步步实现功能,同时了解背后的原理和注意事项。</think>Spring Boot全文检索实现指南 一、全文检索核心概念 1. 全文检索定义:通过建立倒排索引,实现快速匹配关键词的搜索技术 2. 核心能力: - 支持模糊查询 - 支持分词处理 - 支持相关性排序 - 支持海量数据快速检索 二、Spring Boot技术选型方案 1. Elasticsearch方案: - 分布式搜索引擎 - 实时索引 - RESTful API - 适合复杂搜索场景 2. Solr方案: - 基于Lucene的搜索平台 - 强大的过滤查询 - 传统企业应用较多 3. Hibernate Search方案: - 集成ORM框架 - 基于Apache Lucene - 适合JPA项目快速集成 三、Elasticsearch实现步骤(推荐方案) 1. 环境配置: ```properties # application.properties spring.elasticsearch.rest.uris=http://localhost:9200 spring.data.elasticsearch.client.reactive.endpoints=localhost:9200 ``` 2. 添加依赖: ```xml <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-elasticsearch</artifactId> </dependency> ``` 3. 实体类映射: ```java @Document(indexName = "articles") public class Article { @Id private String id; @Field(type = FieldType.Text, analyzer = "ik_max_word") private String title; @Field(type = FieldType.Text, analyzer = "ik_max_word") private String content; } ``` 4. 仓库接口定义: ```java public interface ArticleRepository extends ElasticsearchRepository<Article, String> { List<Article> findByTitleOrContent(String title, String content); } ``` 5. 索引操作示例: ```java // 创建索引 articleRepository.save(article); // 搜索实现 NativeSearchQuery searchQuery = new NativeSearchQueryBuilder() .withQuery(QueryBuilders.multiMatchQuery(keyword, "title", "content")) .build(); SearchHits<Article> hits = elasticsearchRestTemplate.search(searchQuery, Article.class); ``` 四、关键技术要点 1. 中文分词配置: - 安装IK Analysis插件 - 配置自定义词典 - 选择分词策略(ik_max_word/ik_smart) 2. 索引优化策略: - 分片设置优化 - 定期合并段(segment) - 使用bulk API批量操作 - 合理设置refresh_interval 3. 搜索结果处理: ```java // 高亮显示实现 HighlightBuilder highlightBuilder = new HighlightBuilder() .field("title").preTags("").postTags("") .field("content").preTags("").postTags(""); ``` 五、性能对比指标 $$ \begin{array}{|c|c|c|c|} \hline \text{特性} & \text{Elasticsearch} & \text{Solr} & \text{Hibernate Search} \\ \hline 实时性 & ★★★★☆ & ★★★☆☆ & ★★☆☆☆ \\ 分布式支持 & 原生支持 & 需要插件 & 不支持 \\ 学习曲线 & 中等 & 较高 & 较低 \\ 中文支持 & IK插件 & 需配置 & 需集成 \\ \hline \end{array} $$ 六、典型应用场景 1. 电商平台:商品搜索(支持型号/参数检索) 2. 内容平台:文章全文检索(支持同义词扩展) 3. 日志分析:结合ELK技术栈 4. 企业文档:合同/文件内容检索 七、常见问题解决方案 1. 索引不同步问题: - 使用@TransactionalEventListener监听数据库变更 - 设置双写队列保证数据一致性 - 定期执行全量索引重建 2. 搜索性能优化: ```java // 使用scroll API处理深度分页 SearchScrollHits<Article> scroll = elasticsearchRestTemplate.searchScrollStart( 1000, searchQuery, Article.class); ``` 3. 安全防护: - 启用X-Pack安全模块 - 限制查询深度 - 设置查询超时时间 建议根据具体项目需求选择技术方案,中小型项目可优先考虑Elasticsearch方案,传统企业系统可评估Solr方案,已有Hibernate技术栈项目可选择Hibernate Search实现快速集成。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值