Solr嵌套子文档的弊端以及一种替代方式

本文探讨了使用Solr作为多标签用户管理体系的查询方案。介绍了如何通过电话、call客等记录上报到Kafka,再经Flume和Morphline录入Solr的过程。解决了Solr不支持子文档更新的问题,并通过特定字段标识不同类型的文档。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:在考察了多种工具后,我们决定使用solr来作为多标签用户管理体系的查询方案。

原计划:电话,call客,跟进等等记录上报到kafka,然后通过flume+morphline录入到solr中。每一个用户是一个独立的父文档,然后每新增一条来电/call客/跟进记录,则会在用户的父文档下增加一个嵌套子文档。

image

这样设计的好处是,一个文档就能记录一个用户所有的记录,并且还支持多维度的标签查询满足条件的用户。

在实现的过程中发现并不是那么顺利:solr原来是不支持子文档的更新和增加的。下面是solr官方社区开源问题单对应的说明。

https://issues.apache.org/jira/browse/SOLR-6596

image

然而功能仍然能实现,我们通过指定一个<doc_type>的字段将文档标识:用户文档,来电记录文档,call客记录文档。而这些文档都能通过phone这个关键字段来识别。

转载于:https://www.cnblogs.com/arli/p/6244435.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值