sphinx分布式

本文深入探讨了Sphinx分布式搜索系统的实现原理,包括水平分区、远程代理交互流程及配置文件解析,旨在解决大规模数据查询延迟和提升吞吐率的问题。
sphinx分布式
分布式是为了改善查询延迟问题和提高多服务器、多CPU或多核环境下的吞吐率。对于大量数据(即十亿级的记录数和TB级的文本量)上的搜索应用来说是很关键的。
分布式思想:对数据进行水平分区(HP,Horizontally partition),然后并行处理。
当searchd收到一个对分布式索引的查询时,它做如下操作 
 1. 连接到远程代理; 
 2. 执行查询; 
 3. (在远程代理执行搜索的同时)对本地索引进行查询; 
 4. 接收来自远程代理的搜索结果; 
 5. 将所有结果合并,删除重复项; 
 6. 将合并后的结果返回给客户端.
index dist //配置文件494行 
 type = distributed
 local = chunk1
 agent = localhost:9312:chunk2 本地 
 agent = 192.168.2.22:9312:chunk3远程 
 agent = 192.168.2.23:9312:chunk4 远程
 }

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值