先说说遇到的问题,我们FDFS部署的两个节点的集群,在做稳定性测试时使用LR进行压测,在压测过程中停掉一台FDFS服务,预期结果应该为有少量报错后服务被正常的节点接管,实际结果为服务在停掉一个节点后会间接性的报错,错误为“
找不到可用的tracker x.x.x.x:22122/x.x.x.x:22122
”
fdfs客户端引用如下:
<dependency>
<groupId>com.github.tobato</groupId>
<artifactId>fastdfs-client</artifactId>
<version>1.27.2</version>
</dependency>
分析现象的过程就不提了,都是泪,从源码开始说起吧,先找到报错的对象,com.github.tobato.fastdfs.domain.fdfs.TrackerLocator
看看报错部分的代码如下:
/**
* 获取Tracker服务器地址
*
* @return trackerAddress
*/
public InetSocketAddress getTrackerAddress() {
TrackerAddressHolder holder;
// 遍历连接地址,抓取当前有效的地址
for (int i = 0; i < trackerAddressCircular.size(); i++) {
holder = trackerAddressCircular.next();
if (holder.canTryToConnect(retry

在对FASTDFS双节点集群进行稳定性测试时,通过LR压测工具模拟服务宕机情况,发现服务出现间歇性报错"找不到可用的tracker"。问题根源在于`TrackerLocator`类在高并发下可能存在取到相同不可用tracker连接对象的情况,导致连接失败。解决方案包括修改源码或重写`TrackerLocator`类,确保在多线程环境下正确遍历并随机选取tracker,从而实现故障切换和负载均衡。
最低0.47元/天 解锁文章
493

被折叠的 条评论
为什么被折叠?



