ceph集群中,osd日志如果有slow request,会出现osd down的情况,是可以从以下两个方面考虑解决问题:
1.检查集群内的每台机器,防火墙是否关闭。
2.用iperf进行集群内网网络测试,一般集群内网做双网卡绑定,对应的交换机接口也会做聚合,如果是两个千兆网卡,绑定后的流量一般在1.8G左右,如果网络测试数据到不到绑定后的结果,或者网络带宽较低,会影响集群内部的数据交互,导致osd出现slow request,可以优化解决集群内网。
3.检查集群内的每台机器,网卡是否变百兆