为了测试emqttd在我们的刀片机上面的性能,我们做了一次benchmark,遇到了几个有意思的问题
使用emqttc全力发送pub反而吞吐下降了
官方使用emqttc做了一个benchmark工具,其中有一个pub端,可以起n个连接,每隔m毫秒发送一个数据包。其实现隔时间发送publish的功能,是通过erlang的time模块每隔一定时间就往发送者线程发送一个publish消息实现的。发送者线程收到publish,就调用一次emqttc的publish,进行一次发消息操作。为了解除publish的最小1ms的限制,我去掉了time模块的调用(因为time的send interval调用最小的时间间隙就是1ms),改而使用调用了emqttc的publish之后,马上发一个publish消息给自己,这样本地马上又会再收到publish消息,马上发下一次的消息。
然而,之前1ms一个publish,接收方收到的数据的速度还能达到1000 msg/s,但是我放开1ms的限制之后,接收端收到的数据反而下降了,减少到了200 msg/s。仔细观察了tcp链路的包,并不忙碌。最后定位到问题,实际是因为erlang在调度的时候,发送者线程一直收到publish请求,一直在调用emqttc的publish,但是一直给自己发消息,导致了发送者线程一直占用cpu,而没有给发送者cpu,发送者实际发出的包反而少了
局域网内的机器ops起不来
我们在emqttd的运行机器上,跑b