一.背景
1.传统的收发报文方式都必须采用硬中断来做通讯,每次硬中断大约消耗100微秒,这还不算因为终止上下文所带来的Cache Miss。
2.数据必须从内核态用户态之间切换拷贝带来大量CPU消耗,全局锁竞争。
3.收发包都有系统调用的开销。
4.内核工作在多核上,为可全局一致,即使采用Lock Free,也避免不了锁总线、内存屏障带来的性能损耗。
5.从网卡到业务进程,经过的路径太长,有些其实未必要的,例如netfilter框架,这些都带来一定的消耗,而且容易Cache Miss
1、传统服务器可能有如下潜在的问题
异步模式的弊端
在没有请求到来的时候,线程将会休眠,当数据到来时,将由操作系统唤醒对应的线程,也就是说内核需要负责线程间频繁的上下文切换,我们是在依靠操作系统调度系统来服务网络包的调度。
协议栈的扩展性
协议栈中嵌入了大量用于对接的接口,如果能让应用程序直接接管网络数据包处理、内存管理以及CPU调度,那么性能可以得到一个质的提升。为了达到这个目标,第一个要解决的问题就是绕过Linux内核协议栈
多核的可扩展性
在多个CPU核心上平行扩展:尽量让每个核维护独立数据结构;使用原子操作来避免冲突;使用无锁数据结构避免线程间相互等待;设置CPU亲缘性,将操作系统和应用进程绑定到特定的内核上,避免CPU资源竞争;在NUMA架构下尽量避免远端内存访问
内存的可扩展性
内存的访问速度永远也赶不上cache和cpu的频率,为了能让性能平行扩展,最好是少访问。
减少访存次数来避免cachemisses是我们设计的目标。
指针不要随意指向任意内存地址,因为这样每一次指针的间接访问可能会导致多次cache misses,最好将需要访问的数据放到一起,方便一次性加载到cache中使用。按照4K页来计算,32G的数据需要占用64M的页表,使得页表甚至无法放到cache中,这样每

DPDK是一种用户空间的网络库,旨在绕过Linux内核协议栈,提高网络数据包处理性能。它减少了中断、内存拷贝和系统调用,提供定制协议栈的能力,但可能增加开发成本且在低负荷场景下效率不高。适合高性能、多核环境的C++后台开发和Linux服务器开发。
最低0.47元/天 解锁文章
1416

被折叠的 条评论
为什么被折叠?



