CPU cache line

在读github.com/valyala/bytebufferpool的源码时,发现这样一句:

minBitSize = 6 // 2**6=64 is a CPU cache line size

CPU cache line是什么东西?Wikipedia给出下面的解释:

Data is transferred between memory and cache in blocks of fixed size, called cache lines or cache blocks. When a cache line is copied from memory into the cache, a cache entry is created. The cache entry will include the copied data as well as the requested memory location (called a tag).

  • 回到最上面的代码,bytebuffer最小的size之所以被设置为64,因为作为主内存和缓存直接数据传输的最小单元,CPU cache line的大小固定是64个字节。也就是说,对于主内存(main messary)的读写是以cache line(64字节)为单位的。即使只读写一个字节,也是对那个字节所属的整条cache line做操作(读入cache或者写入主存)。所以小于64 bytes的缓存是没有意义的;所有缓存的大小都是64的整倍数。

既然聊到了cpu缓存,就多说两句。以笔者的Mac为例,cpu有4个核心,每个核心各有一个L1数据、L2指令缓存,一个L2缓存,并且共享一个L3缓存。

相比动辄十几、几十个GB的主内存而言,cpu缓存非常小。但它的访问速度非常块。各级缓存和主存的访问延时如下:

  • L1 cache: 4 cycles
  • L2 cache: 11 cycles
  • L3 cache: 39 cycles
  • Main memory: 107 cycles

可以看到,CPU访问L1级缓存的速度是访问主内存的22倍,即使是L3级缓存的访问速度也比主内存块4倍。不难想象,如果一个程序的指令和数据能直接在CPU缓存中找到,相比去主内存中加载,程序的性能会有极大的提高。

我们知道访问内存比访问磁盘要快的得多,因而会通过缓存来提升程序的性能。一个常用的例子是使用redis来缓存数据库的查询结果。然而我们很少能更进一步,考虑到cpu缓存,把程序写的尽可能对cpu缓存“友好”,从而提升性能。

下面是一个关于缓存很经典的例子:

代码1

const (
	nRow, nCol = 1024 * 512, 1024
)

func main() {
	var matrix [nRow][nCol]byte = [nRow][nCol]byte{}
        var b byte
	t := time.Now()
	for i := 0; i < nRow; i++ {
		for j := 0; j < nCol; j++ {
			b = matrix[i][j]
		}
	}
	fmt.Println(time.Since(t))
}

输出:594.07741ms

代码2

const (
	nRow, nCol = 1024 * 512, 1024
)

func main() {
	var matrix [nRow][nCol]byte = [nRow][nCol]byte{}
        var b byte
	t := time.Now()
	for i := 0; i < nCol; i++ {
		for j := 0; j < nRow; j++ {
			b = matrix[j][i]
	    }
	}
	fmt.Println(time.Since(t))
}

输出:6.17106279s

两段代码遍历同一个二维数组,第1段代码是按行遍历,第2段是按列遍历,最终的效果完全相同,但运行速度却相差了10倍。造成这个差异的原因就是cpu cache的cache line传输机制。前面提到,缓存即使只读取一个字节,也会加载整条cache line。在代码1中,缓存在加载matrix第一行的第一个元素时,“顺带手”地把第一行的后面63个元素也读了进来。在接下来访问第二个、第三个...的元素时,直接读缓存就好了。而在第2段代码中,访问完第一行第一个元素后,接着访问第二行第一个元素,而这个元素不在缓存中,出现了cache miss,cpu不得不访问主内存。由于缓存的空间有限,当程序访问第一行的第二个元素时,相应的cache entry可能已经失效,需要重新加载。

 

智能网联汽车的安全员高级考试涉及多个方面的专业知识,包括但不限于自动驾驶技术原理、车辆传感器融合、网络安全防护以及法律法规等内容。以下是针对该主题的些核心知识点解析: ### 关于智能网联车安全员高级考试的核心内容 #### 1. 自动驾驶分级标准 国际自动机工程师学会(SAE International)定义了六个级别的自动驾驶等级,从L0到L5[^1]。其中,L3及以上级别需要安全员具备更高的应急处理能力。 #### 2. 车辆感知系统的组成与功能 智能网联车通常配备多种传感器,如激光雷达、毫米波雷达、摄像头和超声波传感器等。这些设备协同工作以实现环境感知、障碍物检测等功能[^2]。 #### 3. 数据通信与网络安全 智能网联车依赖V2X(Vehicle-to-Everything)技术进行数据交换,在此过程中需防范潜在的网络攻击风险,例如中间人攻击或恶意软件入侵[^3]。 #### 4. 法律法规要求 不同国家和地区对于无人驾驶测试及运营有着严格的规定,考生应熟悉当地交通法典中有关自动化驾驶部分的具体条款[^4]。 ```python # 示例代码:模拟简单决策逻辑 def decide_action(sensor_data): if sensor_data['obstacle'] and not sensor_data['emergency']: return 'slow_down' elif sensor_data['pedestrian_crossing']: return 'stop_and_yield' else: return 'continue_driving' example_input = {'obstacle': True, 'emergency': False, 'pedestrian_crossing': False} action = decide_action(example_input) print(f"Action to take: {action}") ``` 需要注意的是,“橙点同学”作为特定平台上的学习资源名称,并不提供官方认证的标准答案集;建议通过正规渠道获取教材并参加培训课程来准备此类资格认证考试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值