作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO
联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬
学习必须往深处挖,挖的越深,基础越扎实!
阶段1、深入多线程
阶段2、深入多线程设计模式
阶段3、深入juc源码解析
阶段4、深入jdk其余源码解析
码哥源码部分
码哥讲源码-原理源码篇【2024年最新大厂关于线程池使用的场景题】
码哥讲源码-原理源码篇【揭秘join方法的唤醒本质上决定于jvm的底层析构函数】
码哥源码-原理源码篇【Doug Lea为什么要将成员变量赋值给局部变量后再操作?】
码哥讲源码【谁再说Spring不支持多线程事务,你给我抽他!】
打脸系列【020-3小时讲解MESI协议和volatile之间的关系,那些将x86下的验证结果当作最终结果的水货们请闭嘴】
在本系列第1篇《走下神坛吧!算法》中提到了:计算复杂度分为时间复杂度与空间复杂度,第3篇《KO!大O——时间复杂度》详细介绍了时间复杂度,本篇文章来讲讲空间复杂度。
空间复杂度和硬件资源开销是一回事情吗?
CPU资源开销分析:
CPU的资源的设计初衷更多的是用于提升计算性能;
对CPU资源的利用,基本原则都是“多多(占用、发挥)益善;
加之CPU的资源空间大小与内存、外存和外设比较,非常有限。
内存资源开销分析:
静态视角:程序要装进内存才能运行
动态视角:程序在运行时,动态申请内存
外存资源开销分析:
静态视角:程序本身,以二进制可执行映像形态,存放在外存上的大小
动态视角:程序在运行时,对外存的需求大小(比如,在进行大数据处理时,将中间结果暂存到外存,腾出内存空间来做计算)
发明DMA、GPU的初衷是分担CPU工作量,提升计算机系统的整体性能。
计算与存储是计算机系统的两大功用,空间复杂度体现存储指标。
不同算法实现的程序的二进制可执行映像的大小,只要不是太烂,通常来说,不会有量级上的差别。
综上所述,我们可以得到如下两个结论:
-
空间复杂度聚焦内存与外存的开销
-
空间复杂度聚焦动态视角
特别地,研究内存的开销,就要了解内存模型:
进一步分解,就是以下三个方面:
程序运行时,静态内存分配量(静态区)
程序运行时,动态内存分配量(堆栈、堆)
程序运行时,外存需求量
静态内存分配
这部分内存分配是用于全局变量和常量的,识别出这些变量类型,并计算出对应的大小,也就得到了该部分内存分配的需求量。具体的方法就是在源代码中找到这些变量声明、定义的地方,然后根据类型来计算大小。
动态内存分配
对于堆:对应动态分配“原语”,如 new
方法、malloc
函数等。
对于堆栈:局部变量对应这一部分,其大小呼应这部分的内存分配大小。
程序运行时的外存需求
要搞清楚程序运行时对外存的需求,首先要找到对外存的访问。
对于高级语言而言,外存是被操作系统抽象成文件来被访问的。所以找到了文件访问的“原语”,也就定位到了对外存的访问。
“文件写原语”: 如writeFile()
等。作用是把内存中装载的数据放到文件中去,对文件大小的占用就反映了对外存的需求量。
“文件读原语”:如readFile()
等。作用是把外存文件中的内容放到内存中去。所涉及的内容大小就反映了对外存的需求量。
从上面的分析可以看出:外存的需求量取决于访问的文件内容大小,后者又和涉及的内存大小相关。所以可以用所涉及的内存大小来表征对外存的需求量。