前言:有很多书,被别人安利以后,自己兴致勃勃地捧起来,但是看完第一章就放弃了,《深入理解计算机系统》就是其中著名的一本,第一章漫游了计算机系统,还比较简单。第二章就是信息表示、补码、浮点数,太枯燥。再往后一翻,第三章干脆是汇编,算了,放弃吧。
今天转载一篇文章,讲了作者阅读《深入理解计算机系统》的心得体会,希望给大家一点儿启发。
终于把《深入理解计算机系统》第三章的笔记整理好了,前前后后大概用了小半年时间,中间还经历了一次上海疫情。在这个系列笔记完成之际,突然想起了一位网友的问题“现在学习 CSAPP 对我的工作有帮助吗?”
在学习之前,我其实也有同样的疑问。大致看了一遍书,还做了一份笔记之后,对这个问题也有了一些自己的感受。
思考这个问题的过程,让我想起了刘润老师的一本书《底层逻辑》。是的,这个问题最好的回答就是“从底层逻辑开始”。
接下来我就从 Why / What / How 三个角度来聊聊我的理解和学习收获。
1. Why
拿书本的第三章为例,这个章节的英文叫做 Machine-Level Representation of Programs,翻译过来就是“程序的机器级别表示”。
大家平时工作中使用的都是 Java,C#,JavaScript 等这类高级编程语言。而且我们在工作中也不需要使用汇编这类的低级语言。
那么我们现在为什么要去学习“程序的机器级别表示”呢?
我在看到码农翻身的一篇文章后对这个问题恍然大悟。文章中提到 Stack Overflow 的创始人 Joel Spolsky 一个理论:抽象泄漏法则。
1.1 抽象泄漏法则
以编程语言为例,这就是一个不断向上抽象的产物。
从机器语言开始到汇编语言,然后到 c/c++ 高级语言,再到 Java,C#,JavaScript 等高级编程语言,总是在不断地抽象。
Joel Spolsky 说:
All non-trivial abstractions, to some degree, are leaky.(所有非琐碎的抽象,在某种程度上,都是泄露的。)
比如在高级语言中,会将 string 抽象成像 int 一样来使用。我们可以使用加号将两个字符串串联,就像这样: "foo" + "bar"。
当我们这么使用的时候,可能会有资深的程序员告诉大家,串联字符串时最好使用 StringBuilder 类。我们会记住这个用法,但是不一定能理解为什么。
这其实就是抽象的泄露。
在低级别语言中其实并没有字符串这个类型,只有char *,字符串就是一个 char 的数组。
理解到这一层,再回头看看 StringBuilder 类,就会知道底层的原理,就是一个数组。
所以 Joel Spolsky 说:
the abstractions save us time working, but they don’t save us time learning. (抽象可以节省我们的工作时间,但不能节省我们的学习时间。)
*Joel Spolsky 原文:[The Law of Leaky Abstractions]
https://www.joelonsoftware.com/2002/11/11/the-law-of-leaky-abstractions/
1.2 理解基础知识
从底层开始学习,还能够更好地理解编程的基础知识,这是我在学习过程中感触最深的地方。举两个例子:闭包和递归。
a. 闭包
前端开发的朋友第一次遇到闭包问题,可能都是从一段 for 循环不能正常执行开始。
for (var i = 0; i < greetings.length; i++) {
...
}
我们会发现将 var 写成 let 就可以正常工作了。
闭包到底是什么原因导致的?
当我们知道了函数栈帧和堆的概念之后,再去找找相应的专业文章,就能够从原理上理解闭包这个概念。
*这里推荐一下我翻译的一篇文章:[JavaScript 闭包在 Heap 中的表示]
https://zhuanlan.zhihu.com/p/468527405
b. 递归
记得我第一次跟踪递归实现汉诺塔的算法时,完全是一团浆糊。这个问题同样也可以从底层逻辑来搞明白。
当我们清楚了函数栈帧的概念,知道了每次函数调用都有自己的栈帧,知道了栈帧里面保存了局部变量。
这时候再回过头来理解递归,其实就是基于栈帧这个概念,生成一条栈帧链,实现的从大到小,从整体到局部一个推导过程。
递归是计算机基于自己的运算特性(栈帧),形成了自己独特地处理问题的方式,这种方式有别于人类的正常思维。作为程序员,我们需要理解并按照这种方式编写自己的代码。
*阶乘递归实现的状态机
2. What
什么是 “程序的机器级别表示” ?我们可以理解为汇编语言。
在了解汇编语言之前,我们还需要从程序的视角对一些硬件有大致的认识。什么是内存?什么是寄存器?什么是程序计数器?……
产生这些疑问,其实也是因为汇编也是一种抽象,是机器语言的抽象。
我们当然可以跳过这部分知识。但是如果能了解这些知识,的确可以帮助我们学习。
从书中的内容,我整理出下面这几部分内容,可以帮助大家快速理解这些概念。
*内存的布局
理解了这些知识点后,如何理解什么是汇编语言呢?
这里我还想推荐一本书——《编码》,顺便也介绍一种选择书籍的好办法,概括起来就三个字:白,浅,透。
对新手来说,一听就明白。对专业人士来说,讲解的方式浅显易懂。对高手来说,道理讲得很透彻。
《编码》这本书的确是难得的“白,浅,透”三方面都做得特别好的入门书籍。
我们在这本书中可以看到,一个简单的逻辑门如何一步一步地演变出指令的过程。看完之后,大家对计算机、对汇编语言一定会有深刻的理解。
3. How
如何学习汇编语言呢?
要知道我们学习的目的不是为了能够编写汇编代码,而是能够看懂。所以学习起来相对简单。
我将第三章的内容分成了三部分。
首先,第一部分我们需要学习基本的指令形式,就像学习编程语言时我们需要先学基本语法一样。
*POP 指令的执行
然后,第二部分在学习函数相关的知识,这一部分我们可以学到栈和栈帧的概念。
*栈帧的布局
最后,掌握一下条件分支的知识,看看条件分支是如何实现编程语言中 `if` 和 循环语句的,也能够明白递归到底是怎么回事。
*递归运行时栈的情况
汇编语言作为一门低级语言,相比其他高级语言来说语法非常简洁,如果只要做到能够看懂,并不用花费太长时间。
4. One More Thing
学习“程序的机器级别表示”,看上去我们一直在研究汇编语言。然而这仅仅是个开始,从这里起步,在接下来的章节中我们可以看到操作系统的其他特性,比如虚拟、并发、持久化等等知识。
最后说一件最近工作中遇到的问题。我在前端使用 ajax 请求数据,接下去的事情需要等待这些数据到达后才能继续。
当时心中出现了好多问题:JavaScript 作为一个单线程语言,是如何实现 ajax 的异步调用的?这些跟线程有关系吗?有没有方法保证异步调用的顺序执行?
回过头来细想,能提出这些问题,都是因为我当时看过了操作系统是如何处理并发的,如何处理线程的。这些问题自然地出现在我的思考过程中。
顺着这个思路,很顺利地找到了 JavaScript 中异步编程的方法 promise,async、await。
*这里推荐一下我翻译的一篇文章:可视化的 JavaScript Promises & Async/Await (https://zhuanlan.zhihu.com/p/467601693)
其实,在很多高级的编程语言中都有异步编程。比如 JavaScript 中的 promise,async、await;C# 中的 async、await、Task 等等。
我个人的体验是这样的,如果只是为了掌握语言的特性,学习异步编程很有可能会学得雨里雾里。但是,当我们知道了操作系统是如何处理并发的,如何处理线程的,这些知识都将会帮助我们更加深刻地理解编程语言中的异步问题。
最后,还是回到文章开头那句话 —— 一切都从底层逻辑开始。
(完)
点击下方图片,查看更多精彩