在这里插入代码片
为什么要有垃圾回收机制?
程序运行过程中会申请大量的内存空间,而对于一些无用的内存空间,如果不及时清理的话,会导致内存使用完(内存溢出),导致程序崩溃,因此,内存管理是一件重要且繁杂的事情,而python解释器自带的垃圾回收机制把程序员从繁杂的内存管理中解放出来。
引用计数
1).当一个对象的引用被创建或者复制时,对象的引用计数加1;当一个对象的引用被销毁时,对象的引用计数减1.
2).当对象的引用计数减少为0时,就意味着对象已经再没有被使用了,可以将其内存释放掉。
引用计数就是:变量值被变量名关联的次数
如:引用计数增加
x=10(此时,变量值10的引用次数为1)
y=x(此时,把x的内存地址给了y,此时,变量值10 的引用计数为2)
引用计数减少
x=3(此时,x和10解除关系,与3建立关系,变量值10的引用计数为1)
del y(del是解除变量名y与变量值10之间的关系,变量值10的引用计数为0),变量值10的引用计数为0,其占用的内存空间就会被回收
循环引用
引用计数机制执行效率问题:变量值被关联次数的增加或减少,都会引发引用计数机制的执行,这明显存在效率问题,这就是引用计数的一个软肋,但引用计数还存在一个致命弱点,即循环引用(也称交叉引用)。
# 变量名list1指向列表1,变量名list2指向列表2,如下
>>> list1=['列表1中的第一个元素'] # 列表1被引用一次
>>> list2=['列表2中的第一个元素'] # 列表2被引用一次
>>> list1.append(list2) # 把列表2追加到list1中作为第二个元素,列表2的引用计数为2
>>> list2.append(list1) # 把列表1追加到list2中作为第二个元素,列表1的引用计数为2
# list1与list2
del list1 #列表1的引用计数为1
del list2 #列表2的引用计数为1
现在列表1和列表2都没被其他变量名关联,但引用计数不为0,所以不会被回收,这就是循环引用的危害,为解决这问题,python引进了‘标记-清除’,‘分代回收’。
标记-清除
1)它分为两个阶段:第一阶段是标记阶段,GC会把所有的活动对象打上标记,第二阶段是把那些没有标记的对象非活动对象进行回收。
2)对象之间通过引用(指针)连在一起,构成一个有向图
3)从根对象(root object)出发,沿着有向边遍历对象,可达的(reachable)对象标记为活动对象,不可达的对象就是要被清除的非活动对象,根对象就是全局变量、调用栈、寄存器。
注:像是PyIntObject、PyStringObject这些不可变对象是不可能产生循环引用的,因为它们内部不可能持有其它对象的引用。
容器对象(list,set,dict,class,instance)都可以包含其他对象的引用,所以都可能产生循环引用。在了解 ‘标记-清除’ 之前,先得知道一个知识点:内存中有两块区域:堆区 与 栈区,在定义变量时,变量名放在栈区,变量值放在堆区,内存管理是对堆区的管理。
当有效内存空间被耗尽的时候,就会停止整个程序,然后进行两项工作,第一是标记,第二是清除
标记:遍历所有的GC Roots对象(栈区中的所有内容或者线程都可以作为GC Roots对象),然后将所有GC Roots对象可以直接访问或间接访问的对象标记为存活对象。
清除:遍历堆区中所有的对象,将没有标记的对象全部清除
分代回收
1. 分代回收是建立在标记清除技术基础之上的,是一种以空间换时间的操作方式。
2. Python将内存分为了3“代”,分别为年轻代(第0代)、中年代(第1代)、老年代(第2代)
3. 他们对应的是3个链表,它们的垃圾收集频率与对象的存活时间的增大而减小。
4. 新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发
5. 把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推
6. 老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。