详解Python垃圾回收机制

kkkkk 2018年12月17日 23:06 Python高级

引用计数

Python默认的垃圾收集机制是“引用计数”,每个对象维护了一个ob_ref字段。它的优点是机制简单,当新的引用指向该对象时,引用计数加1,当一个对象的引用被销毁时减1,一旦对象的引用计数为0,该对象立即被回收,所占用的内存将被释放。它的缺点是需要额外的空间维护引用计数,不过最主要的问题是它不能解决“循环引用”。


什么是循环引用?A和B相互引用而再没有外部引用A与B中的任何一个,它们的引用计数虽然都为1,但显然应该被回收,例子:

  a = { } # a 的引用为 1
  b = { } # b 的引用为 1
  a['b'] = b # b 的引用增 1,b的引用为2
  b['a'] = a # a 的引用增 1,a的引用为 2
  del a # a 的引用减 1,a的引用为 1
  del b # b 的引用减 1, b的引用为 1

在这个例子中,del语句减少了 a 和 b 的引用计数并删除了用于引用的变量名,可是由于两个对象各包含一个对方对象的引用,虽然最后两个对象都无法通过名字访问了,但引用计数并没有减少到零。因此这个对象不会被销毁,它会一直驻留在内存中,这就造成了内存泄漏。为了解决循环引用问题,Python引入了标记-清除和分代回收两种GC机制。

标记清除

标记——清除(Mark——Sweep)是一种基于追踪(Tracing)回收技术实现的垃圾回收算法,对象之间通过引用(指针)连在一起,构成一个有向图,对象构成这个有向图的节点,而引用关系构成这个有向图的边。从根对象(root object)出发,沿着有向边遍历对象,可达的对象标记为有用的对象,不可达的对象就是要被清除的对象。所谓根对象就是一些全局引用对象和函数栈中的引用,这些引用所引用的对象是不可被删除的。


标记清除算法作为Python的辅助垃圾收集技术主要处理的是一些容器对象,比如list、dict、tuple,instance等,因为对于字符串、数值对象是不可能造成循环引用问题。Python使用一个双向链表将这些容器对象组织起来。

分代回收

分代回收是一种以空间换时间的操作方式,Python将内存根据对象的存活时间划分为不同的集合,每个集合称为一个代,Python将内存分为了3“代”,分别为年轻代(第0代)、中年代(第1代)、老年代(第2代),他们对应的是3个链表,它们的垃圾收集频率与对象的存活时间的增大而减小。新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发,把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推,老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。同时,分代回收是建立在标记清除技术基础之上。


分代回收同样作为Python的辅助垃圾收集技术处理那些容器对象


文章评论(0)
  • avatar kkkkkk 2018年12月21日 11:31
    这评论真好啊!
    kkkkk
    2018年12月21日 11:16
    清新流畅,自然有致 取材丰富,文字生动。 颇富幽默,笔调轻松 自然顺畅,有条不紊。
    回复
  • avatar kkkkkk 2018年12月21日 11:31
    差劲
    kkkkklxinde
    2018年12月21日 11:17
    本文独擅胜场之处在于其体现出的作者思维的穿透力与概括性。本文由材料切入,引出观点,并以此为重点展开阐述;同时做辩证分析,体现了作者思维的高度和思考的深入。第三段联系现实概述种种需要“更”的表现,言约而意丰。新颖而有力的论证观点。
    回复
  • avatar kkkkklxinde 2018年12月21日 11:17
    本文独擅胜场之处在于其体现出的作者思维的穿透力与概括性。本文由材料切入,引出观点,并以此为重点展开阐述;同时做辩证分析,体现了作者思维的高度和思考的深入。第三段联系现实概述种种需要“更”的表现,言约而意丰。新颖而有力的论证观点。
    回复
  • avatar kkkkk 2018年12月21日 11:16
    清新流畅,自然有致 取材丰富,文字生动。 颇富幽默,笔调轻松 自然顺畅,有条不紊。
    回复