垃圾收集算法
文章目录
- 标记-清除算法
- 复制算法
- 标记-压缩算法
- 分代收集算法
在Java中,垃圾收集(Garbage Collection, GC)是一种自动化的内存管理机制,它负责回收不再使用的对象所占用的内存。Java虚拟机(JVM)提供了多种不同的垃圾收集器,每种垃圾收集器都有其特点和适用场景,使用的也是不同的垃圾收集算法。以下是几种常见的垃圾收集算法:
标记-清除算法
标记-清除(Mark-Sweep)算法是最基础的收集算法,它分为标记和清除两个阶段。
首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,它的标记过程其实就是垃圾判定算法中介绍的过程。
该算法有两个缺点:
- 效率问题:标记和清除两个过程的效率都不高
- 空间碎片:标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
执行过程:
复制算法
复制(Copying)算法解决了效率低的问题。它将可用内存容量划分为大小相等的两块,每次只使用其中的一块。当这一块内存用完了,就将还存活的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,简单高效。
缺点是:可用内存缩小为原来的一半,代价有点儿高。
执行过程:
现在的商业虚拟机都采用这种收集算法来回收新生代。
通常将内存分为一块较大的Eden区和两块较小的Survivor区,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活的对象一次性地复制到另外一块Survivor区,最后清理掉Eden和刚用过的Survivor区。据研究表明,新生代中的对象98%是朝生夕死的。
HotSpot默认Eden和Survivor的大小比例是8:1:1,也就是每次新生代中可用内存空间为整个新生代容量的90%。
当然,并98%只是一般场景下的统计数据,实际上没办法保证每次回收都只有不多于10%的对象存活。当Survivor空间不够用时,需要依赖其他内存进行分配担保(Handle Promotion)。
标记-压缩算法
复制算法在对象存活率较高时需要进行较多的复制操作,效率会降低很多。更关键的是需要有额外的空间进行分配担保,以应对内存中所有对象100%存活的极端情况,所以老年代一般不能直接选择这种算法。
标记-压缩(Mark-Compact)算法,也叫标记-整理算法。标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存。
执行过程:
分代收集算法
现在虚拟机的垃圾收集都采用分代收集(Generational Collection)算法。这种算法根据对象存活周期的不同将内存划分为几块。
一般把Java堆分为新生代和老年代,然后根据各个年代的特点采用最适当的收集算法。
- 新生代:每次收集时都有大批对象死去,只有少量存活,选用复制算法,只需要复制出少量存活对象就可以快速完成收集。
- 老年代:对象存活率高、没有额外空间对它进行分配担保,一般使用标记-清理或标记-压缩算法。