JVM中的垃圾回收机制(速记版)
JVM中的垃圾回收
JVM的可管理内存区域分为两个部分
- 方法区
- 堆
JVM会对这两个区域自动做垃圾回收
不懂JVM的内存分布的可以看我的这篇文章:JVM的内存区域(速记版)-CSDN博客
方法区的垃圾回收
方法区中主要存放这类的元信息,能回收的内容自然是不在使用的类。
判定一个类可以被卸载,需要同时满足三个条件:
- 这个类的所有实例对象都已经被回收了,在堆中不存在这个类的实例对象以及子类对象。
- 加载这个类的加载器已经被回收了。
- 该类的java.lang.class对象没有在任何地方被引用。
堆的垃圾回收
引用计数法和可达性分析法
堆中的对象能否被回收,主要是看是否被引用决定的。如果对象被引用了,说明对象还在使用,不允许被回收。
如何判断堆上的对象有没有被引用,主要有两种判断方法:
- 引用计数法
- 可达性分析法
引用计数法
引用计数法会为每个对象维护一个引用计数器,每当这个对象被引用,计数器就会加一,反之减一。
引用计数法的优点是实现简单,C++中的智能指针就采用了引用计数法,但是它也存在缺点,主要有两点: 1.每次引用和取消引用都需要维护计数器,对系统性能会有一定的影响 2.存在循环引用问题,所谓循环引用就是当A引用B,B同时引用A时会出现对象无法回收的问题。
可达性分析法
Java使用的是可达性分析算法来判断对象是否可以被回收。可达性分析将对象分为两类:垃圾回收的根对象(GC Root)和普通对象,对象与对象之间存在引用关系。 下图中A到B再到C和D,形成了一个引用链,可达性分析算法指的是如果从某个到GC Root对象是可达的,对象就 不可被回收。
那些对象可以被称之为GC Root对象呢?
- 线程Thread对象
- 系数类加载器加载的java.lang.class对象。
- 监视器对象,用来保存同步锁syschroinzed关键字持有的对象
- 本地方法调用时使用的
- 全局对象。
五种对象引用
可达性算法中描述的对象引用,一般指的是强引用,即是GCRoot对象对普通对象有引用关系,只要这层关系存在, 普通对象就不会被回收。
除了强引用之外,Java中还设计了几种其他引用方式:
- 软引用:软引用相对于强引用是一种比较弱的引用关系,如果一个对象只有软引用关联到它,当程序内存不足时,就会将软 引用中的数据进行回收
- 弱引用:弱引用的整体机制和软引用基本一致,区别在于弱引用包含的对象在垃圾回收时,不管内存够不够都会直接被回收。
- 虚引用:虚引用也叫幽灵引用/幻影引用,不能通过虚引用对象获取到包含的对象。虚引用唯一的用途是当对象被垃圾回 收器回收时可以接收到对应的通知。Java中使用PhantomReference实现了虚引用,直接内存中为了及时知道 直接内存对象不再使用,从而回收内存,使用了虚引用来实现。常规开发中是不会使用的。
- 终结器引用:终结器引用指的是在对象需要被回收时,终结器引用会关联对象并放置在Finalizer类中的引用队列中,在稍后 由一条由FinalizerThread线程从队列中获取对象,然后执行对象的finalize方法,在对象第二次被回收时,该 对象才真正的被回收。常规开发中是不会使用的。
垃圾回收算法
垃圾回收做的两件事:
1、找到内存中存活的对象 2、释放不再存活对象的内存,使得程序能再次利用这部分空间
垃圾回收算法根据发展阶段分为四类
Mark Sweep GC(标记-清除算法)
Copying GC (复制算法)
Mark Compact GC (标记-整理算法)
Generational GC (分代GC)
垃圾回收算法的评价标准
Java垃圾回收过程会通过单独的GC线程来完成,但是不管使用哪一种GC算法,都会有部分阶段需要停止所 有的用户线程。这个过程被称之为Stop The World简称STW,如果STW时间过长则会影响用户的使用
所以GC算法是否优秀,看三个方面
1.吞吐量
吞吐量指的是 CPU 用于执行用户代码的时间与 CPU 总执行时间的比值,即吞吐量 = 执行用户代码时间 / (执行用户代码时间 + GC时间)。吞吐量数值越高,垃圾回收的效率就越高。
2.最大暂停时间
最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值。比如如下的图中,黄色部分的STW就是最 大暂停时间,显而易见上面的图比下面的图拥有更少的最大暂停时间。最大暂停时间越短,用户使用系统时 受到的影响就越短
3.堆使用效率
不同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算 法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法。
标记清除算法
标记清除算法的核心思想分为两个阶段:
1.标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出 所有存活对象。
2.清除阶段,从内存中删除没有被标记也就是非存活对象。
优点:实现简单,只需要在第一阶段给每个对象维护标志位,第二阶段删除对象即可。 缺点:1.碎片化问题 由于内存是连续的,所以在对象被删除之后,内存中会出现很多细小的可用内存单元。如果我们需要的是一 个比较大的空间,很有可能这些内存单元的大小过小无法进行分配。
复制算法
复制算法的核心思想是:
1.准备两块空间From空间和To空间,每次在对象分配阶段,只能使用其中一块空间(From空间)。
2.在垃圾回收GC阶段,将From中存活对象复制到To空间。
3.将两块空间的From和To名字互换。
优点:
吞吐量高:
复制算法只需要遍历一次存活对象 复制到To空间即可,比标记-整理 算法少了一次遍历的过程,因而性 能较好,但是不如标记-清除算法, 因为标记清除算法不需要进行对象 的移动。
不会发生碎片化
复制算法在复制之后就会将对象按顺序放入To空间中,所以对象以外的区域都是可 用空间,不存在碎片化内存空间。
缺点:
- 内存使用效率低
每次只能让一半的内存空间来为创 建对象使用。
标记整理算法
标记整理算法也叫标记压缩算法,是对标记清理算法中容易产生内存碎片问题的一种解决方案。
核心思想分为两个阶段:
1.标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出 所有存活对象。
2.整理阶段,将存活对象移动到堆的一端。清理掉存活对象的内存空间。
优点:
- 内存使用效率高
整个堆内存都可以使用,不会像复 制算法只能使用半个堆内存。 - 不会发生碎片化
在整理阶段可以将对象往内存的一侧进行移动,剩下的空间都是可以分配对象的有效空间
缺点:
- 整理阶段的效率不高
整理算法有很多种,比如Lisp2整 理算法需要对整个堆中的对象搜索3 次,整体性能不佳。可以通过Two Finger、表格算法、ImmixGC等高 效的整理算法优化此阶段的性能
分代垃圾回收算法
现代优秀的垃圾回收算法,会将上述描述的垃圾回收算法组合进行使用,其中应用最广的就是分代垃圾回收 算法(Generational GC)。 分代垃圾回收将整个内存区域划分为年轻代和老年代:
分代回收时,创建出来的对象,首先会被放入Eden伊甸园区。 随着对象在Eden区越来越多,如果Eden区满,新创建的对象已经无法放入,就会触发年轻代的GC,称为 Minor GC或者Young GC。 Minor GC会把需要eden中和From需要回收的对象回收,把没有回收的对象放入To区。
接下来,S0会变成To区,S1变成From区。当eden区满时再往里放入对象,依然会发生Minor GC。 此时会回收eden区和S1(from)中的对象,并把eden和from区中剩余的对象放入S0。 注意:每次Minor GC中都会为对象记录他的年龄,初始值为0,每次GC完加1。
如果Minor GC后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。 当老年代中空间不足,无法放入新的对象时,先尝试minor gc如果还是不足,就会触发Full GC,Full GC会对整个堆进行垃圾回收。 如果Full GC依然无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory异常。
垃圾回收器
为什么分代GC算法要把堆分成年轻代和老年代?
- 系统中的大部分对象,都是创建出来之后很快就不再使用可以被回收,比如用户获取订单数据,订单数据返回 给用户之后就可以释放了。
- 老年代中会存放长期存活的对象,比如Spring的大部分bean对象,在程序启动之后就不会被回收了。
- 在虚拟机的默认设置中,新生代大小要远小于老年代的大小。
分代GC算法将堆分成年轻代和老年代主要原因有:
1、可以通过调整年轻代和老年代的比例来适应不同类型的应用程序,提高内存的利用率和性能。
2、新生代和老年代使用不同的垃圾回收算法,新生代一般选择复制算法,老年代可以选择标记-清除和标记-整理 算法,由程序员来选择灵活度较高。
3、分代的设计中允许只回收新生代(minor gc),如果能满足对象分配的要求就不需要对整个堆进行回收(full gc),STW时间就会减少。
垃圾回收器的组合关系
垃圾回收器是垃圾回收算法的具体实现。 由于垃圾回收器分为年轻代和老年代,除了G1之外其他垃圾回收器必须成对组合进行使用。 具体的关系图如下:
年轻代-Serial垃圾回收器
老年代-SerialOld垃圾回收器
年轻代-ParNew垃圾回收器
老年代-CMS(Concurrent Mark Sweep)垃圾回收器
CMS执行步骤:
1.初始标记,用极短的时间标记出GCRoots能直接关联到的对象。
2.并发标记, 标记所有的对象,用户线程不需要暂停。
3.重新标记,由于并发标记阶段有些对象会发生了变化,存在错标、漏标等情况,需要重新标记。 4.并发清理,清理死亡的对象,用户线程不需要暂停。
年轻代-Parallel Scavenge垃圾回收器
G1垃圾回收器
JDK9之后默认的垃圾回收器是G1(Garbage First)垃圾回收器。
Parallel Scavenge关注吞吐量,允许用户设置最大暂停时间 ,但是会减少年轻代可用空间的大小。
CMS关注暂停时间,但是吞吐量方面会下降。
而G1设计目标就是将上述两种垃圾回收器的优点融合:
1.支持巨大的堆空间回收,并有较高的吞吐量。
2.支持多CPU并行垃圾回收。
3.允许用户设置最大暂停时间
JDK9之后强烈建议使用G1垃圾回收器。
内存结构:
G1的整个堆会被划分成多个大小相等的区域,称之为区Region,区域不要求是连续的。分为Eden、Survivor、 Old区。Region的大小通过堆空间大小/2048计算得到,也可以通过参数-XX:G1HeapRegionSize=32m指定(其 中32m指定region大小为32M),Region size必须是2的指数幂,取值范围从1M到32M。
G1垃圾回收有两种方式:
1、年轻代回收(Young GC) :
年轻代回收(Young GC),回收Eden区和Survivor区中不用的对象。会导致STW,G1中可以通过参数-XX:MaxGCPauseMillis=n(默认200) 设置每次垃圾回收时的最大暂停时间毫秒数,G1垃圾回收器会尽可能地 保证暂停时间。2、混合回收(Mixed GC):
回收所有年轻代和 部分老年代的对象以及大对象区。采用复制算法来完成
