全教育培训行业第三方平台平台就业机构
扫码试听
扫码试听
Q:2638333071
首页 > 技术干货 > 软件开发 > > 5、垃圾回收机制(垃圾回收机制 js)
行业动态 行业问答 课程问答 零基础学习 就业前景 技术干货

5、垃圾回收机制(垃圾回收机制 js)

发布时间:4 周 前 栏目:软件开发 浏览:

1、5、垃圾回收机制

JVM的垃圾回收机制主要涉及三个方面的问题:

1.JVM有哪些垃圾回收算法?各自有什么优势?

2.CMS垃圾回收器是如何工作的?有哪些阶段?

3.服务卡顿的元凶到底是什么?

Java不用程序来管理内存的回收,但这些内存是如何回收的?

其实,JVM有专门的线程在做这件事情。当内容空间达到一定条件时,会自动触发,这个过程就叫GC,负责GC的组件被称为垃圾回收器。JVM规范没有规定垃圾回收器怎么实现,它只需要保证不要把正在使用的对象回收掉就可以。在现在的服务器环境中,经常被使用的垃圾回收器有CMS和G1,但JVM还有其它几个常见的垃圾回收器。

GC的过程是先找到活跃的对象,然后把其他不活跃的对象判定为垃圾,然后删除,所以GC只与活跃的对象有关,和堆的大小无关。

接下来学习下分代垃圾回收的内存划分和GC过程,再有就是常见的垃圾回收器。

这篇比较重要,因为几乎所有的垃圾回收器都是在这些基本思想上演化出来的。

GC的第一步就是找出活跃的对象,根据GC Roots遍历所有的可达对象,这个过程就叫作标记。

如上图所示,圆圈代表对象,绿色的代表GC Roots,红色的代表可以追溯到的对象,标记后,有多个灰色的圆圈,代表都是可被回收的对象。

清除阶段就是把未被标记的对象回收掉。

这种方式有一个明显的问题,会产生碎片空间。

比如申请了1k、2k、3k、4k、5k的内存

由于某些原因,2k和4k的内存不再使用,交给垃圾回收器回收。

解决碎片问题,就需要进行内存整理。

有一个思路就是提送一个对等的内存空间,将存活的对象复制过去,然后清除员内存空间。

在程序设计时,一般遇到扩缩容或者碎片整理问题时,复制算法都是非常有效的。比如:HashMap的扩容使用的是同样的思路,Redis的rehash也是如此。

整个过程如下图

这种方式看似完美,解决了碎片问题,但是弊端也非常明显,它浪费了一半的内存空间来做这个事情,如果原本资源就有限,这就是一种无法容忍的浪费。

不用分配一个对等的空间也是可以完成内存的整理工作。

可以把内存想象成一个非常大的数组,根据随机的index删除了一些数据,那么对数组的清理不需要另外一个数组来进行支持的,使用程序就可以。

主要思路是移动所有的存活对象,且按照内存地址顺序依次排列,然后将末端内存地址以后的内存全部收回。

对象的引用关系一般是非常复杂的,从效率上来说,一般整理算法是要低于复制算法的。

JVM的垃圾回收器,都是对以上几种朴素算法的结合使用,简单看一下它们的特点:

效率一般,缺点是回造成内存碎片的问题。

复制算法是所有算法里面效率最高的,缺点是造成一定的空间浪费。

效率比前两者要差,但没有空间浪费,也消除了内存碎片问题。

所以没有最优的算法,只有最合适的算法。

JVM是计算节点,而不是存储节点。最理想的情况就是对象使用完成之后,它的生命周期立马就结束了,而那些被频繁访问的资源,我们希望它能够常驻在内存里。

对象大致可以分为两类:

1.大部分对象的生命周期都很短

2.其他对象则很可能会存活很长时间

现在的垃圾回收器都会在物理上或者逻辑上,把这两类对象进行分区。我们把死的快的对象所占的区域叫年轻代(Young Generation)。把其他活的长的对象所占的区域叫作老年代(Old Generation),老年代在有时候会叫作Tenured Generation。

年轻代使用的垃圾回收算法是复制算法,因为年轻代发生GC后,会有非常少的对象存活,复制这部分对象是非常高效的

年轻代的内部分区

如图所示,年轻代分为:一个伊甸园空间(Eden),两个幸存者空间(Survivor)。

当年轻代中的Eden区分配满的时候,就会触发年轻代的GC(Minor GC),具体过程如下

1.在Eden区执行了第一次GC之后,存活的对象会被移动到其中一个Suvivor分区(from);

2.Eden区再次GC,这是会采用复制算法,将Eden和from区一起清理,存活的对象会被复制到to区;接下来只需要清空from区就可以了

在整个过程中总会有一个Survivor分区是空置的。Eden、from、to的默认比例是8:1:1,所以只会造成10%的空间浪费。

这个比例是由参数-XX:SurvivorRatio进行配置的(默认为8)。

补充下不常提到的TLAB。TLAB全称是Thread Local Allocation Buffer,JVM默认给每个线程开辟一个buffer区域,用来加速对象分配。这个buffer就放在Eden区中。

这个道理和Java语言中的ThreadLocal类似,避免了对公共区的操作,以及一些锁竞争。

老年代一般使用"标记-清除"、"标记-整理"算法。因为老年代的对象存活率一般是比较高的,空间又比较大,拷贝起来并不划算,不如采取就地收集的方式。

对象进入老年代的途径分类

如果对象够老,会通过"提升"进入老年代。关于对象老不老,是通过它的年龄来判断的。每发生一次Minor GC,存活下来的对象年龄都会加1,直到达到一定的阀值,就会提升到老年代,

这些对象如果变的不可达,直到老年代发生GC的时候才会被清理掉。

这个阀值可以通过参数 -XX:+MaxTenuringThreshold进行配置,最大值是15,因为它是用4bit存储的(所以把这个值调的很大的文章,是没有什么根据的)。

每次存活的对象,都会放入其中一个幸存区,这个区域默认比例是10%,但无法保证每次存活的对象都小于10%,当Survivor空间不够,就需要依赖其它内存(老年代)进行分配担保。这个时候,对象也会直接在老年代上分配。

超出某个大小的对象直接在老年代分配,通过参数设置-XX:PretenureSizeThreshold进行配置的,默认为0,默认全部在Eden区进行分配。

有的垃圾回收算法,并不要求age必须达到15才能晋升到老年代,它会使用一些动态的计算方法。比如,如果幸存区中相同年龄对象大小的和,大于幸存区的一半,大于或者等于age的对象将会直接进入老年代。

这些动态判定一半不受外部控制

对象的引用关系时一个巨大的网状,有的对象在Eden区,有的可能在老年代,那么这种跨代的引用是如何处理的呢?由于Minor GC是单独发生的,如果一个老年代的对象引用了它,如何确保能够让年轻代的对象存活呢?

对于是、否的判断,我们通常都会用到Bitmap(位图)和布隆过滤器来加快搜索的速度,需要另外再学习下(如果不知道这两个概念的话)

JVM也是用了类似的方法。其实,老年代是被分成众多的卡页(Card Page)的(一般数量是2的次幂)

卡表(Card Table)就是用于标记卡页状态的一个集合,每个卡表对应一个卡页。

如果年轻代有对象分配,而且老年代有对象指向这个新对象,那么这个老年代对象所对应内存的卡页就会被标识为dirty,卡表只需要非常小的存储空间就可以保留这些状态,垃圾回收时,就可以先读这个卡表,进行快速的判断。

接下来学习HotSpot的几个垃圾回收器,每种回收器都有各自的特点。在平常的GC优化时,一定要清楚现在用的是那种垃圾回收器。

下图包含了年轻代和老年代的划分,方便接下来的学习参考

处理GC的只有一条线程,并且在垃圾回收的过程中暂停一切用户线程。

这是最简单的垃圾回收器,虽然简单,但十分高效,通常用在客户端应用上。因为客户端应用不会频繁创建很多对象,用户也不会感觉出明显的卡顿。相反,它使用的资源更少,也更轻量级。

ParNew是Serial的多线程版本,由多条GC线程并行地进行垃圾清理。清理过程依然要停止用户线程。追求低停顿时间,与Serial唯一区别就是使用了多线程进行垃圾回收,在多CPU环境下性能比Serial会有一定程度的提升;但线程切换需要额外的开销,因此在单CPU环境中表现不如Serial。

另一个多线程版本的垃圾回收器。但与ParNew是有区别的

1.Parallel Scavenge:追求CPU吞吐量,能够在较短时间内完成指定任务,适合没有交互的后台计算,弱交互强计算。

2.ParNew:追求降低用户停顿时间,适合交互式应用,强交互弱计算。

与年轻代的Serial垃圾回收器对应,都是单线程版本,同样适合客户端使用。

年轻代Serial,使用复制算法。

老年代的Old Serial,使用标记-整理算法。

Parallel Old回收器是Parallel Scavenge 的老年代版本,追求CPU吞吐量。

CMS(Concurrent Mark Sweep)回收器是以获取最短GC停顿时间为目标的收集器,它在垃圾回收时使得用户线程和GC线程能够并发执行,因此在垃圾回收过程中用户也不会感到明显的卡顿。

长期看来,CMS垃圾回收器,是要被G1等垃圾回收器替换掉的,在Java8之后,使用它将会抛出一个警告!

除了上面几个垃圾回收器,我们还有G1、ZGC等更加高级的垃圾回收器,它们都有专门的配置参数来使其生效。

通过-XX:PrintCommandLineFlags参数,可以查看当前Java版本默认使用的垃圾回收器。在Java13中,默认的回收器就是G1。

以下是一些配置参数:

1.-XX:+UseSerialGC 年轻代和年老代回收器

2.-XX:+UseParNewGC 年轻代使用ParNew,老年代使用Serial Old。

3.-XX:+UseParallelOldGC 年轻代和老年代哦都市用并行回收器。

4.-XX:+UseConcMarkSweepGC 表示年轻代使用ParNew,老年代使用CMS。

5.-XX:+UseG1GC 使用G1垃圾回收器

6.-XX:+UseZGC 使用ZGC垃圾回收器

这些垃圾回收器的关系还是比较复杂的,请看下图

目前Java8还是主流使用版本,从Java8升级到高版本的Java体系是有一定成本的,所以CMS垃圾回收器还会持续一段时间

抛个问题,如果在垃圾回收的时候,又有新的对象进入怎么办?

为了保住程序不乱套,最好的办法就是暂停用户的一切线程,也就是在这段时间,是不能new对象的,只能等待,表象是在JVM上就是短暂的卡顿,什么都干不了,这个现象叫作Stop The World。

标记阶段,大多数是要STW的。如果不暂停用户进程,在标记对象的时候,有可能有其它用户线程会产生一些新的对象和引用,造成混乱。

现在的垃圾回收器,都会尽量去减少这个过程。但即使最先进的ZGC回收器,也会有短暂的STW过程。我们要做的就是在现有基础设施上,尽量减少GC停顿。

举例说明下

某个高并发服务的峰值流量是10万次/秒,后面有10台负载均衡的机器,那么每台机器平均下来需要1w/s。假如某台机器在这段时间内发生了STW,持续了一秒,那么至少需要10ms就可以返回的1万个请求,需要至少等待1秒。

在用户那里的表现就是系统发生了卡顿。如果我们的GC非常的频繁。这种卡顿就会特别的明显,严重影响用户体验。

虽然说Java为我们提供了非常棒的自动内存管理机制,但也不能滥用,因为它是有STW硬伤的。

介绍了堆的具体分区,年轻代和老年代。介绍了多个常用的垃圾回收器,不同的垃圾回收器有不同的特点。各种垃圾回收器都是为了解决头疼的STW问题,让GC时间更短,停顿更短,吞吐量更大。

接触了很多名词,总结如下

2.分配担保

3.提升

4.卡片标记

5、垃圾回收机制

2、JVM有哪些垃圾回收算法

在JVM运行时数据区存在一个堆区, 堆是一个巨大的对象池。在这个对象池中管理着数量巨大的对象实例,而池中对象的引用层次,有的是很深的。一个被频繁调用的接口,每秒生成对象的速度,是很大的,同时,对象之间的关系,形成了一张巨大的网。

Java 一直在营造一种无限内存的氛围,但对象不能只增不减,所以需要垃圾回收;那 JVM 是如何判断哪些对象应该被回收?哪些应该被保持呢?这就要用到JVM的垃圾回收机制了,也就是我们常说的GC(Garbage Collection),也叫垃圾收集器。

5、垃圾回收机制

3、JVM的垃圾算法有哪几种

一、垃圾收集器概述

如上图所示,垃圾回收算法一共有7个,3个属于年轻代、三个属于年老代,G1属于横跨年轻代和年老代的算法。

JVM会从年轻代和年老代各选出一个算法进行组合,连线表示哪些算法可以组合使用

二、各个垃圾收集器说明

1、Serial(年轻代)

年轻代收集器,可以和Serial Old、CMS组合使用

采用复制算法

使用单线程进行垃圾回收,回收时会导致Stop The World,用户进程停止

client模式年轻代默认算法

GC日志关键字:DefNew(Default New Generation)

图示(Serial+Serial Old)

2、ParNew(年轻代)

新生代收集器,可以和Serial Old、CMS组合使用

采用复制算法

使用多线程进行垃圾回收,回收时会导致Stop The World,其它策略和Serial一样

server模式年轻代默认算法

使用-XX:ParallelGCthreads参数来限制垃圾回收的线程数

GC日志关键字:ParNew(Parallel New Generation)

图示(ParNew + Serail Old)

3、Paralle Scavenge(年轻代)

新生代收集器,可以和Serial Old、Parallel组合使用,不能和CMS组合使用

采用复制算法

使用多线程进行垃圾回收,回收时会导致Stop The World

关注系统吞吐量

-XX:MaxGCPauseMillis:设置大于0的毫秒数,收集器尽可能在该时间内完成垃圾回收

-XX:GCTimeRatio:大于0小于100的整数,即垃圾回收时间占总时间的比率,设置越小则希望垃圾回收所占时间越小,CPU能花更多的时间进行系统操作,提高吞吐量

-XX:UseAdaptiveSizePolicy:参数开关,启动后系统动态自适应调节各参数,如-Xmn、-XX:SurvivorRatio等参数,这是和ParNew收集器重要的区别

GC日志关键字:PSYoungGen

4、Serial Old(年老代)

年老代收集器,可以和所有的年轻代收集器组合使用(Serial收集器的年老代版本)

采用 ”标记-整理“算法,会对垃圾回收导致的内存碎片进行整理

使用单线程进行垃圾回收,回收时会导致Stop The World,用户进程停止

GC日志关键字:Tenured

图示(Serial+Serial Old)

5、ParallelOld(年老代)

年老代收集器,只能和Parallel Scavenge组合使用(Parallel Scavenge收集器的年老代版本)

采用 ”标记-整理“算法,会对垃圾回收导致的内存碎片进行整理

关注吞吐量的系统可以将Parallel Scavenge+Parallel Old组合使用

GC日志关键字:ParOldGen

图示(Parallel Scavenge+Parallel Old)

6、CMS(Concurrent Mark Sweep年老代)

年老代收集器,可以和Serial、ParNew组合使用

采用 ”标记-清除“算法,可以通过设置参数在垃圾回收时进行内存碎片的整理

1、UserCMSCompactAtFullCollection:默认开启,FullGC时进行内存碎片整理,整理时用户进程需停止,即发生Stop The World

2、CMSFullGCsBeforeCompaction:设置执行多少次不压缩的Full GC后,执行一个带压缩的(默认为0,表示每次进入Full GC时都进行碎片整理)

CMS是并发算法,表示垃圾回收和用户进行同时进行,但是不是所有阶段都同时进行,在初始标记、重新标记阶段还是需要Stop the World。CMS垃圾回收分这四个阶段

1、初始标记(CMS Initial mark) Stop the World 仅仅标记一下GC Roots能直接关联到的对象,速度快

2、并发标记(CMS concurrent mark) 进行GC Roots Tracing,时间长,不发生用户进程停顿

3、重新标记(CMS remark) Stop the World 修正并发标记期间因用户程序继续运行导致标记变动的那一部分对象的标记记录,停顿时间较长,但远比并发标记时间短

4、并发清除(CMS concurrent sweep) 清除的同时用户进程会导致新的垃圾,时间长,不发生用户进程停顿

适合于对响应时间要求高的系统

GC日志关键字:CMS-initial-mark、CMS-concurrent-mark-start、CMS-concurrent-mark、CMS-concurrent-preclean-start、CMS-concurrent-preclean、CMS-concurrent-sweep、CMS-concurrent-reset等等

缺点

1、对CPU资源非常敏感

2、CMS收集器无法处理浮动垃圾,即清除时用户进程同时产生的垃圾,只能等到下次GC时回收

3、因为是使用“标记-清除”算法,所以会产生大量碎片

图示

7、G1

G1收集器由于没有使用过,所以从网上找了一些教程供大家了解

并行与并发

分代收集

空间整合

可预测的停顿

上一篇:没有了
技术干货
零基础学习
行业多年深耕,从这报名,学费立减800
  • 岳同学180****1241刚刚成功领取
  • 胡同学134****6431刚刚成功领取
  • 李同学150****6122刚刚成功领取
  • 张同学136****2231刚刚成功领取
  • 孙同学178****5521刚刚成功领取
  • 齐同学156****7788刚刚成功领取
猜你喜欢
查看更多
相关推荐
查看更多
现在学习,我的薪资能达到多少?
立即报名

联系我们:

Q:2638333071

鄂ICP备2023015464号