博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
什么是Java对象分配率?
阅读量:2117 次
发布时间:2019-04-30

本文共 2412 字,大约阅读时间需要 8 分钟。

类似“不可持续的内存分配率”和“你需要维持低的内存分配率”这样的短语看起都像是属于 Java 冠军(Java Champions)的专有词汇。复杂、吓人、充满神秘色彩。

这些词语经常出现,但是如果你深入了解这些概念,它的神秘色彩就烟消云散了。这篇文章将试着揭开上面这些术语的神秘面纱。

什么是内存分配率?我们为什么要关心它?

内存分配率是指单位时间内分配内存的总数量,通常用 MB/sec 表示。不过,如果你乐意,也可以用 PB/year 来表示。这就是全部的内容——没那么神秘,仅仅是指 Java 代码在一定时期内内存分配的大小。

不过只知道这一点没有太大的意义。如果你能忍受,我将带你在实践中应用这个概念。高分配率意味着你的程序存在性能问题。从实践角度来说,主要影响是使得  成为了瓶颈。从硬件角度来说,即使常用的硬件也能支持每核几 GB/sec 的分配率。而实际上,你的分配率不会超过 1 GB/sec/core。所以你可以放心,硬件基本不可能成为应用的瓶颈。

所以,当我们关注 GC 的时候,就可以和真实情况类比了——如果你创建很多的成员,之后就需要做很多清理工作。我们知道,JVM 建立垃圾回收机制需要知道内存分配率,由此来改变 GC 执行的频率和 GC 停顿的时间。

内存分配率的测量

我们开始测量内存分配率。我们设置 JVM 参数:-XX:+PrintGCDetails -XX:+PrintGCTimeStamps 来打开 GC 日志。现在,JVM 开始以下列方式记录 GC 停顿日志:

1
2
3
0.291
: [GC (Allocation Failure) [PSYoungGen: 33280K->5088K(38400K)] 33280K->24360K(125952K),
0.0365286
secs] [Times: user=
0.11
sys=
0.02
, real=
0.04
secs]
0.446
: [GC (Allocation Failure) [PSYoungGen: 38368K->5120K(71680K)] 57640K->46240K(159232K),
0.0456796
secs] [Times: user=
0.15
sys=
0.02
, real=
0.04
secs]
0.829
: [GC (Allocation Failure) [PSYoungGen: 71680K->5120K(71680K)] 112800K->81912K(159232K),
0.0861795
secs] [Times: user=
0.23
sys=
0.03
, real=
0.09
secs]

根据上述 GC 日志,我们可以从年青代(Young Generation)上一次回收后的大小及下一次回收前的大小来计算出分配率。利用上面的例子,我们可以抽取出如下信息:

  • JVM 启动291毫秒后,加载的对象大小是33280K。第一次 minor GC 清理后,年青代剩余的对象大小是 5088K。
  • 启动446毫秒后,年青代占用的空间已经增长到38368K,并触发了下一次 GC,这次 GC 后,年青代占用的空间减少到5120K。
  • 启动829毫秒后,年青代的大小是71680K,GC 后再次减少到 5120K。

这些数据用如下的表格展示,计算出来的内存分配率添加年青代占用空间的后面:

事件 时间 添加年轻代之前 添加年轻代之后 已分配 分配率
1st GC 291ms 33,280KB 5,088KB 33,280KB 114MB/sec
2nd GC 446ms 38,368KB 5,120KB 33,280KB 215MB/sec
3rd GC 829ms 71,680KB 5,120KB 66,560KB 174MB/sec
Total 829ms N/A N/A 133,120KB 161MB/sec

有了这些信息,我们就可以说对这个特定软件,在测量期间的内存分配率是161 MB/sec。

影响分析

现在,通过这些信息,我们能够明白改变内存分配率,可以增加或减少 GC 停顿的频率,从而影响应用的吞吐率。首先,也是最重要的,你应该注意只有  清理年青代的停顿才会受影响。老年代(Old Generation)的清理,无论是频率还是持续时间都不直接受分配率的影响,但是受增长率(promotion rate)的影响,增长率是下一篇文章讨论的术语。

了解这些后,我们就只需要关注  的停顿,我们应该更进一步的去理解在年青代内部内存池的不同之处。因为内存分配是在 Eden 区中进行的,我们可以直接看 Eden 区的大小对分配率的影响。所以我们可以假设,随着  区的增长,minor GC 停顿频率频率会降低,应用就能满足更快的分配率。

事实上,当我们采用不同的 Eden 区大小(-XX:NewSize -XX:MaxNewSize 和 -XX:SurvivorRatio参数)来执行相同的实例时,我们可以看到两种不同的内存分配率:

    • 设置 Eden 区为100M,运行上面的例子,内存分配率降低到100MB/sec。
    • 增加个 Eden 区到1GB,增加的内存分配率接近 200MB/sec。

如果你仍然疑惑这为什么是对的——假设减少应用线程 GC 的频率,你就可以做更多的有用的工作。这样就可以生成更多的对象,从而支持更高内存分配率。

现在,在你得出“ Eden 区越大越好”的结论之前,你应该注意内存分配率可能不会直接关联应用的真实吞吐率。并且这只是一种侧重吞吐率的技术测量。内存分配率只影响 Minor GC 暂停应用线程的频率,但从整体的影响来说,你还需要考虑 Major GC 的停顿以及应用提供的业务操作。

原文链接: 
 翻译: 

译文链接: 

转载地址:http://jfref.baihongyu.com/

你可能感兴趣的文章
算法导论阅读顺序
查看>>
Windows程序设计:直线绘制
查看>>
linux之CentOS下文件解压方式
查看>>
Django字段的创建并连接MYSQL
查看>>
div标签布局的使用
查看>>
HTML中表格的使用
查看>>
(模板 重要)Tarjan算法解决LCA问题(PAT 1151 LCA in a Binary Tree)
查看>>
(PAT 1154) Vertex Coloring (图的广度优先遍历)
查看>>
(PAT 1115) Counting Nodes in a BST (二叉查找树-统计指定层元素个数)
查看>>
(PAT 1143) Lowest Common Ancestor (二叉查找树的LCA)
查看>>
(PAT 1061) Dating (字符串处理)
查看>>
(PAT 1118) Birds in Forest (并查集)
查看>>
数据结构 拓扑排序
查看>>
(PAT 1040) Longest Symmetric String (DP-最长回文子串)
查看>>
(PAT 1145) Hashing - Average Search Time (哈希表冲突处理)
查看>>
(1129) Recommendation System 排序
查看>>
PAT1090 Highest Price in Supply Chain 树DFS
查看>>
(PAT 1096) Consecutive Factors (质因子分解)
查看>>
(PAT 1019) General Palindromic Number (进制转换)
查看>>
(PAT 1073) Scientific Notation (字符串模拟题)
查看>>