java内存运行时的各个部分,其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进入和退出而有条不絮地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的(尽管JIT编译器会进行一些优化,但大体可认为是编译期可预知的),因此这个几个区域内存的分配和回收都具备确定性。而java堆和方法区则不一样,一个接口的多个实现类需要的内存可能不一样,一个方法的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的主要是堆内存以及方法区。
- 1. 引用计数算法
给对象添加一个引用计数器,每当有一个地方引用它时,计数值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。客观地说,引用计数算法的实现简单,判定效率也很高,在大部分情况下都是一个不错的算法,但是主流的Java虚拟机里面没有选用引用计数算法来管理内存,其中最主要的原因是它很难解决对象之间相互循环引用的问题。
/** * GC VM Args: * -XX:+PrintGC 输出GC日志 * -XX:+PrintGCDetails 输出GC的详细日志 * -XX:+PrintGCTimeStamps 输出GC的时间戳(以基准时间的形式) * -XX:+PrintGCDateStamps 输出GC的时间戳(以日期的形式,如 2013-05-04T21:53:59.234+0800) * -XX:+PrintHeapAtGC 在进行GC的前后打印出堆的信息 * -Xloggc:../logs/gc.log 日志文件的输出路径 */public class ReferenceCountingGC { public Object instance = null; private static final int _1MB = 1024 * 1024; //占点内存 private byte[] bytes = new byte[2 * _1MB]; public static void main(String[] args) { ReferenceCountingGC objA = new ReferenceCountingGC(); ReferenceCountingGC objB = new ReferenceCountingGC(); objA.instance = objB; objB.instance = objA; objA = null; objB = null; //测试objA和objB能否被GC System.gc(); }}
[GC [PSYoungGen: 6697K->568K(75776K)] 6697K->568K(248320K), 0.0008632 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC [PSYoungGen: 568K->0K(75776K)] [ParOldGen: 0K->468K(172544K)] 568K->468K(248320K) [PSPermGen: 2563K->2562K(21504K)], 0.0074430 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] Heap PSYoungGen total 75776K, used 1950K [0x00000007ab900000, 0x00000007b0d80000, 0x0000000800000000) eden space 65024K, 3% used [0x00000007ab900000,0x00000007abae7ba8,0x00000007af880000) from space 10752K, 0% used [0x00000007af880000,0x00000007af880000,0x00000007b0300000) to space 10752K, 0% used [0x00000007b0300000,0x00000007b0300000,0x00000007b0d80000) ParOldGen total 172544K, used 468K [0x0000000702c00000, 0x000000070d480000, 0x00000007ab900000) object space 172544K, 0% used [0x0000000702c00000,0x0000000702c75178,0x000000070d480000) PSPermGen total 21504K, used 2569K [0x00000006fda00000, 0x00000006fef00000, 0x0000000702c00000) object space 21504K, 11% used [0x00000006fda00000,0x00000006fdc82700,0x00000006fef00000)
从运行结果可以看到,并没有因为两个对象相互引用就不对它们进行回收。
- 2. 可达性分析算法
基本思想是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象多GC Roots没有任何引用链相连时,则证明此对象是不可用的。
Java语言中,可作为GC Roots 的对象包括:
-
虚拟机栈(栈帧中的本地变量表)中的引用对象
-
方法区中的类静态属性引用的对象
-
方法区中的常量引用的对象
-
本地方法栈中JNI的引用对象。
即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那么它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为没有必要执行。
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个虚拟机自动建立的,低优先级的Finalizer线程去执行它。这里所谓的执行是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(极端情况),将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联,那么在第二次标记时它将被移出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。
public class FinalizeEscapeGC { public static FinalizeEscapeGC SAVE_HOOK = null; public void isAlive(){ System.out.println("yes, i am alive."); } protected void finalize() throws Throwable { super.finalize(); System.out.println("finalize executed."); FinalizeEscapeGC.SAVE_HOOK = this; } public static void main(String[] args) throws InterruptedException { SAVE_HOOK = new FinalizeEscapeGC(); SAVE_HOOK = null; System.gc(); //第一次GC可以执行finalize()方法拯救自己 Thread.sleep(500); //执行finalize()方法的线程优先级很低,所以等待0.5秒 if(SAVE_HOOK != null){ SAVE_HOOK.isAlive(); }else{ System.out.println("no, i am dead."); } SAVE_HOOK = null; System.gc(); //第二次GC不会再执行finalize()方法了,拯救失败 Thread.sleep(500); if(SAVE_HOOK != null){ SAVE_HOOK.isAlive(); }else{ System.out.println("no, i am dead."); } }}
finalize executed.yes, i am alive.no, i am dead.
两次结果不一样,是因为任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法将不再被执行。
特别说明的是,finalize()方法只是Java刚刚诞生时为了使C/C++程序员更容易接受它所做的一个妥协,它的运行代价高昂,不确定性打,无法保证各个对象的调用顺序。另外finalize()能做的所有工作,使用try-finally或者其他方式都可以做得更好、更及时,所以基本可以忘掉这个方法的存在。
Java引用
无论是引用计数还是可达性算法判断对象是否存活,都是通过引用来判定的。在JDK 1.2以前,Java中引用定义:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。但是它无法描述这样一类对象:当内存空间足够时,则能保留在内存中;如果内存空间在进行垃圾收集后还是非常紧张,则抛弃这些对象。很多系统的缓存功能都符合这样的应用场景。所有在JDK 1.2之后,对Java引用的概率进行了扩充,分为强引用、软引用、弱引用、虚引用。
- 强引用:代码中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还在,垃圾收集器永远不会回收被引用的对象。
- 软引用:描述一些还有用,但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出时,将会把这些对象列进回收范围之中进行第二次回收,如果仍然没有足够内存,则抛出溢出异常。在JDK 1.2之后,提供了SoftReference类来实现软引用。
- 弱引用:也是用来描述非必须的对象,它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉这些对象。 在JDK 1.2之后,提供了WeakReference类来实现弱引用。
- 虚引用:最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对它的生存时间构成影响,也无法通过虚引用来取得一个对象实例。它唯一的目的就是能在这个对象被收集器回收时收到一个系统通知。在JDK 1.2之后,提供了PhantomReference类来实现虚引用。
方法区回收
永久代的垃圾收集主要回收两部分内容:废弃常量、无用的类。
回收废弃常量与回收Java堆中的对象类似。以常量池中字面量的回收为例,假如一个字符串“abc”已经进入了常量池,但是当前系统没有任何一个String对象叫做“abc”的,换句话说,就是没有任何String对象引用常量池中的“abc”常量,也没有其他地方引用这个字面量。当发生内存回收,如果有必要的话,这个“abc”常量就会被系统清理出常量池。常量池中的其他类(接口)、方法、字段的符号引用也与此类似。
回收类的条件相对苛刻,判定一个无用的类需要3个条件:
- 改类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例;
- 加载改类的ClassLoader已经被回收;
- 该类对应的java.lang.Class对象没有在任何地方呗引用,无法在任何地方通过反射访问该类的方法;
即使满足上面3个条件,也仅仅是可以回收,不是和对象一样,不使用了就必然回收。是否对类进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制,还可以使用-verbose:class以及-XX:+TraceClassLoading、-XX:TraceClassUnLoading查看类加载和卸载信息, 其中-verbose:class和-XX:+TraceClassLoading可以在product版的虚拟机中使用,-XX:TraceClassUnLoading参数需要FastDebug版的虚拟机支持。
在大量使用反射、动态代理、CGLib等ByteCode框架、动态生成JSP以及OSGi这类频繁自定义ClassLoader的场景都需要虚拟机具备类卸载功能,以保证永久代不会溢出。
#笔记内容参考《深入理解java虚拟机》