2019年08月19日(星期一)  农历:己亥年七月十九

作者:三年。分类: JAVA

 其实对于我们一般理解的计算机内存,它算是CPU与计算机打交道最频繁的区域,所有数据都是先经过硬盘至内存,然后由CPU再从内存中获取数据进 行处理,又将数据保存到内存,通过分页或分片技术将内存中的数据再flush至硬盘。那JVM的内存结构到底是如何呢?JVM做为一个运行在操作系统上, 但又独立于os运行的平台,它的内存至少应该包括象寄存器、堆栈等区域。

   JVM在运行时将数据划分为了6个区域来储存,而不仅仅是大家熟知的Heap区域,这6个区域图示如下:

 

 JVM内存的分配结构示意图

   下面将逐一介绍下各个区域所做的工作及其充当的功能。

   PC Register(PC寄存器)

   PC寄存器是一块很小的内存区域,主要作用是记录当前线程所执行的字节码的行号。字节码解释器工作时就是通过改变当前线程的程序计数器选取下 一条字节码指令来工作的。任何分支,循环,方法调用,判断,异常处理,线程等待以及恢复线程,递归等等都是通过这个计数器来完成的。

   由于java多 线程是通过交替线程轮流切换并分配处理器时间的方式来实现的,在任何一个确定的时间里,在处理器的一个内核只会执行一条线程中的指令。因此为了线程等待结 束需要恢复到正确的位置执行,每条线程都会有一个独立的程序计数器来记录当前指令的行号。计数器之间相互独立互不影响,我们称这块内存为“线程私有”的内 存。

   如果所调用的方法为native的,则PC寄存器中不储存任何信息。

   l  JVM栈

   JVM栈是线程私有的,每个线程创建的同时都会创建JVM栈,JVM栈中存放的为当前线程中局部基本类型的变量(java中定义的八种基本类 型:boolean、char、byte、short、int、long、float、double)、部分的返回结果以及Stack Frame,非基本类型的对象在JVM栈上仅存放一个指向堆上的地址,因此Java中基本类型的变量是值传递,而非基本类型的变量是引用传递,Sun           JDK的实现中JVM栈的空间是在物理内存上分配的,而不是从堆上分配。


 由于JVM栈是线程私有的,因此其在内存分配上非常高效,并且当线程运行完毕后,这些内存也就被自动回收。

   当JVM栈的空间不足时,会抛出StackOverflowError的错误,在Sun JDK中可以通过-Xss来指定栈的大小,例如如下代码:

   new Thread(new Runnable(){                public void run() {                   loop(0);                }                       private void loop (int i){                   if(i!=1000){                       i++;     loop (i);                   }                   else                      return                  }                }               }).start(); 

   当JVM参数设置为-Xss1K,运行后会报出类似下面的错误:

   Exception in thread "Thread-0"java.lang.StackOverflowError

   l  堆(Heap)

   Heap是大家最为熟悉的区域,它是JVM用来存储对象实例以及数组值的区域,可以认为Java中所有通过new创建的对象的内存都在此分配,Heap中的对象的内存需要等待GC进行回收,Heap在32位的操作系统上最大为2G,在64位的操作系统上则没有限制,其大小通过-Xms和-Xmx来控制,-Xms为JVM启动时申请的最小Heap内存,默认为物理内存的1/64但小于1G,-Xmx为JVM可申请的最大Heap内存,默认为物理内存的1/4,默认当空余堆内存小于40%时,JVM会增大Heap的大小到-Xmx指定的大小,可通过-XX:MinHeapFreeRatio=来指定这个比例,当空余堆内存大于70%时,JVM会将Heap的大小往-Xms指定的大小调整,可通过-XX:MaxHeapFreeRatio=来指定这个比例,但对于运行系统而言,为了避免频繁的Heap Size的大小,通常都会将-Xms和-Xmx的值设成一样,因此这两个用于调整比例的参数通常是没用的。其实jvm中对于堆内存的分配、使用、管理、收集等有更为精巧的设计,具体可以在JVM堆内存分析中进行详细介绍。

   当堆中需要使用的内存超过其允许的大小时,会抛出OutOfMemory的错误信息。

   l  方法区域(MethodArea)

   方法区域存放了所加载的类的信息(名称、修饰符等)、类中的静态变量、类中定义为final类型的常量、类中的Field信息、类中的方法信息,当开发人员在程序中通过Class对象中的getName、isInterface等方法来获取信息时,这些数据都来源于方法区域,可见方法区域的重要性。同样,方法区域也是全局共享的,它在虚拟机启动时在一定的条件下它也会被GC,当方法区域需要使用的内存超过其允许的大小时,会抛出OutOfMemory的错误信息。

   在Sun JDK中这块区域对应的为PermanetGeneration,又称为持久代,默认为64M,可通过-XX:PermSize以及-XX:MaxPermSize来指定其大小。

   l  运行时常量池(RuntimeConstant Pool)

   类似C中的符号表,存放的为类中的固定的常量信息、方法和Field的引用信息等,其空间从方法区域中分配。类或接口的常量池在该类的class文件被java虚拟机成功装载时分配。

   l  本地方法堆栈(NativeMethod Stacks)

   JVM采用本地方法堆栈来支持native方法的执行,此区域用于存储每个native方法调用的状态。

   例如有这么一段代码:

   public class A {                        public static void main(String[]args){                String a="a"              String b="b"               String ab="ab"               System.out.println((a+b)==ab);       // false                System.out.println(("a"+"b")==ab);   // true                final String afinal="a"               String result=afinal+"b"               System.out.println(result==ab);      // true                String plus=a+"b"               System.out.println(plus==ab);        // false                  System.out.println(plus.intern()==ab);  // true         }     

   

   分析下上面代码执行的结果,可通过javap –verbose A来辅助理解分析。

   l  (a+b)==ab

   a+b是两个变量相加,需要到运行时才能确定其值,到运行时后JVM会为两者相加后产生一个新的对象,因此a+b==ab的结果为false。

   l  (“a”+”b”)==ab

   “a”+”b”是常量,在编译时JVM已经将其变为”ab”字符串了,而ab=”ab”也是常量,这两者在常量池即为同一地址,因此(“a”+”b”)==ab为true。

   l  result==ab

   result=afinal+”b”,afinal是个final的变量, result在编译时也已经被转变为了”ab”,和”ab”在常量池中同样为同一地址,因此result==ab为true。

   l  plus=ab

   plus和a+b的情况是相同的,因此plus==ab为false。

   l  plus.intern()==ab

   这里的不同点在于调用了plus.intern()方法,这个方法的作用是获取plus指向的常量池地址,因此plus.intern()==ab为true。

   在掌握了JVM对象内存分配的机制后,接下来看看JVM是如何做到自动的对象内存回收的,这里指的的是Heap以及Method Area的回收,其他几个区域的回收都由JVM简单的按生命周期来进行管理


温馨提示如有转载或引用以上内容之必要,敬请将本文链接作为出处标注,谢谢合作!

已有 0/1610 人参与

发表评论:



手Q扫描加入Java初学者群