常量池
方法区存着类的信息,常量和静态变量,即类被编译后的数据。这个说法其实是没问题的,只是太笼统了。更加详细一点的说法是方法区里存放着类的版本,字段,方法,接口和常量池。常量池里存储着字面量和符号引用,该常量池其实是静态常量池,也就是class常量池,不是运行时常量池。
静态常量池存储的是当class文件被java虚拟机加载进来后存放在方法区的一些字面量和符号引用,如下:
字面量, 符号引用与直接引用 的辨析 参考 这篇文章
动态常量池是当class文件被加载完成后,java虚拟机会将静态常量池里的内容转移到动态常量池里,在静态常量池的符号引用有一部分是会被转变为直接引用的,比如说类的静态方法或私有方法,实例构造方法,父类方法,这是因为这些方法不能被重写其他版本,所以能在加载的时候就可以将符号引用转变为直接引用,而其他的一些方法是在这个方法被第一次调用的时候才会将符号引用转变为直接引用的。
总结:
方法区里存储着class文件的信息和动态常量池,class文件的信息包括类信息和静态常量池。可以将类的信息是对class文件内容的一个框架,里面具体的内容通过常量池来存储。
动态常量池里的内容除了是静态常量池里的内容外,还将静态常量池里的符号引用转变为直接引用,而且动态常量池里的内容是能动态添加的。例如调用String的intern方法就能将string的值添加到String常量池中,这里String常量池是包含在动态常量池里的,但在jdk1.8后,将String常量池放到了堆中
动态链接
每一个栈帧内部都包含一个指向运行时常量池中该帧所属方法的引用。包含这个引用的目的是为了支持当前方法的代码能实现动态链接(Dynamic Linking)。
在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference)保存在class文件的常量池里。比如:描述一个方法调用另外一个方法时,是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用的直接引用
示例
如下代码,我们创建一个类DynamicLinkingTest。声明一个int型的变量num,methodA( )和methodB( ) ,methodB( )中调用了methodA( )然后执行num++操作
public class DynamicLinkingTest {
int num=10;
public void methodA(){
System.out.println("methodA....");
}
public void methodB(){
System.out.println("methodB....");
methodA();
num++;
}
}
然后我们通过javac 编译DynamicLinkingTest.java生成DynamicLinkingTest.class。在然后通过javap -verbose 将DynamicLinkingTest.class反编译得到如下:
Last modified 2021-4-26; size 582 bytes
MD5 checksum a16ed43381b08c46ce7d9518e43519bc
Compiled from "DynamicLinkingTest.java"
public class com.booyue.tlh.DynamicLinkingTest
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #9.#20 // java/lang/Object."<init>":()V
#2 = Fieldref #8.#21 // com/booyue/tlh/DynamicLinkingTest.num:I
#3 = Fieldref #22.#23 // java/lang/System.out:Ljava/io/PrintStream;
#4 = String #24 // methodA....
#5 = Methodref #25.#26 // java/io/PrintStream.println:(Ljava/lang/String;)V
#6 = String #27 // methodB....
#7 = Methodref #8.#28 // com/booyue/tlh/DynamicLinkingTest.methodA:()V
#8 = Class #29 // com/booyue/tlh/DynamicLinkingTest
#9 = Class #30 // java/lang/Object
#10 = Utf8 num
#11 = Utf8 I
#12 = Utf8 <init>
#13 = Utf8 ()V
#14 = Utf8 Code
#15 = Utf8 LineNumberTable
#16 = Utf8 methodA
#17 = Utf8 methodB
#18 = Utf8 SourceFile
#19 = Utf8 DynamicLinkingTest.java
#20 = NameAndType #12:#13 // "<init>":()V
#21 = NameAndType #10:#11 // num:I
#22 = Class #31 // java/lang/System
#23 = NameAndType #32:#33 // out:Ljava/io/PrintStream;
#24 = Utf8 methodA....
#25 = Class #34 // java/io/PrintStream
#26 = NameAndType #35:#36 // println:(Ljava/lang/String;)V
#27 = Utf8 methodB....
#28 = NameAndType #16:#13 // methodA:()V
#29 = Utf8 com/booyue/tlh/DynamicLinkingTest
#30 = Utf8 java/lang/Object
#31 = Utf8 java/lang/System
#32 = Utf8 out
#33 = Utf8 Ljava/io/PrintStream;
#34 = Utf8 java/io/PrintStream
#35 = Utf8 println
#36 = Utf8 (Ljava/lang/String;)V
{
int num;
descriptor: I
flags:
public com.booyue.tlh.DynamicLinkingTest();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=2, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: bipush 10
7: putfield #2 // Field num:I
10: return
LineNumberTable:
line 3: 0
line 5: 4
public void methodA();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=2, locals=1, args_size=1
0: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #4 // String methodA....
5: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 8: 0
line 9: 8
public void methodB();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=3, locals=1, args_size=1
0: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #6 // String methodB....
5: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: aload_0
9: invokevirtual #7 // Method methodA:()V
12: aload_0
13: dup
14: getfield #2 // Field num:I
17: iconst_1
18: iadd
19: putfield #2 // Field num:I
22: return
LineNumberTable:
line 12: 0
line 13: 8
line 14: 12
line 15: 22
}
从上往下看我们找到到Constant pool和methodB( )方法,然后在methodB( )中找到 9: invokevirtual #7。
invokevirtual后面是#7,我们从 Constant pool(常量池)中找到#7,发现#7对应的是 #8.#28 ,我们在找到#8,然后#8对应的是#29,在找到#29,发现#29对应的是: com/booyue/tlh/DynamicLinkingTest。然后在找#28,发现#28对应的是#16:#13,我们在找到#16和#13,#16对应的是methodA,#13是( )V,这里#16和#13说明了methodA方法是一个没有返回值的方法。然后把我们刚刚从#8.#28串联起来就得到:com/booyue/tlh/DynamicLinkingTest类中的没有返回值的methodA方法了。从而在方法表里中找到方法的入口地址。
另外我们在methodB( )中还调用了num变量,按照上面的方法,你就能找出num是一个int类型的变量。
图例
方法的绑定机制
在JVM中,将符号引用转换为调用方法的直接引用与方法的绑定机制相关
- 静态链接
当一个 字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知,且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。 - 静动态链接
如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用方法的符号引用转换为直接引用,由于这种引用转换过程具备动态性,因此也就被称之为动态链接。
对应的方法的绑定机制为:早起绑定(Early Binding)和晚期绑定(Late Bingding)。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。
- 静早期绑定
早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。 - 静晚期绑定
如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。
方法的调用
随着高级语言的横空出世,类似于java一样的基于面向对象的编程语言如今越来越多,尽管这类编程语言在语法风格上存在一定的差别,但是它们彼此之间始终保持着一个共性,那就是都支持封装,集成和多态等面向对象特性,既然这一类的编程语言具备多态特性,那么自然也就具备早期绑定和晚期绑定两种绑定方式。
Java中任何一个普通的方法其实都具备虚函数的特征,它们相当于C++语言中的虚函数(C++中则需要使用关键字virtual来显式定义)。如果在Java程序中不希望某个方法拥有虚函数的特征时,则可以使用关键字final来标记这个方法。
用final修饰的方法在编译器就确定了,不能被重写
虚方法与非虚方法
非虚方法
- 如果方法在编译器就确定了具体的调用版本,这个版本在运行时是不可变的。这样的方法称为非虚方法
- 静态方法、私有方法、final方法、实例构造器(实例已经确定,this()表示本类的构造器)、父类方法(super调用)都是非虚方法
其他所有体现多态特性的方法称为虚方法
虚拟机中提供了一下几条方法调用指令
普通调用指令:
- invokestatic:调用静态方法,解析阶段确定唯一方法版本;
- invokespecial:调用<init>方法、私有及父类方法,解析阶段确定唯一方法版本;
- invokevirtual调用所有虚方法;
- invokeinterface:调用接口方法;
- 动态调用指令(Java7新增):
invokedynamic:动态解析出需要调用的方法,然后执行 .
前四条指令固化在虚拟机内部,方法的调用执行不可人为干预,而invokedynamic指令则支持由用户确定方法版本。
其中invokestatic指令和invokespecial指令调用的方法称为非虚方法
其中invokevirtual(final修饰的除外,JVM会把final方法调用也归为invokevirtual指令,但要注意final方法调用不是虚方法)、invokeinterface指令调用的方法称称为虚方法。
/**
* 解析调用中非虚方法、虚方法的测试
*/
class Father {
public Father(){
System.out.println("Father默认构造器");
}
public static void showStatic(String s){
System.out.println("Father show static"+s);
}
public final void showFinal(){
System.out.println("Father show final");
}
public void showCommon(){
System.out.println("Father show common");
}
}
子类方法如下:
public class Son extends Father{
public Son(){
super();
}
public Son(int age){
this();
}
public static void main(String[] args) {
Son son = new Son();
son.show();
}
//不是重写的父类方法,因为静态方法不能被重写
public static void showStatic(String s){
System.out.println("Son show static"+s);
}
private void showPrivate(String s){
System.out.println("Son show private"+s);
}
public void show(){
//invokestatic
showStatic(" 大头儿子");
//invokestatic
super.showStatic(" 大头儿子");
//invokespecial
showPrivate(" hello!");
//invokespecial
super.showCommon();
//invokevirtual 因为此方法声明有final 不能被子类重写,所以也认为该方法是非虚方法
showFinal();
//虚方法如下
//invokevirtual
showCommon();//没有显式加super,被认为是虚方法,因为子类可能重写showCommon
info();
MethodInterface in = null;
//invokeinterface 不确定接口实现类是哪一个 需要重写
in.methodA();
}
public void info(){
}
}
子类中showStatic不是重写的父类的静态方法,因为静态方法不能被重写。
invokedynamic指令的使用
JVM字节码指令集一直比较稳定,一直到Java7中才增加了一个invokedynamic指令,这是Java为了实现【动态类型语言】而做的一种改进。
但是在Java7中并没有提供直接生成 invokedynamic指令的方法,需要借助ASM这种底层字节码工具来产生invokedynamic指令,直到Java8的Lambda表达式的出现,invokedynamic指令的生成在Java中才有了直接的生成方式。
Java7中增加的动态语言类型支持的本职是对Java虚拟机规范的修改,而不是对Java语言规则的修改,这一块相对来讲比较复杂,增加了虚拟机中的方法调用,最直接的受益者就是运行在Java平台动态语言的编译器。
动态类型语言和静态类型语言
- 动态类型语言和静态类型语言两者的却别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之则是动态类型语言。
- 直白来说 静态语言是判断变量自身的类型信息;动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息,这是动态语言的一个重要特征
- Java是静态类型语言(尽管lambda表达式为其增加了动态特性),js,python是动态类型语言。
方法的调用:方法重写的本质
- 找到操作数栈的第一个元素所执行的对象的实际类型,记作C。
- 如果在类型C中找到与常量池中的描述符、简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。
- 否则,按照继承关系从下往上依次对c的各个父类进行第二步的搜索和验证过程。
- 如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。 IllegalAccessError介绍 程序视图访问或修改一个属性或调用一个方法,这个属性或方法,你没有权限访问。一般的,这个会引起编译器异常。这个错误如果发生在运行时,就说明一个类发生了不兼容的改变。
方法的调用:虚方法表
在面向独此昂的编程中,会很频繁的使用动态分派,如果在每次动态分派的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率,因此,为了提高性能,JVM采用在类的方法区建立虚方法表(非虚方法不会出现在表中)来实现,使用索引表来代替查找。
每个类中都有一个虚方法表,表中存放着各个方法的实际入口。
那么虚方法表什么时候被创建?
虚方法表会在类加载的链接阶段被 创建并开始初始化,类的变量初始值准备完成之后,JVM会把该类的方法表也初始化完毕。
举例说明
我们定义三个类、一个Friendly接口
Friendly代码详情:
interface Friendly{
void sayHello();
void sayGoodbye();
}
CockerSpaniel(可卡犬)虚方法表:
cat虚方法表:
dog虚方法表:
方法返回地址(绿色的部分)
- 存放调用该方法的PC寄存器的值。
- 一个方法的结束,有两种方式:
1.正常执行完成
2.出现未处理的异常,非正常退出 - 无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者(方法的调用者可能也是一个方法)的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出时,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
- 本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值入调用者栈帧的操作数栈、设置PC寄存器值等,让调用者方法继续执行下去。
- 正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。
当一个方法开始执行后,只有两种方式可以退出这个方法
- 执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口;
- 一个方法在正常调用完成之后究竟需要使用哪一个返回指令还需要根据方法返回值的实际数据类型而定
- 在字节码指令中,返回指令包含ireturn(当返回值是boolena、byte、char、short和int类型时使用)、lreturn、freturn、dreturn以及areturn(引用类型的)
- 另外还有一个return指令供声明为void的方法、实例初始化方法、类和接口的初始化方法使用
2.在方法执行的过程中遇到了异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜素到匹配的异常处理器,就会导致方法退出,简称异常完成出口
方法执行过程中抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码。
我们写一个demo演示:
字节码当中的异常处理表:下表的行号不是上图的代码的行号,而是其对应字节码当中的行号
栈帧中的一些附加信息
栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如,对程序调试提供支持的信息。
这些信息不是必须的,是可选的。