JVM-(二)运行时数据区-线程共享

本文最后更新于:May 13, 2023 pm

积土成山,风雨兴焉;积水成渊,蛟龙生焉;积善成德,而神明自得,圣心备焉。故不积跬步,无以至千里,不积小流无以成江海。齐骥一跃,不能十步,驽马十驾,功不在舍。面对悬崖峭壁,一百年也看不出一条裂缝来,但用斧凿,能进一寸进一寸,能进一尺进一尺,不断积累,飞跃必来,突破随之。

目录

线程私有的:

  • 程序计数器
  • 虚拟机栈
  • 本地方法栈

线程共享的:

  • 方法区

程序计数器

程序计数器是唯一一个不会出现 OutOfMemoryError 的内存区域。

两个常见问题

程序计数器的作用。

  • 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪儿了。
  • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。

程序计数器为什么被设为线程私有?

多线程在一个特定的时间段内只会执行其中某一个线程的方法,CPU会不停地做任务切换,这样必然导致经常中断或恢复。为了能够准确地记录各个线程正在执行的当前字节码指令地址,最好的办法就是为每一个线程都分配一个程序计数器。如果共用一个,那么就不能记录之前的线程执行到的位置。

虚拟机栈

Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的。那么在这两种情况下,分别会出现异常。

固定大小

  • 当Java虚拟机栈的大小固定,那么每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,则Java虚拟机将会抛出一个StackOverflowError异常。

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
package com.tothefor;

import sun.misc.Launcher;

import java.net.URL;
import java.util.Properties;

/**
* @Author DragonOne
* @Date 2022/6/4 16:13
* @墨水记忆 www.tothefor.com
*/
public class study_01 {

public static void main(String[] args) {
main(args);
}
}

动态大小

  • 如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,则Java虚拟机将会抛出一个OutOfMemoryError异常。

设置栈内存大小

可以通过参数 -Xss 选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。

设置步骤:

  • 在 Run -> Edit Configurations… 中的VM options 中填写 -Xss256k,后面的大小自定义,单位可以为k(kb)、m(mb)、g(gb)。

注意:在Mac下可能有点不一样,按如下图操作:

然后就可以进行填写,如图:

测试代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
package com.tothefor;

import sun.misc.Launcher;

import java.net.URL;
import java.util.Properties;

/**
* @Author DragonOne
* @Date 2022/6/4 16:13
* @墨水记忆 www.tothefor.com
*/
public class study_01 {
private static int age = 1;
public static void main(String[] args) {
System.out.println(age);
age++;
main(args);
}
}

在设置前和设置后分别进行一遍,可以看输出的最后数字大小的区别。

栈的存储单位

每一个线程都有自己的栈,栈中的数据都是以栈帧的格式存储。在线程上正在执行的每一个方法都各自对应一个栈帧。如图:

栈帧的内部结构

每个栈帧中存储着:局部变量表、操作数栈、动态链接、方法返回地址、其他附加信息。见上图。

局部变量表

也被称为局部变量数组或本地变量表。

  • 定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量,这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddress类型。

  • 在局部变量表中,32位以内的类型只占用一个slot(变量槽)(包括returnAddress类型),64位的类型(long和double)占用两个slot。byte、short、char 、float在存储前被转换为int,boolean 也被转换为int,0 表示false,非0表示true。

  • 由于局部变量表是建立在线程的栈上的,是线程私有的数据,所以不存在数据安全问题,因为没有共享。

  • 局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables 数据项中(通过Idea插件Jclasslib查看字节码文件)。在方法运行期间是不会改变局部变量表的大小的。

操作数栈

通过数组实现的。但是并非采用访问索引的方式来进行数据访问的,而是只能通过标准的入栈(push)和出栈(pop)操作来完成一次数据访问。

  • 操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。
  • 操作数栈是JVM执行引擎的一个工作区,当一个方法刚开始执行的时候,一个新的栈帧会随之被创建出来,这个方法的操作数栈是空的。
  • 每个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为max_stack的值。
  • 栈中的任何一个元素,如果是32bit的类型占用一个栈单位深度;64bit的类型占用两个单位深度。
  • 如果被调用的方法带有返回值,则其返回值将会被压入当前栈帧的操作数栈中,并更新程序计数器中下一条需要执行的字节码指令。
  • 操作数栈中元素的数据类型必须与字节码指令的序列严格匹配(int需要一个栈单位深度;long就需要两个栈单位深度)。这由编译器在编译器期间进行验证,同时在类加载过程中的类检验阶段的数据流分析阶段要再次验证。
  • Java虚拟机的解释引擎是基于栈的执行引擎,这里的栈即为操作数栈。

动态链接

又称为指向运行时常量池的方法引用。

动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。

每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用保存在class文件的常量池中。

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package com.tothefor;

/**
* @Author DragonOne
* @Date 2022/6/5 21:12
* @墨水记忆 www.tothefor.com
*/
public class TestLink {
int j=13;
double s=23;
public void testAdd(){
j++;
}
}

反编译:javap -v TestLink.class

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
Classfile /Users/dragonone/IdeaProjects/MybatisStudy/Study01_day/target/classes/com/tothefor/TestLink.class
Last modified 202265日; size 438 bytes
SHA-256 checksum 1982d60b61063efd43f92d26913159c2683d88cc0c4abd8b61c8fddaf965f0f4
Compiled from "TestLink.java"
public class com.tothefor.TestLink
minor version: 0
major version: 52
flags: (0x0021) ACC_PUBLIC, ACC_SUPER
this_class: #6 // com/tothefor/TestLink
super_class: #7 // java/lang/Object
interfaces: 0, fields: 2, methods: 2, attributes: 1
//=================== 常量池 ==============================
Constant pool:
#1 = Methodref #7.#22 // java/lang/Object."<init>":()V
#2 = Fieldref #6.#23 // com/tothefor/TestLink.j:I
#3 = Double 23.0d
#5 = Fieldref #6.#24 // com/tothefor/TestLink.s:D
#6 = Class #25 // com/tothefor/TestLink
#7 = Class #26 // java/lang/Object
#8 = Utf8 j
#9 = Utf8 I
#10 = Utf8 s
#11 = Utf8 D
#12 = Utf8 <init>
#13 = Utf8 ()V
#14 = Utf8 Code
#15 = Utf8 LineNumberTable
#16 = Utf8 LocalVariableTable
#17 = Utf8 this
#18 = Utf8 Lcom/tothefor/TestLink;
#19 = Utf8 testAdd
#20 = Utf8 SourceFile
#21 = Utf8 TestLink.java
#22 = NameAndType #12:#13 // "<init>":()V
#23 = NameAndType #8:#9 // j:I
#24 = NameAndType #10:#11 // s:D
#25 = Utf8 com/tothefor/TestLink
#26 = Utf8 java/lang/Object
{
int j;
descriptor: I
flags: (0x0000)

double s;
descriptor: D
flags: (0x0000)

public com.tothefor.TestLink();
descriptor: ()V
flags: (0x0001) ACC_PUBLIC
Code:
stack=3, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: bipush 13
7: putfield #2 // Field j:I
10: aload_0
11: ldc2_w #3 // double 23.0d
14: putfield #5 // Field s:D
17: return
LineNumberTable:
line 8: 0
line 9: 4
line 10: 10
LocalVariableTable:
Start Length Slot Name Signature
0 18 0 this Lcom/tothefor/TestLink;

public void testAdd(); //================方法testAdd()
descriptor: ()V
flags: (0x0001) ACC_PUBLIC
Code:
stack=3, locals=1, args_size=1
0: aload_0
1: dup
2: getfield #2 // Field j:I
5: iconst_1
6: iadd
7: putfield #2 // Field j:I
10: return
LineNumberTable:
line 12: 0
line 13: 10
LocalVariableTable:
Start Length Slot Name Signature
0 11 0 this Lcom/tothefor/TestLink;
}
SourceFile: "TestLink.java"

个人理解:其中的#数字就是符号引用,在常量池中。至于为什么会有符号引用,主要是因为如果有多个重复的则只需要一个就可以表示。

如:上面字节码文件的常量池中 #13 表示 ()V(void的无参返回值),如果有多个方法都是void的无参方法,那么只需要用符号引用#13表示即可,而不是每一个都是用原本的方式表示。

最后动态链接的作用就是将这些符号引用(#13)转换为直接引用(()V)。感觉有点类似于还原为原来的表示形式。

方法返回地址

方法正常退出时,调用者的程序计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。

若异常退出,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。

方法的调用

在JVM中,将符号引用转换为调用方法的直接引用与方法的绑定机制相关。

静态链接

当一个字节码文件被加载进JVM内部时,如果被调用的目标方法在编译期可知,且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。

动态链接

如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用方法的符号引用转换为直接引用,由于这种引用转换过程具备动态性,因此也就被称为动态链接。

绑定机制

对应的方法的绑定机制为:早期绑定和晚期绑定。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,仅仅发生一次。

早期绑定

指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。

晚期绑定

如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。

虚方法与非虚方法

非虚方法

  • 如果方法在编译期就确定了具体的调用版本,这个版本在运行时是不可变的。这样的方法称为非虚方法。
  • 静态方法、私有方法、final方法、实例构造器(this)、父类方法(super)都是非虚方法。
  • 其他方法称为虚方法。

个人简单理解:已经确定的就是非虚方法,没有确定的(在运行时才能确定)为虚方法。

本地方法栈

和虚拟机栈所发挥的作用非常相似,区别是: 虚拟机栈为虚拟机执行 Java 方法 (也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。

异常和回收的出现

Error GC
程序计数器 不会 不会
虚拟机栈 不会
本地方法栈 不会
方法区

本文作者: 墨水记忆
本文链接: https://tothefor.com/DragonOne/f7ecf2c5.html
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!