Class文件结构
Class文件是一组以8位字节为基础单位的二进制字节流,各个数据项目按照严格顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,没有间隙存在。当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储。
存储格式:
Class文件采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表
无符号数:
- 无符号数属于基本数据类型,以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节、8个字节的无符号数。
- 无符号数用来描述数字、索引引用、数量值或者按照UTF-8编码构成的字符串值。
表:
- 表是由多个无符号数或者其它表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。整个Class文件本质上也是一张表
注意:
任何一个Class文件都对应着唯一一个类或接口的定义信息,但反过来说,类或接口并不一定都得定义在文件中(也可以通过类加载器直接生成)
下图是Class文件格式:
1、Magic与Class版本
Magic:
每个Class文件的头4个字节称为魔数(Magic Number),它的唯一作用就是确定这个Class文件能否被虚拟机识别。固定值为0xCAFEBABE。
Class版本:
紧接着魔数的4个字节存储Class文件的版本号。
第5、6个字节是次版本号(Minor Version)
第7、8个字节是主版本号(Major Version)
2、常量池
紧接着主次版本号之后是常量池入口,常量池可以理解为Class文件中的资源仓库。
特点:
- 它是Class文件结构中与其它项目关联最多的数据类型
- 占用Class文件空间最大的数据项目之一
- Class文件中第一个出现的表类型的数据项目
constant_pool_count: 常量池容量计数值
由于常量池中常量的数量是不固定的,所以在常量池的入口需要放置u2类型的数据,代表常量池容量计数值(constant_pool_count)。只有常量池中计数器的值从1开始,不是0
constant_pool: 常量池
常量池中主要存储两大类型常量:字面量(Literal)和符号引用(Symbolic References)
字面量:
字面量比较接近于Java语言层面的常量概念,如文本字符串、声明为final的常量值等。
符号引用:
符号引用属于编译原理方面的概念,包括了下面3类常量:
- 类和接口的全限定包名
- 字段的名称和描述符
- 方法名称和描述符
3、访问标志
access_flags:
在常量池结束之后,紧接着两个字节代表访问标志(access_flags),这个类用于识别一些类或者接口层次的访问信息,包括:这个Class是类还接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等。
4、类索引、父类索引与接口索引集合
this_class:类索引:确定这个类的全限定名
super_class:父类索引:确定这个类的父类的全限定名
interfaces_count:接口计数器:表示索引表容量
interfaces:接口索引集合
作用:
Class文件中通过这三项来确定这个类的集成关系
5、字段表集合
field_info:用于描述接口或类中声明的变量
包括了访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性集合表(attributes)几项
6、方法表集合
method_info:
方法表结构和字段表结构一样,依次包括了访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性集合表(attributes)几项。
7、属性表集合
attribute_info:calss文件、字段和方法拥有的属性表集合,其中code属性代表的是程序代码编译后的字节码形式指令,在code中this是默认参数